Noun phrase extractor for the Ukrainian language
Project description
Python package to extract NP from the Ukrainian language
This is a simple package to extract noun phrases from a raw Ukrainian text. Use pip tool to install the package:
Installation
Use pip tool to install
pip install noun-phrase-ua
Caution: package has several dependencies. Package udpipe requires some extra utilities to compile some parts of code.
Usage
import noun_phrase_ua
nlp = noun_phrase_ua.NLP()
text = '"Послухати Зеленського, звичайно, цікаво з цієї точки зору. Тому я думаю, що дебати відбудуться. Але люди, в першу чергу будуть слухати Володимира Зеленського. Їх усіх, як я розумію, цікавить його особистість", - сказав Кучма, відповідаючи на питання журналістів.'
summary = nlp.extract_entities(text)
# summary["tokens"] contains list of tokens, summary["entities"] contains groups of indices
# than represent entities
See folder examples for more details. The description of the method that was used in the package can found in the work (link):
Погорілий С.Д., Крамов А.А. Метод виявлення іменних груп в україномовних текстах. Control Systems and Computers. 2019. № 5. С. 48-59.
Please cite this work if you use this package. Thank you! :)
=====================================================
Програмний пакет Python для екстракції іменних груп з україномовних текстів
Це простий пакет екстракції іменних груп з будь-яких україномовних текстів. Використовуйте інструмент pip для встановлення пакету.
Встановлення
Використовуйте pip для встановлення:
pip install noun-phrase-ua
Увага: пакет містить декілька залежностей. Пакет udpipe потребує використання декількох додаткових утиліт для компіляції певних частин коду.
Приклад використання
import noun_phrase_ua
nlp = noun_phrase_ua.NLP()
text = '"Послухати Зеленського, звичайно, цікаво з цієї точки зору. Тому я думаю, що дебати відбудуться. Але люди, в першу чергу будуть слухати Володимира Зеленського. Їх усіх, як я розумію, цікавить його особистість", - сказав Кучма, відповідаючи на питання журналістів.'
summary = nlp.extract_entities(text)
# summary["tokens"] contains list of tokens, summary["entities"] contains groups of indices
# than represent entities
Дивіться папку examples для подробиць використання. Опис методу, що використовується у пакеті, знаходиться в роботі (посилання):
Погорілий С.Д., Крамов А.А. Метод виявлення іменних груп в україномовних текстах. Control Systems and Computers. 2019. № 5. С. 48-59.
Будь ласка, цитуйте цю роботу, якщо використовуєте цей пакет. Дякуємо! :)
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file noun-phrase-ua-0.0.5.tar.gz.
File metadata
- Download URL: noun-phrase-ua-0.0.5.tar.gz
- Upload date:
- Size: 16.6 MB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/46.1.3 requests-toolbelt/0.9.1 tqdm/4.45.0 CPython/3.6.5
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
d3cf2a3292e2062c75c1aa1f9f0402204826f9308596cd8d228f5a2557c6fb86
|
|
| MD5 |
092f71d47410a4e580b6c70e9dbb4dca
|
|
| BLAKE2b-256 |
798552dd125346412187253fc3f4efcb1c87627830aba2325ac53455646db3fb
|
File details
Details for the file noun_phrase_ua-0.0.5-py3-none-any.whl.
File metadata
- Download URL: noun_phrase_ua-0.0.5-py3-none-any.whl
- Upload date:
- Size: 16.6 MB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/46.1.3 requests-toolbelt/0.9.1 tqdm/4.45.0 CPython/3.6.5
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
2a02da133f9ee0eeebe70e369b63ba2c1a4f43fd51bcf9daedc3ea68f5f54fef
|
|
| MD5 |
45d0f8034a6f04737d7c0f0d83b1ee7c
|
|
| BLAKE2b-256 |
dac9384b0a1dfa1716a2a99966d5cc092b0b72fac4d59b27b99d4e103b0c1920
|