Noun phrase extractor for the Ukrainian language
Project description
Python package to extract NP from the Ukrainian language
This is a simple package to extract noun phrases from a raw Ukrainian text. Use pip
tool to install the package:
Installation
Use pip
tool to install
pip install noun-phrase-ua
Caution: package has several dependencies. Package udpipe
requires some extra utilities to compile some parts of code.
Usage
import noun_phrase_ua
nlp = noun_phrase_ua.NLP()
text = '"Послухати Зеленського, звичайно, цікаво з цієї точки зору. Тому я думаю, що дебати відбудуться. Але люди, в першу чергу будуть слухати Володимира Зеленського. Їх усіх, як я розумію, цікавить його особистість", - сказав Кучма, відповідаючи на питання журналістів.'
summary = nlp.extract_entities(text)
# summary["tokens"] contains list of tokens, summary["entities"] contains groups of indices
# than represent entities
See folder examples
for more details. The description of the method that was used in the package can found in the work (link):
Погорілий С.Д., Крамов А.А. Метод виявлення іменних груп в україномовних текстах. Control Systems and Computers. 2019. № 5. С. 48-59.
Please cite this work if you use this package. Thank you! :)
=====================================================
Програмний пакет Python для екстракції іменних груп з україномовних текстів
Це простий пакет екстракції іменних груп з будь-яких україномовних текстів. Використовуйте інструмент pip
для встановлення пакету.
Встановлення
Використовуйте pip
для встановлення:
pip install noun-phrase-ua
Увага: пакет містить декілька залежностей. Пакет udpipe
потребує використання декількох додаткових утиліт для компіляції певних частин коду.
Приклад використання
import noun_phrase_ua
nlp = noun_phrase_ua.NLP()
text = '"Послухати Зеленського, звичайно, цікаво з цієї точки зору. Тому я думаю, що дебати відбудуться. Але люди, в першу чергу будуть слухати Володимира Зеленського. Їх усіх, як я розумію, цікавить його особистість", - сказав Кучма, відповідаючи на питання журналістів.'
summary = nlp.extract_entities(text)
# summary["tokens"] contains list of tokens, summary["entities"] contains groups of indices
# than represent entities
Дивіться папку examples
для подробиць використання. Опис методу, що використовується у пакеті, знаходиться в роботі (посилання):
Погорілий С.Д., Крамов А.А. Метод виявлення іменних груп в україномовних текстах. Control Systems and Computers. 2019. № 5. С. 48-59.
Будь ласка, цитуйте цю роботу, якщо використовуєте цей пакет. Дякуємо! :)
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file noun-phrase-ua-0.0.5.tar.gz
.
File metadata
- Download URL: noun-phrase-ua-0.0.5.tar.gz
- Upload date:
- Size: 16.6 MB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/46.1.3 requests-toolbelt/0.9.1 tqdm/4.45.0 CPython/3.6.5
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | d3cf2a3292e2062c75c1aa1f9f0402204826f9308596cd8d228f5a2557c6fb86 |
|
MD5 | 092f71d47410a4e580b6c70e9dbb4dca |
|
BLAKE2b-256 | 798552dd125346412187253fc3f4efcb1c87627830aba2325ac53455646db3fb |
File details
Details for the file noun_phrase_ua-0.0.5-py3-none-any.whl
.
File metadata
- Download URL: noun_phrase_ua-0.0.5-py3-none-any.whl
- Upload date:
- Size: 16.6 MB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/46.1.3 requests-toolbelt/0.9.1 tqdm/4.45.0 CPython/3.6.5
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 2a02da133f9ee0eeebe70e369b63ba2c1a4f43fd51bcf9daedc3ea68f5f54fef |
|
MD5 | 45d0f8034a6f04737d7c0f0d83b1ee7c |
|
BLAKE2b-256 | dac9384b0a1dfa1716a2a99966d5cc092b0b72fac4d59b27b99d4e103b0c1920 |