Skip to main content

Noun phrase extractor for the Ukrainian language

Project description

Python package to extract NP from the Ukrainian language

This is a simple package to extract noun phrases from a raw Ukrainian text. Use pip tool to install the package:

Installation

Use pip tool to install

pip install noun-phrase-ua

Caution: package has several dependencies. Package udpipe requires some extra utilities to compile some parts of code.

Usage

import noun_phrase_ua


nlp = noun_phrase_ua.NLP()
text = '"Послухати Зеленського, звичайно, цікаво з цієї точки зору. Тому я думаю, що дебати відбудуться. Але люди, в першу чергу будуть слухати Володимира Зеленського. Їх усіх, як я розумію, цікавить його особистість", - сказав Кучма, відповідаючи на питання журналістів.'
summary = nlp.extract_entities(text)

# summary["tokens"] contains list of tokens, summary["entities"] contains groups of indices
# than represent entities

See folder examples for more details. The description of the method that was used in the package can found in the work (link):

Погорілий С.Д., Крамов А.А. Метод виявлення іменних груп в україномовних текстах. Control Systems and Computers. 2019. № 5. С. 48-59.

Please cite this work if you use this package. Thank you! :)

=====================================================

Програмний пакет Python для екстракції іменних груп з україномовних текстів

Це простий пакет екстракції іменних груп з будь-яких україномовних текстів. Використовуйте інструмент pip для встановлення пакету.

Встановлення

Використовуйте pip для встановлення:

pip install noun-phrase-ua

Увага: пакет містить декілька залежностей. Пакет udpipe потребує використання декількох додаткових утиліт для компіляції певних частин коду.

Приклад використання

import noun_phrase_ua


nlp = noun_phrase_ua.NLP()
text = '"Послухати Зеленського, звичайно, цікаво з цієї точки зору. Тому я думаю, що дебати відбудуться. Але люди, в першу чергу будуть слухати Володимира Зеленського. Їх усіх, як я розумію, цікавить його особистість", - сказав Кучма, відповідаючи на питання журналістів.'
summary = nlp.extract_entities(text)

# summary["tokens"] contains list of tokens, summary["entities"] contains groups of indices
# than represent entities

Дивіться папку examples для подробиць використання. Опис методу, що використовується у пакеті, знаходиться в роботі (посилання):

Погорілий С.Д., Крамов А.А. Метод виявлення іменних груп в україномовних текстах. Control Systems and Computers. 2019. № 5. С. 48-59.

Будь ласка, цитуйте цю роботу, якщо використовуєте цей пакет. Дякуємо! :)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

noun-phrase-ua-0.0.5.tar.gz (16.6 MB view details)

Uploaded Source

Built Distribution

noun_phrase_ua-0.0.5-py3-none-any.whl (16.6 MB view details)

Uploaded Python 3

File details

Details for the file noun-phrase-ua-0.0.5.tar.gz.

File metadata

  • Download URL: noun-phrase-ua-0.0.5.tar.gz
  • Upload date:
  • Size: 16.6 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/46.1.3 requests-toolbelt/0.9.1 tqdm/4.45.0 CPython/3.6.5

File hashes

Hashes for noun-phrase-ua-0.0.5.tar.gz
Algorithm Hash digest
SHA256 d3cf2a3292e2062c75c1aa1f9f0402204826f9308596cd8d228f5a2557c6fb86
MD5 092f71d47410a4e580b6c70e9dbb4dca
BLAKE2b-256 798552dd125346412187253fc3f4efcb1c87627830aba2325ac53455646db3fb

See more details on using hashes here.

File details

Details for the file noun_phrase_ua-0.0.5-py3-none-any.whl.

File metadata

  • Download URL: noun_phrase_ua-0.0.5-py3-none-any.whl
  • Upload date:
  • Size: 16.6 MB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/46.1.3 requests-toolbelt/0.9.1 tqdm/4.45.0 CPython/3.6.5

File hashes

Hashes for noun_phrase_ua-0.0.5-py3-none-any.whl
Algorithm Hash digest
SHA256 2a02da133f9ee0eeebe70e369b63ba2c1a4f43fd51bcf9daedc3ea68f5f54fef
MD5 45d0f8034a6f04737d7c0f0d83b1ee7c
BLAKE2b-256 dac9384b0a1dfa1716a2a99966d5cc092b0b72fac4d59b27b99d4e103b0c1920

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page