NER, syntax tree markup visualisations for Jupyter Notebook
Project description
Collection of NLP visualizations for NER and syntax tree markup. Similar to Spacy displaCy and displaCy ENT.
Install
ipymarkup
supports Python 3.5+.
$ pip install ipymarkup
Usage
For more examples and explanation see ipymarkup documentation.
>>> from ipymarkup import show_ner_ascii_markup, show_dep_ascii_markup
>>> text = 'В мероприятии примут участие не только российские учёные, но и зарубежные исследователи, в том числе, Крис Хелмбрехт - управляющий директор и совладелец креативного агентства Kollektiv (Германия, США), Ннека Угбома - руководитель проекта Mushroom works (Великобритания), Гергей Ковач - политик и лидер субкультурной партии «Dog with two tails» (Венгрия), Георг Жено - немецкий режиссёр, один из создателей экспериментального театра «Театр.doc», Театра им. Йозефа Бойса (Германия).'
>>> spans = [(102, 116, 'PER'), (186, 194, 'LOC'), (196, 199, 'LOC'), (202, 214, 'PER'), (254, 268, 'LOC'), (271, 283, 'PER'), (324, 342, 'ORG'), (345, 352, 'LOC'), (355, 365, 'PER'), (445, 455, 'ORG'), (456, 468, 'PER'), (470, 478, 'LOC')]
>>> show_ascii_markup(text, spans)
В мероприятии примут участие не только российские учёные, но и
зарубежные исследователи, в том числе, Крис Хелмбрехт - управляющий
PER───────────
директор и совладелец креативного агентства Kollektiv (Германия, США),
LOC───── LOC
Ннека Угбома - руководитель проекта Mushroom works (Великобритания),
PER───────── LOC───────────
Гергей Ковач - политик и лидер субкультурной партии «Dog with two
PER───────── ORG──────────
tails» (Венгрия), Георг Жено - немецкий режиссёр, один из создателей
───── LOC──── PER───────
экспериментального театра «Театр.doc», Театра им. Йозефа Бойса
ORG─────── PER─────────
(Германия).
LOC─────
>>> words = ['В', 'советский', 'период', 'времени', 'число', 'ИТ', '-', 'специалистов', 'в', 'Армении', 'составляло', 'около', 'десяти', 'тысяч', '.']
>>> deps = [(2, 0, 'case'), (2, 1, 'amod'), (10, 2, 'obl'), (2, 3, 'nmod'), (10, 4, 'obj'), (7, 5, 'compound'), (5, 6, 'punct'), (4, 7, 'nmod'), (9, 8, 'case'), (4, 9, 'nmod'), (13, 11, 'case'), (13, 12, 'nummod'), (10, 13, 'nsubj'), (10, 14, 'punct')]
>>> show_dep_ascii_markup(words, deps)
┌──► В case
│ ┌► советский amod
┌──────►└─└─ период obl
│ └──► времени nmod
│ ┌►┌─┌───── число obj
│ │ │ │ ┌►┌─ ИТ compound
│ │ │ │ │ └► - punct
│ │ │ └►└─── специалистов nmod
│ │ │ ┌► в case
│ │ └────►└─ Армении nmod
└─└─┌─┌───── составляло
│ │ ┌──► около case
│ │ │ ┌► десяти nummod
│ └►└─└─ тысяч nsubj
└──────► . punct
Support
- Chat — https://telegram.me/natural_language_processing
- Issues — https://github.com/natasha/ipymarkup/issues
Development
Tests:
make test
Package:
make version
git push
git push --tags
make clean package publish
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
ipymarkup-0.9.0.tar.gz
(12.8 kB
view details)
Built Distribution
ipymarkup-0.9.0-py3-none-any.whl
(14.5 kB
view details)
File details
Details for the file ipymarkup-0.9.0.tar.gz
.
File metadata
- Download URL: ipymarkup-0.9.0.tar.gz
- Upload date:
- Size: 12.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.22.0 setuptools/45.2.0 requests-toolbelt/0.9.1 tqdm/4.42.1 CPython/3.6.9
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 3f4bfa10fd66293201af8484a7e6bcb723bf2e33d9a6aa00882671af9ca26911 |
|
MD5 | 899d1c3d258f4d0f38f93dc7448ad188 |
|
BLAKE2b-256 | 190a3a2e52002094776fc0e2756e0e6c4014a51db9baf382b7a1ce8aeed588c6 |
File details
Details for the file ipymarkup-0.9.0-py3-none-any.whl
.
File metadata
- Download URL: ipymarkup-0.9.0-py3-none-any.whl
- Upload date:
- Size: 14.5 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.22.0 setuptools/45.2.0 requests-toolbelt/0.9.1 tqdm/4.42.1 CPython/3.6.9
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 6ef17080e7b2dd339634337e676c0a257c8ff6c8cb54884cff91011e5a15d3f6 |
|
MD5 | 768545735cc340e6d08bb561b1628f03 |
|
BLAKE2b-256 | bf9bbf54c98d50735a4a7c84c71e92c5361730c878ebfe903d2c2d196ef66055 |