NeXov Enables eXtensible Observation of Vertices
Project description
NeXov
"NeXov Enables eXtensible Observation of Vertices"
NeXovは、非常に高密度のマルコフ連鎖モデルの構築や生成、可視化、またそれをサポートするデータ処理をNetworkXで実現するツールです。
Install
OSごとに一部操作が異なります。
Windows
以下のサイトにあるインストーラーを実行します。
https://github.com/ikegami-yukino/mecab/releases/tag/v0.996.2 (MeCab)
https://graphviz.org/download/#windows (Graphviz)
Linux
以下のコマンドを実行します。
$ sudo apt update
$ sudo apt install -y mecab libmecab-dev mecab-ipadic-utf8 graphviz
$ sudo cp /etc/mecabrc /usr/local/etc/mecabrc
NEologd (推奨)
MeCabに固有名詞などを認識させるためのユーザー辞書です。これを使うだけでも精度はかなり上がるのでインストールをお勧めします。
Windows: https://qiita.com/xi_guisheng/items/40ee7da516de05e5894f
Linux: https://blog.forestberrypi.com/tools-services/linux/mecab-in-ubuntu/#toc7
NeXovのインストール (共通)
pipでNeXovをインストールできます。
$ pip install nexov
Usage
NeXovには以下のような機能があり、それぞれ対応するコマンドがあります。
| Command | Feature |
|---|---|
tokenize |
テキストのトークン化 |
generate |
モデルの構築・生成...etc |
visualize |
モデルの可視化 |
usage: nexov [-h] {tokenize,generate,visualize} ...
NeXov Enables eXtensible Observation of Vertices
positional arguments:
{tokenize,generate,visualize}
tokenize テキストをトークンに分割
generate モデルまたはテキストを生成
visualize モデルを画像として可視化
options:
-h, --help show this help message and exit
tokenize
tokenizeは、自動でテキストをトークン化するコマンドです。
オプション
usage: nexov tokenize [-h] -i INPUT [-o OUTPUT] [--method {mecab,char}]
options:
-h, --help show this help message and exit
-i INPUT, --input INPUT
入力ファイル
-o OUTPUT, --output OUTPUT
出力ファイル
--method {mecab,char}
分割方法
例
$ cat input.txt
ぐっもーにん!
もにもに!
もーにん!!
もにもに!!!!
おはですー!!
おはですー!
おはようです!!!!!!
$ nexov tokenize -i input.txt -o tokens.txt
[+] Wrote tokenized data to tokens.txt
$ cat tokens.txt
ぐっも ー に ん !
も に も に !
も ー に ん ! !
も に も に ! ! ! !
お は です ー ! !
お は です ー !
おはよう です ! ! ! ! ! !
generate
generateは、モデルの構築と生成、またインポート・エクスポートも行うコマンドです。
オプション
usage: nexov generate [-h] -i INPUT [-s START] [-l LENGTH] [-e EXPORT] [-v VISUALIZE]
options:
-h, --help show this help message and exit
-i INPUT, --input INPUT
モデルまたはトークン済みデータファイル
-s START, --start START
開始トークン
-l LENGTH, --length LENGTH
生成するトークン数
-e EXPORT, --export EXPORT
生成後のモデルをファイルにエクスポート
-v VISUALIZE, --visualize VISUALIZE
生成と同時に可視化を実行(拡張子を除く出力ファイル名を指定)
例
$ cat tokens.txt
ぐっも ー に ん !
も に も に !
も ー に ん ! !
も に も に ! ! ! !
お は です ー ! !
お は です ー !
おはよう です ! ! ! ! ! !
$ nexov generate -i tokens.txt -s も -l 100
もにもにもにもーにもにん!おはです!おはですー!!!!もに!もにん!!もにん!おはですー!!!おはですー!!もー!おはようです!!!おはようです!!おはですーにもにもー!もに!!!!もにもーにん!!!おは です!!おはようですー!もにん!!
$ nexov generate -i tokens.txt -e model.json
[+] The model was exported to model.json
$ nexov generate -i model.json -s も -l 100
もーにん!おはですーにもにん!!!!おはですー!!!もにん!もにもにもー!もにん!!!!!もにもにん!!もーにもにん!!!!おはようですー!おはです!!!!!!おはようですーに!おはですーに!!!!おはよ うですー!もにもにもにん!おは
visualize
visualizeは、モデルを画像で可視化するコマンドです。
オプション
usage: nexov visualize [-h] -i INPUT -o OUTPUT [--font FONT]
options:
-h, --help show this help message and exit
-i INPUT, --input INPUT
モデルファイル
-o OUTPUT, --output OUTPUT
出力ファイル(拡張子を除くファイル名を指定)
--font FONT 使用するフォント
例
$ nexov visualize -i model.json -o output
[+] The model visualization was saved to output.png
LICENSE
NeXovはMITライセンスで配布されています。
ただし、以下の外部ソフト・ライブラリを利用しています。これらはNeXovに含まれていませんが、別途インストールが必要です。
- MeCab (形態素解析器) : BSD License
- NEologd (日本語辞書) : Apache License 2.0
- Graphviz (グラフ描画ツール) : Eclipse Public License 1.0
- mecab-python3 (Pythonバインディング) : MIT License
- networkx : BSD License
- graphviz (Pythonラッパー) : MIT License
- matplotlib : Matplotlib License (BSDスタイル)
それぞれのライセンス条件に従ってご利用ください。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file nexov-1.1.tar.gz.
File metadata
- Download URL: nexov-1.1.tar.gz
- Upload date:
- Size: 7.1 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.10.5
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
071d809cd428f492766cceb2d047ad219f4ab31c5e675ab95400f47a55d9ec35
|
|
| MD5 |
9a58c0a9141348cd8301905f8a64a9d5
|
|
| BLAKE2b-256 |
ed76ff8283c341aa6a139bc92c9c98ad117f2c5f0446fde0afa6c3d68899092e
|
File details
Details for the file nexov-1.1-py3-none-any.whl.
File metadata
- Download URL: nexov-1.1-py3-none-any.whl
- Upload date:
- Size: 8.3 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.10.5
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
745ba206edb0c5c9c6f0ea4787845e2c524afc3f390d1fad7a713eb5ea6dd1bc
|
|
| MD5 |
b138d509269ab0580cacbeae62e68df5
|
|
| BLAKE2b-256 |
ac6e73459caf45eec7bde451dd557a0e7e0d6de6faa5f4b3e4a15e4680d51b95
|