Python wrapper for UTagger
Project description
pyutagger
UTagger python wrapper
1. 유태거 다운로드
import pyutagger.downloader as ud
# 필요에 따라 아래 두 가지 중 필요한 것을 다운로드한다.
# 기본적으로 윈도우에서는 c:\utagger에 다운로드를 시도한다.
# 다른 드라이브 또는 디렉토리에 설치하려면 추가 인자로 절대 경로를 추가하면 된다.
# 그러면 지정한 경로 밑에서 다운로드와 압축 해제가 진행된다.
ud.install_utagger('utagger3') # 유태거 3
ud.install_utagger('utagger4') # 유태거 4
ud.install_utagger('utagger4hj') # 유태거 4 훈민정음(옛한글 전용)
2. 유태거 사용
utagger.py에 있는test()에 기능 사용 예시를 넣었다.- 유태거 훈민정음을 사용하려면
utg4 = utagger_loader('utagger4')에서utagger4를utagger4hj로 바꾸면 된다.
def test():
utg4 = utagger_loader('utagger4')
if not utg4:
print('로드 실패')
print('failed to load')
sys.exit(1)
utg4.load()
print(utg4.tagger_name())
s = '대통령배생존대회에서 배가침몰하는중에도 배씨는배를먹으면서 배를채우고 배영하며 버티는데 나보다두배는더용감했다.'
print('원문: ', s)
tagged = utg4.analyse(s)
print('형태소 분석: ', tagged)
morphs = utg4.morphs(s)
print('형태소 각각 분리: ', morphs)
nouns = utg4.nouns(s)
print('명사만: ', nouns)
pos = utg4.pos(s)
print('형태소 품사 각각', pos)
utg4.release()
print('Ok.')
출력은 아래와 같다.
원문: 대통령배생존대회에서 배가침몰하는중에도 배씨는배를먹으면서 배를채우고 배영하며 버티는데 나보다두배는더용감했다.
형태소 분석: 대통령/NNG+배__05/NNG+생존/NNG+대회__02/NNG+에서/JKB 배__02/NNG+가/JKS+침몰하/VV+는/ETM+중__04/NNB+에/JKB+도/JX 배__10/NNP+씨__07/NNB+는/JX+배__01/NNG+를/JKO+먹__02/VV+으면서/EC 배__01/NNG+를/JKO+채우__03/VV+고/EC 배영하/NNP+ 며/EC 버티/VV+는데/EF 나__03/NP+보다/JKB+두__01/MMN+배__09/NNG+는/JX+더__01/MAG+용감하/VA+였/EP+다/EF+./SF
형태소 각각 분리: ['대통령', '배', '생존', '대회', '에서', '배', '가', '침몰하', '는', '중', '에', '도', '배', '씨', ' 는', '배', '를', '먹', '으면서', '배', '를', '채우', '고', '배영하', '며', '버티', '는데', '나', '보다', '두', '배', '는', '더', '용감하', '였', '다', '.']
명사만: ['대통령', '배', '생존', '대회', '배', '중', '배', '씨', '배', '배', '배영하', '배']
형태소 품사 각각 [('대통령', 'NNG'), ('배__05', 'NNG'), ('생존', 'NNG'), ('대회__02', 'NNG'), ('에서', 'JKB'), ('배__02', 'NNG'), ('가', 'JKS'), ('침몰하', 'VV'), ('는', 'ETM'), ('중__04', 'NNB'), ('에', 'JKB'), ('도', 'JX'), ('배__10', 'NNP'), ('씨__07', 'NNB'), ('는', 'JX'), ('배__01', 'NNG'), ('를', 'JKO'), ('먹__02', 'VV'), ('으면서', 'EC'), ('배__01', 'NNG'), ('를', 'JKO'), ('채우__03', 'VV'), ('고', 'EC'), ('배영하', 'NNP'), ('며', 'EC'), ('버티', 'VV'), ('는데', 'EF'), ('나__03', 'NP'), ('보다', 'JKB'), ('두__01', 'MMN'), ('배__09', 'NNG'), ('는', 'JX'), ('더__01', 'MAG'), ('용감하', 'VA'), ('였', 'EP'), ('다', 'EF'), ('.', 'SF')]
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
pyutagger-1.0.1.1029.tar.gz
(7.7 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file pyutagger-1.0.1.1029.tar.gz.
File metadata
- Download URL: pyutagger-1.0.1.1029.tar.gz
- Upload date:
- Size: 7.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.7.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
59bc0ea5764113e5b04af391ddbfcb28b357fb849531fd5e6dc0c19f1d1d4703
|
|
| MD5 |
d530c5319ef6553cab0761908d5e22c8
|
|
| BLAKE2b-256 |
c85d14895817e13a6ff65c42b0eaf0f6369a5be3d2b32c74ed95ed212086336b
|
File details
Details for the file pyutagger-1.0.1.1029-py3-none-any.whl.
File metadata
- Download URL: pyutagger-1.0.1.1029-py3-none-any.whl
- Upload date:
- Size: 10.4 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.7.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
bf4166d46cbcb3b3006493f834f1ff6893b8ced5850a4142fec673be07c6137b
|
|
| MD5 |
e531856c09286b2e1fa6778ab9936f09
|
|
| BLAKE2b-256 |
95e79cbdfb963e2d0bc97be365adcd35c34c4714c1a6484c01c1c594bbeb5039
|