Skip to main content

Python wrapper for UTagger

Project description

pyutagger

UTagger python wrapper

1. 유태거 다운로드

import pyutagger.downloader as ud
# 필요에 따라 아래 두 가지 중 필요한 것을 다운로드한다.
# 기본적으로 윈도우에서는 c:\utagger에 다운로드를 시도한다.
# 다른 드라이브 또는 디렉토리에 설치하려면 추가 인자로 절대 경로를 추가하면 된다.
# 그러면 지정한 경로 밑에서 다운로드와 압축 해제가 진행된다.
ud.install_utagger('utagger3')    # 유태거 3
ud.install_utagger('utagger4')    # 유태거 4
ud.install_utagger('utagger4hj')  # 유태거 4 훈민정음(옛한글 전용)

2. 유태거 사용

  • utagger.py에 있는 test()에 기능 사용 예시를 넣었다.
  • 유태거 훈민정음을 사용하려면 utg4 = utagger_loader('utagger4')에서 utagger4utagger4hj로 바꾸면 된다.
def test():
    utg4 = utagger_loader('utagger4')
    if not utg4:
        print('로드 실패')
        print('failed to load')
        sys.exit(1)

    utg4.load()
    print(utg4.tagger_name())
    s = '대통령배생존대회에서 배가침몰하는중에도 배씨는배를먹으면서 배를채우고 배영하며 버티는데 나보다두배는더용감했다.'
    print('원문: ', s)
    tagged = utg4.analyse(s)
    print('형태소 분석: ', tagged)
    morphs = utg4.morphs(s)
    print('형태소 각각 분리: ', morphs)
    nouns = utg4.nouns(s)
    print('명사만: ', nouns)
    pos = utg4.pos(s)
    print('형태소 품사 각각', pos)

    utg4.release()
    print('Ok.')

출력은 아래와 같다.

원문:  대통령배생존대회에서 배가침몰하는중에도 배씨는배를먹으면서 배를채우고 배영하며 버티는데 나보다두배는더용감했다.
형태소 분석:  대통령/NNG+배__05/NNG+생존/NNG+대회__02/NNG+에서/JKB 배__02/NNG+가/JKS+침몰하/VV+는/ETM+중__04/NNB+에/JKB+도/JX 배__10/NNP+씨__07/NNB+는/JX+배__01/NNG+를/JKO+먹__02/VV+으면서/EC 배__01/NNG+를/JKO+채우__03/VV+고/EC 배영하/NNP+ 며/EC 버티/VV+는데/EF 나__03/NP+보다/JKB+두__01/MMN+배__09/NNG+는/JX+더__01/MAG+용감하/VA+였/EP+다/EF+./SF
형태소 각각 분리:  ['대통령', '배', '생존', '대회', '에서', '배', '가', '침몰하', '는', '중', '에', '도', '배', '씨', ' 는', '배', '를', '먹', '으면서', '배', '를', '채우', '고', '배영하', '며', '버티', '는데', '나', '보다', '두', '배', '는', '더', '용감하', '였', '다', '.']
명사만:  ['대통령', '배', '생존', '대회', '배', '중', '배', '씨', '배', '배', '배영하', '배']
형태소 품사 각각 [('대통령', 'NNG'), ('배__05', 'NNG'), ('생존', 'NNG'), ('대회__02', 'NNG'), ('에서', 'JKB'), ('배__02', 'NNG'), ('가', 'JKS'), ('침몰하', 'VV'), ('는', 'ETM'), ('중__04', 'NNB'), ('에', 'JKB'), ('도', 'JX'), ('배__10', 'NNP'), ('씨__07', 'NNB'), ('는', 'JX'), ('배__01', 'NNG'), ('를', 'JKO'), ('먹__02', 'VV'), ('으면서', 'EC'), ('배__01', 'NNG'), ('를', 'JKO'), ('채우__03', 'VV'), ('고', 'EC'), ('배영하', 'NNP'), ('며', 'EC'), ('버티', 'VV'), ('는데', 'EF'), ('나__03', 'NP'), ('보다', 'JKB'), ('두__01', 'MMN'), ('배__09', 'NNG'), ('는', 'JX'), ('더__01', 'MAG'), ('용감하', 'VA'), ('였', 'EP'), ('다', 'EF'), ('.', 'SF')]

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

pyutagger-1.0.1.1029.tar.gz (7.7 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

pyutagger-1.0.1.1029-py3-none-any.whl (10.4 kB view details)

Uploaded Python 3

File details

Details for the file pyutagger-1.0.1.1029.tar.gz.

File metadata

  • Download URL: pyutagger-1.0.1.1029.tar.gz
  • Upload date:
  • Size: 7.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.7.9

File hashes

Hashes for pyutagger-1.0.1.1029.tar.gz
Algorithm Hash digest
SHA256 59bc0ea5764113e5b04af391ddbfcb28b357fb849531fd5e6dc0c19f1d1d4703
MD5 d530c5319ef6553cab0761908d5e22c8
BLAKE2b-256 c85d14895817e13a6ff65c42b0eaf0f6369a5be3d2b32c74ed95ed212086336b

See more details on using hashes here.

File details

Details for the file pyutagger-1.0.1.1029-py3-none-any.whl.

File metadata

  • Download URL: pyutagger-1.0.1.1029-py3-none-any.whl
  • Upload date:
  • Size: 10.4 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.7.9

File hashes

Hashes for pyutagger-1.0.1.1029-py3-none-any.whl
Algorithm Hash digest
SHA256 bf4166d46cbcb3b3006493f834f1ff6893b8ced5850a4142fec673be07c6137b
MD5 e531856c09286b2e1fa6778ab9936f09
BLAKE2b-256 95e79cbdfb963e2d0bc97be365adcd35c34c4714c1a6484c01c1c594bbeb5039

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page