Python based Korean Language Processing Lib, Contextual Parser
Project description
PyCor 0.0.7
Python Module for Korean Language Processing
NLCP : Natural Language Contextual Parsing
- Corpus기반 사전 학습, Dictionary 없이 한국어 형태소 분석이 가능한 자연어 파서
- 문장들을 처리하는 과정에서 Dictionary를 스스로 만드는 형태소분석기
- 한정된 문법형태소의 결합 규칙과 문서 혹은 문서 집합 안에서의 체언, 용언의 활용형태 분석
- 문장 단위, Document단위, Document set단위로 컨텍스트 생성, 자연어 파싱
- 제약 조건 : 기본적인 한국어 맞춤법을 지키는 정규화된 한글 문서에 적합(위키, 논문, 뉴스 기사 등)
- 목적 : 체계적인 지식을 기술한 문서의 파싱과 이해
Install
> pip install pycor
Usage
> python3
import pycor
pycor.train('training-text-dir')
pycor.savemodel('model-dir')
# 체언 혹은 용언의 어근들을 추출하여 2차원 배열로 제공
word2dArray = pycor.trim(text)
pycor.trimfile('text-file-path')
# 키워드 추출
keywordArray = pycor.abstract(text)
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
pycor-0.0.8.tar.gz
(41.9 kB
view details)
Built Distribution
pycor-0.0.8-py3-none-any.whl
(59.6 kB
view details)
File details
Details for the file pycor-0.0.8.tar.gz
.
File metadata
- Download URL: pycor-0.0.8.tar.gz
- Upload date:
- Size: 41.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/1.12.1 pkginfo/1.4.2 requests/2.18.4 setuptools/39.2.0 requests-toolbelt/0.8.0 tqdm/4.28.1 CPython/3.6.5
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | ac4c229c3e2bf2fd688b238627e7dc5ed021b1d33958d1096b8e87bad126d7f5 |
|
MD5 | 5c77a7a20e4b0a2a0b405f5857fed8c1 |
|
BLAKE2b-256 | 8caa4680c39a185fafc9a242340d8bfedf51a2d86396b2398caa74bf97fd5eb9 |
File details
Details for the file pycor-0.0.8-py3-none-any.whl
.
File metadata
- Download URL: pycor-0.0.8-py3-none-any.whl
- Upload date:
- Size: 59.6 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/1.12.1 pkginfo/1.4.2 requests/2.18.4 setuptools/39.2.0 requests-toolbelt/0.8.0 tqdm/4.28.1 CPython/3.6.5
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | ba4852ec680a50332cbe90fabda967bd59819e3c9fca78ce45154ae8ece9e357 |
|
MD5 | 87c7144a92261e309c7f5e162eb477f9 |
|
BLAKE2b-256 | e4b60cce08aaf2b974ca99305792ba514023825b1c938ccb2015fd34a03c5c84 |