Basic nlp for thai
Project description
เครื่องมือ NLP สำหรับภาษาไทย
include
- Token Identification: ระบุชนิด Token ข้อความภาษาไทย
- PmSeg: หาขอบเขตของ pseudo morpheme
- Pos tagging: Tag part of speech(pos) ระดับ pseudo morpheme
- Spelling corrector: แก้ไขคำผิด
Colab
https://drive.google.com/file/d/1G7OUNsCC-B5XHNd8V5Et1ZKpJp4R66hg/view?usp=share_link
Update
0.3.9
- แก้ bug TokenIdentification: Tag จากไฟล์ให้ถูกต้องมากขึ้น
0.3.7
- แก้ correction ใน spelling ในกรณีที่ค่า prop เท่ากันให้พิจารณาโดยใช้ Tri-gram
0.3.5
- เพิ่ม library spelling
0.3.4
- แก้ function get_ps แบบสั้น ไม่ต้องใส่ textInput=
0.3.3
- แก้ function get_ps ไม่ให้ new class ทุกครั้ง
- หลังจาก new class PmSeg() ต้องเรียกฟังก์ชั่น init_cls() เสมอ
- หลังจาก new class PosTag() ต้องเรียกฟังก์ชั่น init_cls() เสมอ
0.3.1
- เพิ่ม library POS Tagging
0.2.7
- Add wrap function get_ps
0.2.1
- เพิ่ม library Token Identification
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
basicthainlp-0.3.9.tar.gz
(35.2 MB
view details)
Built Distribution
File details
Details for the file basicthainlp-0.3.9.tar.gz
.
File metadata
- Download URL: basicthainlp-0.3.9.tar.gz
- Upload date:
- Size: 35.2 MB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.8.11
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 44412879fb9597d32e6ebd6d1f557aa6695bc474d23a523229d41b41873c0d34 |
|
MD5 | b6789321b2df30dea87f0937bffcdca9 |
|
BLAKE2b-256 | 9f2bfc7b6a1ccc517de93e227b6ef0dd29f773f510b6a0c0bda0f55be541efac |
File details
Details for the file basicthainlp-0.3.9-py3-none-any.whl
.
File metadata
- Download URL: basicthainlp-0.3.9-py3-none-any.whl
- Upload date:
- Size: 35.3 MB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.8.11
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 58c813da66ff0c4513ddfa5d9fc1ace2c850b20dad4197483d018804e2d288c1 |
|
MD5 | a54cfe8c283c95af957f0235a859d383 |
|
BLAKE2b-256 | 344917b3ad92632ac605db88a5ecda45e53bf30432bfa617b79cf9b10b43f8e5 |