Skip to main content

Basic nlp for thai

Project description

เครื่องมือ NLP สำหรับภาษาไทย

include

  • Token Identification: ระบุชนิด Token ข้อความภาษาไทย
  • PmSeg: หาขอบเขตของ pseudo morpheme
  • Pos tagging: Tag part of speech(pos) ระดับ pseudo morpheme
  • Spelling corrector: แก้ไขคำผิด

Colab

https://drive.google.com/file/d/1G7OUNsCC-B5XHNd8V5Et1ZKpJp4R66hg/view?usp=drive_link

Update

0.4.2

  • แก้ bug TokenIdentification: E-mil regular expression

0.4.1

  • แก้ bug TokenIdentification: Tag จากไฟล์ให้ถูกต้องมากขึ้น

0.3.7

  • แก้ correction ใน spelling ในกรณีที่ค่า prop เท่ากันให้พิจารณาโดยใช้ Tri-gram

0.3.5

  • เพิ่ม library spelling

0.3.4

  • แก้ function get_ps แบบสั้น ไม่ต้องใส่ textInput=

0.3.3

  • แก้ function get_ps ไม่ให้ new class ทุกครั้ง
  • หลังจาก new class PmSeg() ต้องเรียกฟังก์ชั่น init_cls() เสมอ
  • หลังจาก new class PosTag() ต้องเรียกฟังก์ชั่น init_cls() เสมอ

0.3.1

  • เพิ่ม library POS Tagging

0.2.7

  • Add wrap function get_ps

0.2.1

  • เพิ่ม library Token Identification

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

basicthainlp-0.4.2.tar.gz (35.2 MB view details)

Uploaded Source

Built Distribution

basicthainlp-0.4.2-py3-none-any.whl (35.3 MB view details)

Uploaded Python 3

File details

Details for the file basicthainlp-0.4.2.tar.gz.

File metadata

  • Download URL: basicthainlp-0.4.2.tar.gz
  • Upload date:
  • Size: 35.2 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.8.18

File hashes

Hashes for basicthainlp-0.4.2.tar.gz
Algorithm Hash digest
SHA256 c3e8e4277b27ba1d608527785e908e17d35da1076cdbdbe696de57987916d763
MD5 baaebf44004ba156b87f4c53a0a6d29c
BLAKE2b-256 d82a66a0a8a56c1f56c04487222c6b114f89f363bde7073ac30c3cef01dd4161

See more details on using hashes here.

File details

Details for the file basicthainlp-0.4.2-py3-none-any.whl.

File metadata

File hashes

Hashes for basicthainlp-0.4.2-py3-none-any.whl
Algorithm Hash digest
SHA256 8c185bb46782f1a8b22fcfc4fd9c3cf8645ad6b211708ebb042f72f77301ed22
MD5 daeeb528b68df95840f6939e590fc3d4
BLAKE2b-256 abc37839525abae3e2b4411d58d441b364ce0befe43eae6395f8eb2c77396318

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page