Skip to main content

Basic nlp for thai

Project description

เครื่องมือ NLP สำหรับภาษาไทย

include

  • Token Identification: ระบุชนิด Token ข้อความภาษาไทย
  • PmSeg: หาขอบเขตของ pseudo morpheme
  • Pos tagging: Tag part of speech(pos) ระดับ pseudo morpheme
  • Spelling corrector: แก้ไขคำผิด

Colab

https://drive.google.com/file/d/1G7OUNsCC-B5XHNd8V5Et1ZKpJp4R66hg/view?usp=share_link

Update

0.3.9

  • แก้ bug TokenIdentification: Tag จากไฟล์ให้ถูกต้องมากขึ้น

0.3.7

  • แก้ correction ใน spelling ในกรณีที่ค่า prop เท่ากันให้พิจารณาโดยใช้ Tri-gram

0.3.5

  • เพิ่ม library spelling

0.3.4

  • แก้ function get_ps แบบสั้น ไม่ต้องใส่ textInput=

0.3.3

  • แก้ function get_ps ไม่ให้ new class ทุกครั้ง
  • หลังจาก new class PmSeg() ต้องเรียกฟังก์ชั่น init_cls() เสมอ
  • หลังจาก new class PosTag() ต้องเรียกฟังก์ชั่น init_cls() เสมอ

0.3.1

  • เพิ่ม library POS Tagging

0.2.7

  • Add wrap function get_ps

0.2.1

  • เพิ่ม library Token Identification

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

basicthainlp-0.3.9.tar.gz (35.2 MB view details)

Uploaded Source

Built Distribution

basicthainlp-0.3.9-py3-none-any.whl (35.3 MB view details)

Uploaded Python 3

File details

Details for the file basicthainlp-0.3.9.tar.gz.

File metadata

  • Download URL: basicthainlp-0.3.9.tar.gz
  • Upload date:
  • Size: 35.2 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.8.11

File hashes

Hashes for basicthainlp-0.3.9.tar.gz
Algorithm Hash digest
SHA256 44412879fb9597d32e6ebd6d1f557aa6695bc474d23a523229d41b41873c0d34
MD5 b6789321b2df30dea87f0937bffcdca9
BLAKE2b-256 9f2bfc7b6a1ccc517de93e227b6ef0dd29f773f510b6a0c0bda0f55be541efac

See more details on using hashes here.

File details

Details for the file basicthainlp-0.3.9-py3-none-any.whl.

File metadata

  • Download URL: basicthainlp-0.3.9-py3-none-any.whl
  • Upload date:
  • Size: 35.3 MB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.8.11

File hashes

Hashes for basicthainlp-0.3.9-py3-none-any.whl
Algorithm Hash digest
SHA256 58c813da66ff0c4513ddfa5d9fc1ace2c850b20dad4197483d018804e2d288c1
MD5 a54cfe8c283c95af957f0235a859d383
BLAKE2b-256 344917b3ad92632ac605db88a5ecda45e53bf30432bfa617b79cf9b10b43f8e5

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page