Skip to main content

Basic nlp for thai

Project description

เครื่องมือ NLP สำหรับภาษาไทย

include

  • Token Identification: ระบุชนิด Token ข้อความภาษาไทย
  • PmSeg: หาขอบเขตของ pseudo morpheme
  • Pos tagging: Tag part of speech(pos) ระดับ pseudo morpheme
  • Spelling corrector: แก้ไขคำผิด
  • Find Similarity Terms: ค้นหา Terms/Words ที่เขียนผิดหรือคล้ายกันในเอกสาร

Colab

https://colab.research.google.com/drive/1G7OUNsCC-B5XHNd8V5Et1ZKpJp4R66hg

Update

0.5.1

  • เพิ่ม function FindSimilarityTerms

0.4.2

  • แก้ bug TokenIdentification: E-mail regular expression

0.4.1

  • แก้ bug TokenIdentification: Tag จากไฟล์ให้ถูกต้องมากขึ้น

0.3.7

  • แก้ correction ใน spelling ในกรณีที่ค่า prop เท่ากันให้พิจารณาโดยใช้ Tri-gram

0.3.5

  • เพิ่ม library spelling

0.3.4

  • แก้ function get_ps แบบสั้น ไม่ต้องใส่ textInput=

0.3.3

  • แก้ function get_ps ไม่ให้ new class ทุกครั้ง
  • หลังจาก new class PmSeg() ต้องเรียกฟังก์ชั่น init_cls() เสมอ
  • หลังจาก new class PosTag() ต้องเรียกฟังก์ชั่น init_cls() เสมอ

0.3.1

  • เพิ่ม library POS Tagging

0.2.7

  • Add wrap function get_ps

0.2.1

  • เพิ่ม library Token Identification

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

basicthainlp-0.5.1.tar.gz (35.7 MB view details)

Uploaded Source

Built Distribution

basicthainlp-0.5.1-py3-none-any.whl (35.8 MB view details)

Uploaded Python 3

File details

Details for the file basicthainlp-0.5.1.tar.gz.

File metadata

  • Download URL: basicthainlp-0.5.1.tar.gz
  • Upload date:
  • Size: 35.7 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.1.1 CPython/3.11.9

File hashes

Hashes for basicthainlp-0.5.1.tar.gz
Algorithm Hash digest
SHA256 9b878cde5a1cb3d7090dea1ac70cf5b8b6156ebd759af1a53e8c128d78a3cb06
MD5 d04b04d545517b73dd6a8f7719d8ebe5
BLAKE2b-256 6d5dd47cd4363e71fabec8f8584537f708fbc2ec6ef0c9bca1f14f0b9aa7f27c

See more details on using hashes here.

File details

Details for the file basicthainlp-0.5.1-py3-none-any.whl.

File metadata

  • Download URL: basicthainlp-0.5.1-py3-none-any.whl
  • Upload date:
  • Size: 35.8 MB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.1.1 CPython/3.11.9

File hashes

Hashes for basicthainlp-0.5.1-py3-none-any.whl
Algorithm Hash digest
SHA256 18e42c9953a244c562adb1968cdc6c2ff8effd54dbf132bba29a16896fde6653
MD5 ab11c423142b713dc79a29e6fe5f63e0
BLAKE2b-256 2a1aecd0d664573d945e606804fa7bbcc85181b3b3d5c7edf14ed653cbd5c733

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page