Skip to main content

Basic nlp for thai

Project description

เครื่องมือ NLP สำหรับภาษาไทย

include

  • Token Identification: ระบุชนิด Token ข้อความภาษาไทย
  • PmSeg: หาขอบเขตของ pseudo morpheme
  • Pos tagging: Tag part of speech(pos) ระดับ pseudo morpheme
  • Spelling corrector: แก้ไขคำผิด

Colab

https://drive.google.com/file/d/1G7OUNsCC-B5XHNd8V5Et1ZKpJp4R66hg/view?usp=share_link

Update

0.4.1

  • แก้ bug TokenIdentification: Tag จากไฟล์ให้ถูกต้องมากขึ้น

0.3.7

  • แก้ correction ใน spelling ในกรณีที่ค่า prop เท่ากันให้พิจารณาโดยใช้ Tri-gram

0.3.5

  • เพิ่ม library spelling

0.3.4

  • แก้ function get_ps แบบสั้น ไม่ต้องใส่ textInput=

0.3.3

  • แก้ function get_ps ไม่ให้ new class ทุกครั้ง
  • หลังจาก new class PmSeg() ต้องเรียกฟังก์ชั่น init_cls() เสมอ
  • หลังจาก new class PosTag() ต้องเรียกฟังก์ชั่น init_cls() เสมอ

0.3.1

  • เพิ่ม library POS Tagging

0.2.7

  • Add wrap function get_ps

0.2.1

  • เพิ่ม library Token Identification

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

basicthainlp-0.4.1.tar.gz (35.2 MB view details)

Uploaded Source

Built Distribution

basicthainlp-0.4.1-py3-none-any.whl (35.3 MB view details)

Uploaded Python 3

File details

Details for the file basicthainlp-0.4.1.tar.gz.

File metadata

  • Download URL: basicthainlp-0.4.1.tar.gz
  • Upload date:
  • Size: 35.2 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.8.11

File hashes

Hashes for basicthainlp-0.4.1.tar.gz
Algorithm Hash digest
SHA256 8c1d212c92476242aea5c0e4cefe02dce6a3167d9c2f23e0a65463a68eb0280f
MD5 78a72e514c9582ee6aa28672da0d590d
BLAKE2b-256 7423498291d6ef748d665af6ccff5b4180e9c0858d26a4e69c82e445cafb80d9

See more details on using hashes here.

File details

Details for the file basicthainlp-0.4.1-py3-none-any.whl.

File metadata

  • Download URL: basicthainlp-0.4.1-py3-none-any.whl
  • Upload date:
  • Size: 35.3 MB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.8.11

File hashes

Hashes for basicthainlp-0.4.1-py3-none-any.whl
Algorithm Hash digest
SHA256 420731e98889c76ba0957d81aacc77015bec4f099780940ccdc672434c213a15
MD5 b9a12025c6a278156d772dbd6899109a
BLAKE2b-256 bdaaf01c6223ccf817c88f2a8d249fdce32b8bc01336db4a361f009c23d6cd21

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page