Skip to main content

thai-text profanity library

Project description

tn-profanity-python

Support Python3, for Python2 please use version 0.3.4 or below

filter profane word in Thai / English by censoring blacklist words

Thai profane words are provided !

How To

> from tnprofanity.tnprofanity import Profane

> Profane.censor(u"สวัสดีครับ คุณควาย เป็นยังไงบ้างครับ", whitelist =[u"บ้าง"],  blacklist = [u"บ้า", u"ควาย"], mode = "preserve")
u"สวัสดีครับ คุณ**** เป็นยังไงบ้างครับ")

> Profane.censor(u"แม่งเอ้ย อย่ามาถุยน้ำลายใส่กับข้าวของลูกค้าสิครับ", whitelist =[u"น้ำ"],  blacklist = [u"แม่ง", u"ถุยน้ำลาย"], mode = "preserve", mark="X")
u"XXXXเอ้ย อย่ามาXXXXXXXXXใส่กับข้าวของลูกค้าสิครับ"

> Profane.censor(u"boobs size porn", blacklist = [u"boobs", u"porn"])
u"***** size ****"

> Profane.check(u"มาทำไมอีก อีควาย", whitelist=[u"อีก"], blacklist=[])
[(u'\\u0e2d\\u0e35', 10, 12), (u'\\u0e04\\u0e27\\u0e32\\u0e22', 12, 16)]
# [(u"อี", 10, 12), (u"ควาย", 12, 16)]


mode for merging whitelist / blacklist conflict
"preserve" : (default) preserve white term if conflict with black term
"overlap" : preserve white term but still censor partial of black term
"ignore" : ignore white term

for very positive-case example
input text ได้จาก https://th.uncyclopedia.info/wiki/%E0%B8%84%E0%B8%B3%E0%B8%AB%E0%B8%A2%E0%B8%B2%E0%B8%9A%E0%B8%84%E0%B8%B2%E0%B8%A2 ที่หัวข้อคำหยาบอันตราย

censor text :

****พ่อ**********เอง เอาปืนพกยิง**ยิง*******พ่อ**********สิ **จะเอาปืนยิง*** **สัตว์ ******เป็ด **แตด ดูด***ปลิ้น สิ้นน้ำเชื้อ เจืออสุจิ หัว*** นรก******* ช้างลากกระโดด**** **นกเป็ดน้ำ ****ต่ำช้า *******สิ้นชีพ สก**** เศษนรก ***ยมทูต ******* ******* ****ไม่เลือก*****ตลอด ยอด***** **วาฬ **โรส ********จิ๊กโกะ **จะเอาปืนกลไปยิง****สะ โอตะ **หน้า**** **ซวยแปดตลบ ****กลบทราย ***สิงโต********* **พระราม ***พระลักษมณ์ ***นนทก **สุครีพ ***นางสีดา **ทศกัณฐ์ **ไมยราพ ***หนุมาน ***มัจฉานุ หันแตด*** **กระทิงเปลี่ยว เลี้ยว**ลงรู **จะเอาปืนกลไปยิงใส่พ่อ***สิ ไซเรนตำรวจดัง**** **จะเฟี่ยงระเบิดใส่*** **จะเอารถถังไปยิง*****หูหมี**ปลาเอ๋ง **กระหรี่ไขมันจุกแตด **ฟันจระเข้ **มังกรคอมมานโด้ ไอ*****แม้ว กวน****** **วาฬสีน้ำเงิน *****สะพานขาว ******ไบซั่น **ลาวลืมชาติ **มีดบาด** **ฟัน***บ้า **แตดแสบสันต์ **ฟันฉลาม ************** **พล่อยทะเล**** **ปลาเงือก *****พะยูน *****ปลาวาฬ การะบูนลูบ** ******จุกปาก **ลาก******* **เบ็ดไม่มีที่สิ้นสุด **ทรุดกลางฟลอร์ **ดอเหม็น **เมนส์ ย้อนกลับ **ตับแดง **แฝง*****บ้า **หมัดเกาะ** **โลนเซาะ**** **ผังผืดหนอน **อ้วนนรกแตก **กระเทย******* ***คิดว่าคำด่าพ่อด่า****ันสะกดยากนักสิ อย่าให้**เห็น*****กนะ อย่านึกว่า**ไม่รู้หรือ***เหมือน****เหง้าศักราชญาติ*** ***** **แก่หนัง***** **พจมาน

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

tnprofanity-0.4.1.tar.gz (5.6 kB view details)

Uploaded Source

Built Distribution

tnprofanity-0.4.1-py3-none-any.whl (6.2 kB view details)

Uploaded Python 3

File details

Details for the file tnprofanity-0.4.1.tar.gz.

File metadata

  • Download URL: tnprofanity-0.4.1.tar.gz
  • Upload date:
  • Size: 5.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/2.0.0 pkginfo/1.5.0.1 requests/2.22.0 setuptools/41.4.0 requests-toolbelt/0.9.1 tqdm/4.36.1 CPython/3.7.2

File hashes

Hashes for tnprofanity-0.4.1.tar.gz
Algorithm Hash digest
SHA256 3da95f2c40b0af03950b568eaa49925acd71d05b7af2d452cabc78eda40e27f6
MD5 bc270d9c70dfbe3358c3059f88b12325
BLAKE2b-256 7c879d4c7e4067aa30d965f02ac2d4ac9ede66071931910e8c37748519e6fb59

See more details on using hashes here.

File details

Details for the file tnprofanity-0.4.1-py3-none-any.whl.

File metadata

  • Download URL: tnprofanity-0.4.1-py3-none-any.whl
  • Upload date:
  • Size: 6.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/2.0.0 pkginfo/1.5.0.1 requests/2.22.0 setuptools/41.4.0 requests-toolbelt/0.9.1 tqdm/4.36.1 CPython/3.7.2

File hashes

Hashes for tnprofanity-0.4.1-py3-none-any.whl
Algorithm Hash digest
SHA256 e574ff1bd25fb4acf6e1178c33adc6ee3fbff75a0c88d122156181375a66925f
MD5 dbf4b4b41e5affc9e0addf13a6a5f84a
BLAKE2b-256 f35f1bdcd616ac9c86180c4213dcb6c62e5fb44c2386c2f37dd16ce203ae1efd

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page