Skip to main content

Arabic text filtering for inappropriate words | تصفية النصوص العربية من الكلمات غير اللائقة

Project description

Clear-Word-ar

مكتبة Clear-Word-ar هي مكتبة بايثون مفتوحة المصدر تستخدم لتصفية الكلمات غير اللائقة من النصوص العربية. تهدف هذه المكتبة إلى مساعدة المطورين على تحسين محتوى النصوص عن طريق إزالة الكلمات البذيئة والإيموجيات غير المرغوبة.

الميزات

  • إزالة الإيموجيات من النصوص
  • إزالة الأحرف المتكررة
  • إزالة الحركات: (كل الحركات، حذف الشدة، حذف التطويل، حذف الحركة الأخيرة)
  • تصفية الكلمات البذيئة مع إرجاع True أو False

التثبيت

لتثبيت المكتبة، يمكنك استخدام الأمر التالي:

pip install clear-word-ar

مثال

from clearAR import Word

text = "هذا النص لا يحتوي كلمات غير لائقة"

if Word.BadWord(text):
    print("النص يحتوي على كلمات غير لائقة")
else:
    print("النص خالٍ من الكلمات غير لائقة")

output : النص خالٍ من الكلمات غير لائقة

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

clear_word_ar-0.0.1.tar.gz (2.5 kB view hashes)

Uploaded Source

Built Distribution

clear_word_ar-0.0.1-py3-none-any.whl (1.9 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page