Arabic text filtering for inappropriate words | تصفية النصوص العربية من الكلمات غير اللائقة
Project description
Clear-Word-ar
مكتبة Clear-Word-ar
هي مكتبة بايثون مفتوحة المصدر تستخدم لتصفية الكلمات غير اللائقة من النصوص العربية. تهدف هذه المكتبة إلى مساعدة المطورين على تحسين محتوى النصوص عن طريق إزالة الكلمات البذيئة والإيموجيات غير المرغوبة.
الميزات
- إزالة الإيموجيات من النصوص
- إزالة الأحرف المتكررة
- إزالة الحركات: (كل الحركات، حذف الشدة، حذف التطويل، حذف الحركة الأخيرة)
- تصفية الكلمات البذيئة مع إرجاع
True
أوFalse
التثبيت
لتثبيت المكتبة، يمكنك استخدام الأمر التالي:
pip install clear-word-ar
مثال
from clearAR import Word
text = "هذا النص لا يحتوي كلمات غير لائقة"
if Word.BadWord(text):
print("النص يحتوي على كلمات غير لائقة")
else:
print("النص خالٍ من الكلمات غير لائقة")
output : النص خالٍ من الكلمات غير لائقة
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
clear_word_ar-0.0.1.tar.gz
(2.5 kB
view hashes)
Built Distribution
Close
Hashes for clear_word_ar-0.0.1-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 802c0a0775cbdf366f486194a9cf7c493af198efe3c124892a4adc282cfeb326 |
|
MD5 | 5e824790e632c56db02dc05ae2bed8d7 |
|
BLAKE2b-256 | a4ab826ed95f049f5dc3354dc52359bb6478ad506208d5fec99f8c9ed2626d3d |