Quran Phonetic Script with addional quarnic utils
Project description
Quran Transcript
quran-transcript package
🆕 ما الجديد في الإصدار 0.4.0 (What's New in Version 0.4.0)
🔍 بحث صوتي ضبابي محسّن (Optimized Fuzzy Phonetic Search)
- إضافة فئة
PhoneticSearchللبحث عن نصوص صوتية في القرآن باستخدام التشابه الضبابي (Levenshtein distance) باستخدام مكتبة fuzzysearch - بناء فهرس مسبق للرسم الصوتي (phoneme index) لتسريع البحث بشكل كبير.
- دعم تحديد نسبة الخطأ المسموح بها (
error_ratio) للحصول على نتائج حتى مع الاختلافات الطفيفة. - تمثيل النتائج باستخدام
PhonemesSearchSpanوPhonmesSearhResultمع معلومات دقيقة عن الموقع (السورة، الآية، الكلمة، الحرف، المؤشر الصوتي).
🛠️ بناء الفهرس (Building the Index)
- يتم تضمين الفهرس الجاهز (
ph_index.npyوref_norm_ph.txt) داخل الحزمة، ولا يحتاج المستخدم العادي إلى بنائه. - للمطورين الذين يرغبون في إعادة بناء الفهرس (بعد تعديل قواعد التحويل الصوتي مثلاً)، يمكن استخدام الأمر:
python -m ph-ndx
وسيتم حفظ الملفات في مجلدquran-scriptداخل الحزمة.
🆕 ما الجديد في الإصدار 0.3.0 (What's New in Version 0.3.0)
📍 خرائط المواقع الجديدة (New Position Mappings)
- أسرع مرتان في عملية إنشاء الرسم الصوتي (Faster 2x in phonetizatoin)
- تمثيل الحروف المحذوفة ب
MappingPos(pos=(x, x), deleted=True- حيثxرقم صحيح أكبر من الصفر - بدلا منNone(Represent deleted characther withMappingPos(pos=(x, x), deleted=True)-wherexis an integer >=0- instead ofNone)
🆕 ما الجديد في الإصدار 0.2.0 (What's New in Version 0.2.0)
📍 خرائط المواقع الجديدة (New Position Mappings)
- إضافة خرائط المواقع من الرسم العثماني إلى الرسم الصوتي (Added position mappings from Uthmani script to phonetic script)
- تتبع دقيق لتحويل كل حرف إلى موضعه الجديد (Precise tracking of character transformations)
- دعم تمثيل الأحرف المحذوفة بقيمة
None(Support for deleted characters representation withNone)
📖 Quran Transcript
🔧 Installation
Install the package directly from GitHub using pip:
pip install quran-transcript
🧠 Usage Examples
🕋 Aya Object
إنشاء كائن Aya لتمثيل آية محددة واسترجاع معلوماتها
from quran_transcript import Aya
aya = Aya(1, 1) # سورة الفاتحة، الآية 1
print(aya)
aya_info = aya.get()
print(aya_info)
🔁 Loop Through All Surahs
التنقل عبر جميع الآيات في القرآن
start_aya = Aya()
for aya in start_aya.get_ayat_after():
aya_info = aya.get()
# Do something with the aya info
🧮 Get Number of Verses per Surah
بناء خريطة بأرقام السور وعدد آياتها
sura_to_aya_count = {}
start_aya = Aya(1, 1)
for i in range(1, 115): # 114 سورة في القرآن
aya.set(i, 1)
sura_to_aya_count[i] = aya.get().num_ayat_in_sura
print(sura_to_aya_count)
🔄 Convert Imlaey Script to Uthmani
تحويل الرسم الإملائي للرسم العثماني
from quran_transcript import search, Aya
imlaey_text = 'فأخرج به من الثمرات رزقا لكم'
results = search(
imlaey_text,
start_aya=Aya(2, 13),
window=20,
remove_tashkeel=True
)
uthmani_script = results[0].uthmani_script
print(uthmani_script)
🔤 Convert Uthmani Script to Phonetic Script
تحويل الرسم العثماني للرسم الصوتي للقرآن
from quran_transcript import Aya, search, quran_phonetizer, MoshafAttributes
import json
imlaey_text = "بسم الله الرحمن الرحيم"
results = search(
imlaey_text,
start_aya=Aya(1, 1),
window=2,
remove_tashkeel=True
)
# الحصول على الرسم العثماني
uthmani_script = results[0].uthmani_script
print(f"الرسم العثماني:\n{uthmani_script}")
# إعداد خصائص المصحف للتحويل الصوتي
moshaf = MoshafAttributes(
rewaya="hafs",
madd_monfasel_len=4,
madd_mottasel_len=4,
madd_mottasel_waqf=4,
madd_aared_len=4,
)
# الحصول على الرسم الصوتي مع الخرائط
phonetic_script = quran_phonetizer(uthmani_script, moshaf)
print('\n' * 2)
print(f"الرسم الصوتي:\n{phonetic_script.phonemes}")
# print(f"صفات الحروف:\n{phonetic_script.sifat}")
print('\n' * 2)
print("صفات الحروف:")
for sifa in phonetic_script.sifat:
print(json.dumps(sifa.model_dump(), ensure_ascii=False, indent=4))
print()
# جديد: عرض خرائط المواقع
print('\n' * 2)
print("خرائط المواقع:")
for idx, (uth_char, mapping) in enumerate(zip(uthmani_script, phonetic_script.mappings)):
if not mapping.deleted:
# استخراج الصوت لهذا الحرف
phoneme = phonetic_script.phonemes[mapping.pos[0]:mapping.pos[1]]
print(f"حرف: '{uth_char}' -> صوت: '{phoneme}' (موقع: {mapping.pos})")
else:
print(f"حرف: '{uth_char}' -> محذوف")
📘 For more information on
MoshafAttributes, refer to the Quran Dataset Documentation.
الرسم الصوتي للقرآن الكريم
📊 خرائط المواقع (Position Mappings)
خرائط المواقع توفر تتبع دقيق لمواقع الأحرف من النص العثماني الأصلي إلى النص الصوتي المحول. Position mappings provide precise tracking of character positions from original Uthmani text to converted phonetic text.
# i الوصول إلى بيانات الخرائط
mappings = phonetic_script.mappings # List[MappingPos | None]
phonemes = phonetic_script.phonemes # str
# المرور على خرائط الأحرف
for idx, mapping in enumerate(mappings):
if mapping is not None:
# الحصول على امتداد الموقع
start, end = mapping.pos # Python-style slice notation
# استخراج الصوت المقابل
char_phoneme = phonemes[start:end]
print(f"الحرف {idx} ينتقل إلى الصوت في الموقع ({start}, {end})")
else:
print(f"الحرف {idx} تم حذفه أثناء التحويل")
فهم MappingPos (Understanding MappingPos)
@dataclass
class MappingPos:
"""خرائط المواقع لتحويلات الأحرف (Position mapping for character transformations)"""
pos: tuple[int, int] # (بداية، نهاية) - بالطريقة البايثونية
tajweed_rules: list[TajweedRule] | None = None # قواعد التجويد المرتبطة
deleted: bool = False # حالة الحذف - True إذا تم حذف الحرف مع حفظ الموقع وتتساوي البداية والنهاية في ال `pos`
📖 مثال على استخدام البحث الصوتي (Example of Phonetic Search)
from quran_transcript import PhoneticSearch
# إنشاء كائن البحث (سيحمل الفهرس تلقائياً)
searcher = PhoneticSearch()
# نص صوتي للبحث (يمكن أن يكون غير دقيق)
query = "قَلِۦۦلَممممَاا" # مثال من الاختبارات
# البحث بنسبة خطأ 10%
results = searcher.search(query, error_ratio=0.1)
# عرض النتائج
for r in results:
print(f"سورة {r.start.sura_idx}, آية {r.start.aya_idx}")
print(f" من كلمة {r.start.uthmani_word_idx} حرف {r.start.uthmani_char_idx} إلى كلمة {r.end.uthmani_word_idx} حرف {r.end.uthmani_char_idx}")
print(f" المؤشرات الصوتية: {r.start.phonemes_idx} - {r.end.phonemes_idx}")
# استخراج النص العثماني المطابق
uthmani_text = searcher.get_uthmani_from_result(results[0])
print(f"النص العثماني: {uthmani_text}")
📦 كائنات النتائج (Result Dataclasses)
PhonemesSearchSpan
يمثل موقعاً واحداً في القرآن (بداية أو نهاية المطابقة):
sura_idx: رقم السورة (1-based)aya_idx: رقم الآية (1-based)uthmani_word_idx: فهرس الكلمة داخل الآية (0-based)uthmani_char_idx: فهرس الحرف داخل الكلمة (0-based، شامل للبداية، غير شامل للنهاية)phonemes_idx: فهرس المجموعة الصوتية في التسلسل الصوتي المرجعي (0-based)
PhonmesSearhResult
يحتوي على زوج من PhonemesSearchSpan للبداية والنهاية:
start: موقع بداية المطابقةend: موقع نهاية المطابقة (غير شامل)
الحروف: (43)
| Phoneme Name | Symbol | الحرف بالعربية |
|---|---|---|
| hamza | ء | همزة |
| baa | ب | باء |
| taa | ت | تاء |
| thaa | ث | ثاء |
| jeem | ج | جيم |
| haa_mohmala | ح | حاء |
| khaa | خ | خاء |
| daal | د | دال |
| thaal | ذ | ذال |
| raa | ر | راء |
| zay | ز | زاي |
| seen | س | سين |
| sheen | ش | شين |
| saad | ص | صاد |
| daad | ض | ضاد |
| taa_mofakhama | ط | طاء |
| zaa_mofakhama | ظ | ظاء |
| ayn | ع | عين |
| ghyn | غ | غين |
| faa | ف | فاء |
| qaf | ق | قاف |
| kaf | ك | كاف |
| lam | ل | لام |
| meem | م | ميم |
| noon | ن | نون |
| haa | ه | هاء |
| waw | و | واو |
| yaa | ي | ياء |
| alif | ا | نصف مد ألف |
| yaa_madd | ۦ | نصف مد ياء |
| waw_madd | ۥ | نصف مد واوا |
| fatha | َ | فتحة |
| dama | ُ | ضمة |
| kasra | ِ | كسرة |
| fatha_momala | ۪ | فتحة ممالة |
| alif_momala | ـ | ألف ممالة |
| hamza_mosahala | ٲ | همزة مسهلة |
| qlqla | ڇ | قلقة |
| noon_mokhfah | ں | نون مخفاة |
| meem_mokhfah | ۾ | ميم مخفاة |
| sakt | ۜ | سكت |
| dama_mokhtalasa | ؙ | ضمة مختلسة (عند الروم في تأمنا) |
صفات الحروف (10)
| Sifat (English) | Sifat (Arabic) | Available Attributes (English) | Available Attributes (Arabic) |
|---|---|---|---|
| hams_or_jahr | الهمس أو الجهر | hams, jahr | همس, جهر |
| shidda_or_rakhawa | الشدة أو الرخاوة | shadeed, between, rikhw | شديد, بين بين, رخو |
| tafkheem_or_taqeeq | التفخيم أو الترقيق | mofakham, moraqaq, low_mofakham | مفخم, مرقق, أدنى المفخم |
| itbaq | الإطباق | monfateh, motbaq | منفتح, مطبق |
| safeer | الصفير | safeer, no_safeer | صفير, لا صفير |
| qalqla | القلقلة | moqalqal, not_moqalqal | مقلقل, غير مقلقل |
| tikraar | التكرار | mokarar, not_mokarar | مكرر, غير مكرر |
| tafashie | التفشي | motafashie, not_motafashie | متفشي, غير متفشي |
| istitala | الاستطالة | mostateel, not_mostateel | مستطيل, غير مستطيل |
| ghonna | الغنة | maghnoon, not_maghnoon | مغنون, غير مغنون |
Needs refactory
Build for Source
create a venv or a conda environment to avoid coflicts, Then
cd quran-transcript
python -m pip install -r ./
Annotation Application of annotation imlaey to uthmnai
To start server:
python -m uvicorn server:app --port 900
To start streamlit
python -m streamlit run streamlit_app
Quran Script Description
[TODO]
merge_uthmani_imlaey.py
Merging Uthmani Quran and Imlaye Quran scipts of tanzil into a single scipt (".xml" and ".json")
- Uthmanic: without (pause marks, sajda signs, hizb signs)
- Imlaey: without (pause marks, sajda signs, hizb signs and tatweel sign) Usage:
usage: Merge Uthmani and Imlaey Script into a single scipt [-h] [--uthmani-file UTHMANI_FILE] [--imlaey-file IMLAEY_FILE] [--output-file OUTPUT_FILE]
options:
-h, --help show this help message and exit
--uthmani-file UTHMANI_FILE
The path to the input file "file.xml"
--imlaey-file IMLAEY_FILE
The path to the input file "file.xml"
--output-file OUTPUT_FILE
The path to the output file either ".json" or ".xml"
Example within the repo (json):
python merge_uthman_imlaey.py --uthmani-file quran-script/quran-uthmani-without-pause-sajda-hizb-marks.xml --imlaey-file quran-script/quran-simple-imlaey-without-puase-sajda-hizb-marks-and-tatweel.xml --output-file quran-script/quran-uthmani-imlaey.json
Example within the repo (json):
python merge_uthman_imlaey.py --uthmani-file quran-script/quran-uthmani-without-pause-sajda-hizb-marks.xml --imlaey-file quran-script/quran-simple-imlaey-without-puase-sajda-hizb-marks-and-tatweel.xml --output-file quran-script/quran-uthmani-imlaey.xml
TODO
-
quran_transcriptdocs - adding tests
- CI/CD with github
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file quran_transcript-0.4.0.tar.gz.
File metadata
- Download URL: quran_transcript-0.4.0.tar.gz
- Upload date:
- Size: 5.7 MB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.9.21 {"installer":{"name":"uv","version":"0.9.21","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"25.10","id":"questing","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
99def46f06e96d65e1498bb11952a9879bea004c66d73c299191a7cadf2e4913
|
|
| MD5 |
6ce8c4281106cf7fc3eab7335af1f8bb
|
|
| BLAKE2b-256 |
717637b98510ada0a50cd487fd2d2fcf79df915b0ab72428770d98eb2d711cff
|
File details
Details for the file quran_transcript-0.4.0-py3-none-any.whl.
File metadata
- Download URL: quran_transcript-0.4.0-py3-none-any.whl
- Upload date:
- Size: 5.8 MB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.9.21 {"installer":{"name":"uv","version":"0.9.21","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"25.10","id":"questing","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
922a75e89e129c3dede14b3ea0c5ad9b0e5ad3a647a08ec006ef80abd52cf61b
|
|
| MD5 |
3d2da50171e4eb35159af2a2ca6ab724
|
|
| BLAKE2b-256 |
ebde8b17caed12e3881b5f4963b59226e29dc115eadbcf822d1f65fdd74cbb36
|