Speeech Recognition for Indic languages.
Project description
IndicASR
Speech Recognition for Indian Languages
Notes
-
IndicASR is built on top of
and
and has pre-trained models for
Telugu
in the current release. -
The Telugu model is trained on the train set of MSR Indic corpus + a private corpus of ~94 hours obtained from various telugu interview playlists from Youtube.
Use as python module
pip install --upgrade indicasr
from indicasr import IndicASR
asr = IndicASR("telugu")
# Run one file at once
asr.transcribe("samples/telugu/hari.16k.wav")
# "ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు"
# Batch inference
asr.transcribe(["samples/telugu/hari.16k.wav",
"samples/telugu/ramana.16k.wav"])
# ["ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు",
# "భారత దేశము నా మాత్ర భూమి భారతీవులంతా నా సోదరి సోదరులు"]
sample name | prediction | expected |
---|---|---|
telugu/hari.16k.wav | ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు | ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు |
telugu/harsha.16k.wav | నేను ఇప్పుడు గడ్డి కొడుతున్నారు | నేను ఇప్పుడు గడ్డి కొడుతున్నాను |
telugu/indra.16k.wav | నేను భారత దేశంలో ఉన్నాను | నేను భారత దేశంలో ఉన్నాను |
telugu/praneeth.16k.wav | నా పేరు ప్రణి బేదపూడి | నా పేరు ప్రణీత్ బేదపూడి |
telugu/ramana.16k.wav | భారత దేశము నా మాత్ర భూమి భారతీవులంతా నా సోదరి సోదరులు | భారత దేశము నా మాతృ భూమి భారతీయులంతా నా సోదరీ సోదరులు |
telugu/sai_krishna.16k.wav | నా పేరు సాయి కృష్ణ | నా పేరు సాయి కృష్ణ |
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
indicasr-1.0.0.tar.gz
(4.8 kB
view hashes)
Built Distribution
Close
Hashes for indicasr-1.0.0-py2.py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | d1e90de163246353a7a11458751cb9ef62dd9bdb244bb46c95dfeef6563bef0f |
|
MD5 | da30b10452d954ea83124dcd568e128b |
|
BLAKE2b-256 | 64514f86309ca3379f85a46cb18b55ab7cf4045108ceb3cbbb179fd45bc404ba |