Skip to main content

Automatic speech recognition toolkit on Pytorch

Project description

MASR流式与非流式语音识别

python version GitHub forks GitHub Repo stars GitHub 支持系统

MASR是一款基于Pytorch实现的自动语音识别框架,MASR全称是神奇的自动语音识别框架(Magical Automatic Speech Recognition),MASR致力于简单,实用的语音识别项目。可部署在服务器,Nvidia Jetson设备,未来还计划支持Android等移动设备。

本项目使用的环境:

  • Anaconda 3
  • Python 3.7
  • Pytorch 1.10.0
  • Windows 10 or Ubuntu 18.04

在线使用

更新记录

  • 2021.12.26: 支持pip方式安装。
  • 2021.12.25: 初步完成基本程序。

模型下载

数据集 使用模型 测试集字错率 下载地址
aishell(179小时) deepspeech2 0.06346 点击下载
free_st_chinese_mandarin_corpus(109小时) deepspeech2 0.13941 点击下载
thchs_30(34小时) deepspeech2 0.06751 点击下载
超大数据集(1600多小时真实数据)+(1300多小时合成数据) deepspeech2 0.06215 点击下载

说明:

  1. 这里字错率是使用eval.py程序并使用集束搜索解码ctc_beam_search方法计算得到的。
  2. 下载的压缩文件已经包含了mean_std.npzvocabulary.txt,需要把解压得到的全部文件复制到项目根目录下。

有问题欢迎提 issue 交流

文档教程

快速预测

  • 下载作者提供的模型或者训练模型,然后执行导出模型,使用infer_path.py预测音频,通过参数--wav_path指定需要预测的音频路径,完成语音识别,详情请查看模型部署
python infer_path.py --wav_path=./dataset/test.wav

输出结果:

-----------  Configuration Arguments -----------
alpha: 1.2
beam_size: 10
beta: 0.35
cutoff_prob: 1.0
cutoff_top_n: 40
decoding_method: ctc_greedy
enable_mkldnn: False
is_long_audio: False
lang_model_path: ./lm/zh_giga.no_cna_cmn.prune01244.klm
mean_std_path: ./dataset/mean_std.npz
model_dir: ./models/infer/
to_an: True
use_gpu: True
use_tensorrt: False
vocab_path: ./dataset/zh_vocab.txt
wav_path: ./dataset/test.wav
------------------------------------------------
消耗时间:132, 识别结果: 近几年不但我用书给女儿儿压岁也劝说亲朋不要给女儿压岁钱而改送压岁书, 得分: 94
  • 长语音预测
python infer_path.py --wav_path=./dataset/test_vad.wav --is_long_audio=True
  • Web部署

录音测试页面

  • GUI界面部署

GUI界面

相关项目

参考资料

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

masr-0.1.2-py3-none-any.whl (57.9 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page