Skip to main content

Breton language speech-to-text tools

Project description

License: MIT

Anaouder mouezh e brezhoneg gant Vosk

Version française

Petra eo ?

Un anaouder mouezh emgefre, graet gant ar meziantoù Kaldi ha Vosk.
Gantañ e c'heller adskrivañ komzoù e brezhoneg (Son -> Skrid) en un doare emgefre, dre ur mikro e amzer real pe diouzh restroù son.
Pleustret eo bet gant un dek eurvezh bennak a deulioù son ha skrid linennet.

Un nebeut perzhioù dedennus :

  • Skañv. Pouezh ar model a zo dindan 100 Mo ha treiñ a ra war ur bern mekanikoù : urzhiataerioù hep GPU, RaspberryPi, hezoug Android...
  • Prim. Gallout a reer adskrivañ ar son e amzer real, memes gant un urzhiataer kozh, pe primoc'h c'hoazh gant dafar nevesoc'h.
  • Lec'hel. Ezhomm ebet eus an Internet. Ho mouezh hag ho data a chomo war ho penveg, ha tretet e vint gant ho penveg nemetken. Kudenn surentez ebet liammet d'an treuzkas dre rouedad ha gwelloc'h a-fed ekologel.
  • Digoust ha dieub. Gellout a reoc'h azasaat ar meziant d'hoc'h ezhommoù pe enframmañ anezhañ e meziantoù all.

Dalc'hoù 'zo siwazh :

  • Poentadur ebet.
  • Kizidig d'an trouzioù endro.
  • Fall war ur bern pouezioù-mouezh c'hoazh.
  • Ret eo komz sklaer ha goustadik.

Emichañs e vo gwellaet efedusted an anaouder tamm-ha-tamm, gant ma vo kavet roadennoù mouezh adskrivet.
Ul lisañs dieub (doare Creative Commons) a aotrefe eskemm ar roadennoù-se en un doare aes.

Sikour ar raktres gant un donezon : Liberapay

Staliañ

Goude bezañ bet staliet Python3 e c'heller staliañ an anaouder dre an terminal :

pip install anaouder

Adskrivañ ur restr son

Gant an urzh adskrivan en un terminal, e vo adskrivet ar pezh e vez komprenet gant an anaouder diouzh ur restr son. Ar wech kentañ ma vo peurgaset an urzh-se e vo ret deoc'h gortoz ur pennadig ma vefe pellkarget ha staliet ar modul static_ffmpeg (evit amdreiñ restroù son ha video).

adskrivan RESTR_SON_PE_VIDEO

Implijout gant ur mikro

Dre an an urzh mikro e c'heller implij an anaouder gant ho vouezh e amzer real.

Ma n'ez eus skrid ebet o tont, klaskit niverenn an etrefas son gant :

mikro -l

Ha gant an niverenn-se :

mikro -d NIVERENN_ETREFAS

Linennañ ur teul skrid gant un teul son

M'ho peus un teul skrid adskrivet dre dorn (e stumm .txt) e c'heller linennañ ar skrid gant ar son, evit krouiñ ur restr istitloù (e stumm srt).

linennan RESTR_SON_PE_VIDEO RESTR_SKRID

Gant an option -o ez eus tu reiñ anv ur restr e lerc'h ma vo skrivet an istitloù, da skouer :

linennan son.mp3 skrid.txt -o istitloù.srt

Adskrivañ istitloù evit ur video

Gallout a rit adskrivañ istitloù diouzh teuliadoù son pe video, e stumm srt (Subrip).

istitlan RESTR_SON_PE_VIDEO

An oberiadur-se a gemero kalzig a amzer (hervez padelezh an teuliad son). Klaskit gant un teul film berr da gentañ !

https://user-images.githubusercontent.com/10166907/213805292-63becbe2-ffb5-492f-9bac-1330c4b2d07d.mp4

Setu disoc'h an istitloù emgefre, hep cheñch netra. Kollet eo buan pa vez sonnerez...

Implijout e diabarzh meziantoù all

N'eo ket aliet dre ma vez kollet un nebeut perzhioù e-keñver ar pezh vez graet gant ar modul anaouder : adlakaat ar varennigoù-stag hag amdreiñ an niverennoù da skouer.

Ar model noazh a c'hellit kavout en dosser anaouder/models pe dre al liamm releases.

Kdenlive

Gant ar meziant frammañ videoioù Kdenlive e c'heller adskrivañ istitloù en un doare emgefre ivez.
Ar mod-implij a c'heller kavout amañ.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

anaouder-0.7.8.tar.gz (73.4 MB view hashes)

Uploaded Source

Built Distribution

anaouder-0.7.8-py3-none-any.whl (73.8 MB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page