Skip to main content

Breton language speech-to-text tools

Project description

pypi version License: MIT

Anaouder mouezh e brezhoneg gant Vosk

Version française

Diorroet eo ar raktres-se a youl vat. Gallout a rit souten ar raktres gant un donezon : Liberapay

Gallout a reer ivez implij ar meziant dre ur c'hetal Web, savet gant Philippe Argouarch.

Petra eo ?

Un anaouder mouezh emgefre, diazezet war Vosk.
Gantañ e c'heller adskrivañ komzoù e brezhoneg (Son -> Skrid) dre ur mikro e amzer real pe diouzh restroù son.

Un nebeut perzhioù dedennus :

  • Skañv. Pouezh ar model a zo dindan 100 Mo ha treiñ a ra war ur bern mekanikoù : urzhiataerioù hep GPU, RaspberryPi, hezoug Android...
  • Prim. Gallout a reer adskrivañ ar son e amzer real, memes gant un urzhiataer kozh, pe primoc'h c'hoazh gant dafar nevesoc'h.
  • Lec'hel. Ezhomm ebet eus an Internet. Ho mouezh hag ho data a chomo war ho penveg, ha tretet e vint gant ho penveg nemetken. Kudenn surentez ebet liammet d'an treuzkas dre rouedad ha gwelloc'h a-fed ekologel.
  • Digoust ha dieub. Gellout a reoc'h azasaat ar meziant d'hoc'h ezhommoù pe enframmañ anezhañ e meziantoù all.

Dalc'hoù 'zo siwazh :

  • Poentadur ebet.
  • Kizidig d'an trouzioù endro.
  • Fall war ur bern pouezioù-mouezh c'hoazh.
  • Ret eo komz sklaer ha goustadik.

Gwellaet e vo efedusted an anaouder tamm-ha-tamm, gant ma vo kavet roadennoù mouezh adskrivet.
Ul lisañs dieub (doare Creative Commons) a aotrefe eskemm ar roadennoù-se en un doare aes.

Staliañ

Goude bezañ bet staliet Python3 e c'heller staliañ an anaouder dre an terminal :

pip install anaouder

Ur wech staliet ha pa vo kinniget modeloù efedusoc'h, e c'hellit nevesaat ar meziant gant :

pip install --upgrade anaouder

Adskrivañ ur restr son

Gant an urzh adskrivan en un terminal, e vo adskrivet ar pezh e vez komprenet gant an anaouder diouzh ur restr son. Ar wech kentañ ma vo peurgaset an urzh-se e vo ret deoc'h gortoz ur pennadig ma vefe pellkarget ha staliet ar modul static_ffmpeg (evit amdreiñ restroù son ha video).

adskrivan RESTR_SON_PE_VIDEO

Dre ziouer, adskrivet e vo pep tra e diabarzh an terminal. Gallout a rit ivez implij an opsion -o evit resisaat anv ur restr, e lec'h ma vo skrivet an titouroù. Tu zo implij an option-se gant an holl urzhioù eus ar meziant.

adskrivan RESTR_SON_PE_VIDEO -o DISOC'H.txt

Evit kaout listennad an opsionoù, implijit an opsion -h.

Implijout gant ur mikro

Dre an an urzh mikro e c'heller implij an anaouder gant ho vouezh e amzer real.

Ma n'ez eus skrid ebet o tont, klaskit niverenn an etrefas son gant :

mikro -l

Ha gant an niverenn-se :

mikro -d NIVERENN_ETREFAS

Linennañ ur teul skrid gant un teul son

M'ho peus un teul skrid adskrivet dre dorn (e stumm .txt) e c'heller linennañ ar skrid gant ar son, evit krouiñ ur restr istitloù (e stumm srt).

linennan RESTR_SON_PE_VIDEO RESTR_SKRID

Adskrivañ istitloù evit ur video

Gallout a rit adskrivañ istitloù diouzh teuliadoù son pe video, e stumm srt (Subrip).

istitlan RESTR_SON_PE_VIDEO -o istitloù.srt

An oberiadur-se a gemero kalzig a amzer (hervez padelezh an teuliad son). Klaskit gant un teul film berr da gentañ !

https://user-images.githubusercontent.com/10166907/213805292-63becbe2-ffb5-492f-9bac-1330c4b2d07d.mp4

Setu disoc'h an istitloù emgefre, hep cheñch netra. Kollet eo buan pa vez sonnerez...

Implijout gant meziantoù all

N'eo ket aliet dre ma vez kollet un nebeut perzhioù e-keñver ar pezh vez graet gant ar modul anaouder : adlakaat ar varennigoù-stag hag amdreiñ an niverennoù da skouer.

Ar model noazh a c'hellit kavout en dosser anaouder/models pe dre al liamm releases.

Audapolis

M'ho peus c'hoant implijout ar model gant ur etrefas grafikel e c'hellit mont da sellet ar raktres Audapolis.

Kdenlive

Gant ar meziant frammañ videoioù Kdenlive e c'heller adskrivañ istitloù en un doare emgefre ivez.
Ar mod-implij a c'heller kavout amañ.

Trugarez

Ar meziant-se zo bet diorroet o kemer harp war meziantoù dieub all : Kaldi, Vosk ha difazier Hunspell an Drouizig (evit naetaat an testennoù a-raok ar pleustr).
Lakaat da bleustriñ ar model a zo bet posubl a-drugarez d'an danvez prizius, krouet ha rannet gant ur bern tud all : ar raktres Mozilla Common Voice, enrolladennoù Dizale, Brezhoweb, RKB, Kaouen.net, Ya!, Becedia, abadennoù France3 ha Dastum.
Trugarez da Elen Cariou, Jean-Mari Ollivier, Karen Treguier, Mélanie Jouitteau ha Pêr Morvan evit o sikour hag o souten.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

anaouder-0.9.0.tar.gz (59.0 kB view hashes)

Uploaded Source

Built Distribution

anaouder-0.9.0-py3-none-any.whl (65.6 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page