Common Voice
'Common Voice' | |
---|---|
datenaro pri voĉo • amaskunlaboro | |
Priskribo | projekto por krei liberan datumbazon por komputila Parol-rekonado. |
Retadreso | commonvoice |
Posedanto | Mozilla-Fondaĵo |
Common Voice | ||
---|---|---|
datenaro pri voĉo amaskunlaboro | ||
Komenco | 19-a de junio 2017 vd | |
Retejo | Oficiala retejo | |
Common Voice, en Esperanto Komuna Voĉo, estas projekto de la Mozilla-Fondaĵo por krei liberan datumbazon por komputila parolrekonado (ankaŭ nomata 'voĉrekonado'). La celo estas krei bonegan voĉan rekonilon kaj povi rekoni ajnan voĉon, ajnan akĉenton. La projekton subtenas volontuloj, kiuj per mikrofono povas registri frazojn, kaj kiuj povas per aŭskultilo validigi registraĵojn de aliuloj.[1]
Kontribuado al la projekto estas tre simpla kaj postulas neniun registriĝon, kvankam eblas indiki salutnomon, retpoŝton kaj la originon (akĉento). Oni povas kontribui per du manieroj, ĉefe: "Paroli" aŭ "Aŭskulti". La retejo povas esti uzata kun labortablaj kaj moveblaj aparatoj, tamen por la operaciumo IOS necesas instali la oficialan aplikaĵon de la App Store.
Ekde januaro 2021 la projekto akceliĝis, kiam esperantistaj uzantoj de la ĉifromono Miriado decidis stimuli la projekton per transpagoj al voĉlegantoj. [2]
Kontribui "Parolante"
[redakti | redakti fonton]Irante al la oficiala retejo de la projekto, iru al la sekcio "Paroli" kaj registru la frazojn, kiuj aperas sur la ekrano.
Kontribui "Aŭskultante"
[redakti | redakti fonton]Per la sekcio "Aŭskulti" oni povas kontribui, reviziante la frazojn registritajn de aliaj uzantoj, do kontrolante, ke la registrita frazo kongruas kun la reala frazo.
Konto-kreado
[redakti | redakti fonton]Oni ankaŭ povas registri konton kaj aliri "rezervitan" areon: Panelo. En ĉi tiu sekcio oni povas vidi la rangotabelon de kunlaborantoj el la tuta mondo aŭ nur la lingvojn al kiuj oni kontribuas. Dank' al la konto eblas ankaŭ spuri la progresojn faritajn: kiuj estas la registritaj frazoj, kiom el tiuj estas aprobitaj, kaj ankaŭ la procento el la validigitaj frazoj. Oni ankaŭ povas "forigi" sian profilon iam ajn. Tiamaniere la registritaj frazoj estos forigitaj el la aro de datumoj.
Elŝuti la datumbazon
[redakti | redakti fonton]La datumbazo estas disponebla laŭ la permesilo CC0.[3][4]. En Junio 2020 la datumbazon havis pli ol 83 horojn da voĉregistroj en Esperanto, faritaj de pli ol 505 personoj. Nur 9% de la voĉoj estas inaj; krome, homoj pli junaj ol 18 aŭ pli maljunaj ol 40 estas subreprezentitaj en la datumbazo.
La datumaroj estas publike kaj senpage elŝuteblaj el la sekcio "Datumaroj". Oni povas elŝuti la preferatan lingvon el tiuj disponeblaj. Estas, antaŭ ol elŝuti, iuj informoj kiel la grando de la dosiero, la horoj da validigitaj dosieroj, la totalaj horoj, la nombro de voĉoj, akĉentoj, aĝoj, sekso kaj aliaj datumoj.
versio | grandeco | validigitaj horoj / Entutaj horoj | nombro de voĉoj | detaloj |
---|---|---|---|---|
2019-02-25 | 176 mb | 4/6 | 53 | 21% Vira 10% Ina |
2019-06-11 | 450 mb | 13/16 | 129 | 51% Vira 11% Ina |
2019-06-24 | 447 mb | 13/16 | 129 | 51% Vira 11% Ina |
2019-12-10 | 1 GB | 35/41 | 215 | 79% Vira 7% Ina |
2020-06-22 | 2 GB | 83/89 | 505 | 73% Vira 9% Ina |
2020-12-11 | 3 GB | 90/102 | 574 | 74% Vira 8% Ina |
2021-07-21 | 17 GB | 748/844 | 1 066 | 72% Vira 9% Ina |
2022-01-19 | 37 GB | 1407/1856 | 1 415 | 69% Vira 11% Ina |
2022-04-27 | 37 GB | 1430/1864 | 1 498 | 69% Vira 11% Ina |
Rezultoj
[redakti | redakti fonton]Programoj:
- La parolrekona modelo de la tipo "Vosk" de la firmao Alpha Cephei, kreita uzante Esperantlingvajn datumojn de Common Voice havas erarofteco de 7.24%. Eblas uzi ĝin i.a. por krei subtekstojn en la programo Kdenlive.[6]
- En 2022 Jacob Nordfalk kreis la Android-an aplikaĵon "Esperanta Parolrekono", kiu uzas Vosk-n por krei voĉan klavaron en Esperanto por Android-aj poŝtelefonoj.[7]
- La anroida apo Sayboard estas alia voĉa klavaro kiu uzas Vosk kaj subtenas Esperanton. [8]
Referencoj
[redakti | redakti fonton]- ↑ https://www.liberafolio.org/2020/01/20/virinaj-vocoj-mankas-en-esperanta-datumaro/
- ↑ [1]Libera Folio: "Ĉifromono rapidigas parolrekonon en Esperanto"
- ↑ https://ikso.net/nova-projekto-de-mozilla-ebligos-al-masinoj-paroli-en-esperanto/
- ↑ https://revuoesperanto.org/projekto_de_mozilla
- ↑ [2] Datumaroj
- ↑ Vosk modelo en Esperanto en la retejo de Alpha Cephei
- ↑ Esperanta Parolrekono ĉe Google Play Store
- ↑ Sayboard ĉe F-Droid
Eksteraj ligiloj
[redakti | redakti fonton]- Oficiala retejo en Esperanto
- Retejo pri la Esperanta versio de KV
- Common Voice en GitHub
- Sentence Collector - ilo por kolekti kaj validigi novajn frazojn por la projekto
- Tradukado de la retejo per pontoon
- Esperanta laborejo de la projekto GitHub
- Common Voice en Esperanto: kiel kaj por kiu, jutuba filmeto de Slavik Ivanov esperante
- Frazoj en Esperanto por Komuna Voĉo, jutuba filmeto de Slavik Ivanov esperante
- Komuna Voĉo: la tria epizodo de publika kontribuado, jutuba filmeto de Slavik Ivanov esperante
- Akĉentoj en Esperanto: apo CV Project por taksi registraĵojn de Komuna Voĉo, jutuba filmeto de Slavik Ivanov esperante
- #esperanto:mozilla.org - Matrix-kanalo en Esperanto