Od startu inicjatywy Common Voice Mozilla zebrała setki tysięcy próbek głosu za pośrednictwem strony internetowej i aplikacji iOS. Dziś udostępnia pierwszą wersję tej kolekcji głosów.


Zbiór ten zawiera blisko 400 000 nagrań od 20 000 różnych osób, co daje około 500 godzin wypowiedzi. Do tej pory jest to drugi co do wielkości ogólnodostępny zestaw danych głosowych, o którym wiemy, a ludzie na całym świecie cały czas dodają i sprawdzają nowe próbki.

Możecie pobrać dane już teraz.

Dostarczając ten nowy zbiór danych publicznych, Mozilla chce ułatwić tworzenie nowych, lepszych systemów rozpoznawania mowy (takich jak własna funkcja Deep Speech). Zaczęto od języka angielskiego, ale wkrótce będzie wspierać każdy język. – Mamy nadzieję, że dzięki naszej równoległej pracy nad mechanizmem speech-to-text, uda nam się udostępnić technologię mowy większej liczbie osób, które będą mogły wprowadzać innowacje i konkurować z większymi graczami – podkreśla Mozilla.

źródło: Mozilla

Kan