Обновление голосовых данных Mozilla Common Voice 20

Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился с 32.6 до 33.1 тысячи часов речи, из которых 22.1 тысячи часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 129 до 133 – добавлены языки арагонский, исиндебеле, южный сото и тупури.

В подготовке материалов на английском языке приняли участие 94.9 тысяч человек, надиктовавших 3631 час речи (было 93.9 тысячи участников и 3587 часов). Набор для белорусского языка охватывает 8521 участника и 1860 часов речевого материала (было – 8444 участников и 1846 часов), русского языка – 3365 участников и 281 час (было 3296 участников и 278 часов), узбекского – 2211 участников и 265 часов (было 2200 участников и 265 часов), украинского языка – 1120 участника и 114 часов (было 1104 участник и 114 часов).

Проект Common Voice организует совместную работу по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи без ограничений можно использовать в системах машинного обучения и в исследовательских проектах.

Release. Ссылка here.