Common Voice

Common Voice — краудсорсинговый проект, запущенный Mozilla для создания бесплатной базы данных для программного обеспечения распознавания речи. Проект поддерживается волонтерами, которые записывают образцы предложений с помощью микрофона и прослушивают записи других пользователей. Транскрибированные предложения будут собраны в базу данных голосов, доступную под лицензией CC0, являющейся общественным достоянием. Эта лицензия гарантирует, что разработчики могут использовать эту базу данных для голосовых приложений без ограничений и затрат.

Common Voice

Тип voice dataset[d] и Краудсорсинг
Разработчик Mozilla Foundation
Языки интерфейса Многоязычный (список языков)
Первый выпуск 2017 июня 19 (19-06-2017)
Лицензия Creative Commons CC0
Сайт voice.mozilla.org
 Медиафайлы на Викискладе

Common Voice появился как ответ голосовым помощникам крупных компаний, таких как Amazon Echo, Siri или Google Assistant.

Голосовая база данных

База данных English Common Voice является второй по величине свободно доступной голосовой базой данных после LibriSpeech. К моменту публикации первых данных 29 ноября 2017 года, более 20 000 пользователей по всему миру записали 400 000 подтвержденных предложений, общей продолжительностью 500 часов.[1]

В феврале 2019 года была выпущена первая партия языков. В неё вошли 18 языков: английский, французский, немецкий и мандаринский китайский, но также и менее распространенные языки, такие как валлийский и кабильский. В общей сложности она включала почти 1400 часов записанных голосовых данных от более чем 42 000 авторов.[2]

Примечания

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.