Общий голос
![]() | |
Разработчик(и) | Фонд Мозиллы |
---|---|
Первоначальный выпуск | 19 июня 2017 г |
Репозиторий | github |
Доступно в | Многоязычный ( Список языков ) |
Лицензия | Creative Commons CC0 |
Веб-сайт | commonvoice.mozilla.org |
Common Voice — это краудсорсинговый проект, начатый Mozilla с целью создания бесплатной базы данных для программного обеспечения для распознавания речи . Проект поддерживают волонтеры , которые записывают примеры предложений с помощью микрофона и просматривают записи других пользователей. Расшифрованные предложения будут собраны в голосовой базе данных, доступной под общественного достояния лицензией CC0 . Эта лицензия гарантирует, что разработчики могут использовать базу данных для приложений преобразования голоса в текст без ограничений и затрат.
Цели
[ редактировать ]Common Voice стремится предоставить разнообразные образцы голоса. По словам Катарины Борхерт из Mozilla , многие существующие проекты брали наборы данных из общественного радио или иным образом имели наборы данных, в которых недостаточно представлены как женщины, так и люди с ярко выраженным акцентом. [1]
История
[ редактировать ]В начале 2022 года Bengali.AI в партнерстве с Common Voice запустила проект «Распознавание речи бенгальского языка», цель которого — заставить машины понимать язык бангла . Было собрано 2000 часов голоса с целью набрать более 10 000 часов. [2]
Голосовая база данных
[ редактировать ]Первый набор данных был опубликован в ноябре 2017 года. Более 20 000 пользователей по всему миру записали 500 часов английских предложений. [3]
В феврале 2019 года в использование была выпущена первая партия языков. Сюда входило 18 языков: английский , французский , немецкий и китайский , а также менее распространенные языки, такие как валлийский и кабильский . В общей сложности это включало почти 1400 часов записанных голосовых данных от более чем 42 000 участников. [4]
По состоянию на июль 2020 года в базе данных накопилось 7226 часов голосовых записей на 54 языках, 5591 час из которых был проверен волонтерами. [5]
В мае 2021 года, после работ по добавлению киньяруанды , они получили грант на добавление кисуахили . [6]
В сентябре 2022 года было объявлено, что язык тви Ганы стал сотым языком, добавленным в базу данных Mozilla Common Voice. [7]
По состоянию на октябрь 2022 г. [update], Mozilla Common Voice официально собирает голосовые данные для следующих языков: [8]
- Абхазский
- арабский
- Армянский
- Ассамский
- Астурийский
- Башкирский
- Странный
- Баскский
- белорусский
- Бенгальский
- бретонский
- болгарский
- каталонский
- Китайский ( кантонский диалект и варианты мандаринского диалекта )
- чувашский
- чешский
- датский
- Дивехи
- Голландский
- Английский
- эсперанто
- Эрзя
- финский
- Французский
- фризский
- галисийский
- грузинский
- немецкий
- Греческий
- Гуарани
- Хауса
- Хаха Чин
- Неа
- венгерский
- индонезийский
- Интерлингва
- ирландский
- итальянский
- японский
- Кабиль
- казахский
- Киньяруанда
- корейский
- Курдский ( разновидности Центральный и Курманджи )
- киргизский
- латышский
- Луганда
- македонский
- малаялам
- мальтийский
- Маратхи
- Марийский ( луговой и горный сорта)
- Мокша
- Монгольский
- непальский
- Норвежский ( Нюнорск )
- Одия
- персидский
- Польский
- португальский
- панджаби
- румынский
- Ретороманский ( Сурсильван и Валладер ) разновидности
- Русский
- Мы строим
- Сантали
- Сараики
- Сардинский
- сербский
- словенский
- испанский
- суахили
- Шведский
- Тайваньский хоккиен
- тамильский
- татарский
- тайский
- Тигре
- Тигринья
- Ноутбук Топор
- Тви
- турецкий
- Верхнелужский
- Украинский
- Урду
- уйгурский
- Узбекский
- вьетнамский
- Вотич
- валлийский
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Почему мы разделяем ИИ на гендерные различия? Компании, занимающиеся голосовыми технологиями, стремятся стать более инклюзивными» . Хранитель . 11 января 2020 года. Архивировано из оригинала 19 декабря 2022 года . Проверено 19 апреля 2020 г.
- ^ «Bengali.AI: Демократизация исследований ИИ в Бангла» . Бизнес-стандарт . 2022-12-23. Архивировано из оригинала 24 декабря 2022 г. Проверено 25 декабря 2022 г.
- ^ «Анонсируем первый выпуск модели распознавания речи Mozilla с открытым исходным кодом и набора голосовых данных» . блог mozilla.org . 29 ноября 2017 года. Архивировано из оригинала 29 ноября 2017 года . Проверено 19 ноября 2019 г.
- ^ «Mozilla обновляет набор данных Common Voice, добавив 1400 часов речи на 18 языках» . ВенчурБит . 28 февраля 2019 года. Архивировано из оригинала 4 марта 2019 года . Проверено 19 ноября 2019 г.
- ^ «Обновления Mozilla Common Voice помогут натренировать пробуждающее слово «Эй, Firefox» для голосового просмотра веб-страниц» . ВенчурБит . 1 июля 2020 года. Архивировано из оригинала 10 марта 2021 года . Проверено 1 апреля 2021 г.
- ^ «Mozilla Common Voice получила инвестиции в размере 3,4 миллиона долларов на демократизацию и диверсификацию голосовых технологий в Восточной Африке» . Фонд Мозилла . 25 мая 2021 г. Архивировано из оригинала 19 декабря 2022 г. Проверено 3 июня 2021 г.
- ^ Онукву, Александр (23 сентября 2022 г.). «Самый популярный язык Ганы теперь добавлен в Mozilla Common Voice» . Кварц . Архивировано из оригинала 2 декабря 2022 года . Проверено 3 октября 2022 г.
- ^ «Языки» . commonvoice.mozilla.org . Архивировано из оригинала 24 декабря 2022 года . Проверено 4 октября 2022 г.