Jump to content

Общий голос

Общий голос
Разработчик(и) Фонд Мозиллы
Первоначальный выпуск 19 июня 2017 г .; 7 лет назад ( 19.06.2017 )
Репозиторий github /общий голос /общий голос
Доступно в Многоязычный ( Список языков )
Лицензия Creative Commons CC0
Веб-сайт commonvoice.mozilla.org

Common Voice — это краудсорсинговый проект, начатый Mozilla с целью создания бесплатной базы данных для программного обеспечения для распознавания речи . Проект поддерживают волонтеры , которые записывают примеры предложений с помощью микрофона и просматривают записи других пользователей. Расшифрованные предложения будут собраны в голосовой базе данных, доступной под общественного достояния лицензией CC0 . Эта лицензия гарантирует, что разработчики могут использовать базу данных для приложений преобразования голоса в текст без ограничений и затрат.

Common Voice стремится предоставить разнообразные образцы голоса. По словам Катарины Борхерт из Mozilla , многие существующие проекты брали наборы данных из общественного радио или иным образом имели наборы данных, в которых недостаточно представлены как женщины, так и люди с ярко выраженным акцентом. [1]

В начале 2022 года Bengali.AI в партнерстве с Common Voice запустила проект «Распознавание речи бенгальского языка», цель которого — заставить машины понимать язык бангла . Было собрано 2000 часов голоса с целью набрать более 10 000 часов. [2]

Голосовая база данных

[ редактировать ]

Первый набор данных был опубликован в ноябре 2017 года. Более 20 000 пользователей по всему миру записали 500 часов английских предложений. [3]

В феврале 2019 года в использование была выпущена первая партия языков. Сюда входило 18 языков: английский , французский , немецкий и китайский , а также менее распространенные языки, такие как валлийский и кабильский . В общей сложности это включало почти 1400 часов записанных голосовых данных от более чем 42 000 участников. [4]

По состоянию на июль 2020 года в базе данных накопилось 7226 часов голосовых записей на 54 языках, 5591 час из которых был проверен волонтерами. [5]

В мае 2021 года, после работ по добавлению киньяруанды , они получили грант на добавление кисуахили . [6]

В сентябре 2022 года было объявлено, что язык тви Ганы стал сотым языком, добавленным в базу данных Mozilla Common Voice. [7]

По состоянию на октябрь 2022 г. , Mozilla Common Voice официально собирает голосовые данные для следующих языков: [8]

См. также

[ редактировать ]
  1. ^ «Почему мы разделяем ИИ на гендерные различия? Компании, занимающиеся голосовыми технологиями, стремятся стать более инклюзивными» . Хранитель . 11 января 2020 года. Архивировано из оригинала 19 декабря 2022 года . Проверено 19 апреля 2020 г.
  2. ^ «Bengali.AI: Демократизация исследований ИИ в Бангла» . Бизнес-стандарт . 2022-12-23. Архивировано из оригинала 24 декабря 2022 г. Проверено 25 декабря 2022 г.
  3. ^ «Анонсируем первый выпуск модели распознавания речи Mozilla с открытым исходным кодом и набора голосовых данных» . блог mozilla.org . 29 ноября 2017 года. Архивировано из оригинала 29 ноября 2017 года . Проверено 19 ноября 2019 г.
  4. ^ «Mozilla обновляет набор данных Common Voice, добавив 1400 часов речи на 18 языках» . ВенчурБит . 28 февраля 2019 года. Архивировано из оригинала 4 марта 2019 года . Проверено 19 ноября 2019 г.
  5. ^ «Обновления Mozilla Common Voice помогут натренировать пробуждающее слово «Эй, Firefox» для голосового просмотра веб-страниц» . ВенчурБит . 1 июля 2020 года. Архивировано из оригинала 10 марта 2021 года . Проверено 1 апреля 2021 г.
  6. ^ «Mozilla Common Voice получила инвестиции в размере 3,4 миллиона долларов на демократизацию и диверсификацию голосовых технологий в Восточной Африке» . Фонд Мозилла . 25 мая 2021 г. Архивировано из оригинала 19 декабря 2022 г. Проверено 3 июня 2021 г.
  7. ^ Онукву, Александр (23 сентября 2022 г.). «Самый популярный язык Ганы теперь добавлен в Mozilla Common Voice» . Кварц . Архивировано из оригинала 2 декабря 2022 года . Проверено 3 октября 2022 г.
  8. ^ «Языки» . commonvoice.mozilla.org . Архивировано из оригинала 24 декабря 2022 года . Проверено 4 октября 2022 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b10977e2d465319fb166cdac42a91d95__1716089280
URL1:https://arc.ask3.ru/arc/aa/b1/95/b10977e2d465319fb166cdac42a91d95.html
Заголовок, (Title) документа по адресу, URL1:
Common Voice - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)