Jump to content

NETtalk (искусственная нейронная сеть)

Структура NETtalk.

NETtalk искусственная нейронная сеть . Это результат исследования, проведенного в середине 1980-х годов Терренсом Сейновски и Чарльзом Розенбергом. Целью NETtalk было создание упрощенных моделей, которые могли бы пролить свет на сложность изучения когнитивных задач человеческого уровня, и их реализацию в качестве коннекционистской модели, которая также могла бы научиться выполнять сопоставимые задачи. Авторы обучали его двумя способами: с помощью машины Больцмана и с помощью обратного распространения ошибки . [1]

NETtalk — это программа, которая учится произносить письменный текст на английском языке, показывая текст в качестве входных данных и сопоставляя фонетические транскрипции для сравнения. [2] [3]

Сеть была обучена на большом количестве английских слов и соответствующих им произношений и способна генерировать произношение невидимых слов с высоким уровнем точности. Успех сети NETtalk вдохновил на дальнейшие исследования в области генерации произношения и синтеза речи и продемонстрировал потенциал нейронных сетей для решения сложных НЛП задач . Результатом работы сети стал поток фонем, который передавался в DECtalk для создания слышимой речи. Он добился популярного успеха, появившись на Today шоу . [4] Процесс разработки был описан в интервью 1993 года. На создание обучающего набора данных ушло три месяца, а на обучение сети — всего несколько дней. [5]

Архитектура

[ редактировать ]

Сеть имела три слоя и 18 629 настраиваемых весов, что было большим по меркам 1986 года. Были опасения, что она будет перекрывать набор данных, но она была успешно обучена. Набор данных представлял собой подмножество Коричневого корпуса из 20 000 слов с аннотированными вручную фонемами и ударениями для каждой буквы. [4]

На входе сети 203 единицы, разделенные на 7 групп по 29 единиц в каждой. Каждая группа представляет собой горячую кодировку одного символа. Возможны 29 символов: 26 букв, запятая, точка и граница слова (пробел).

Скрытый слой имеет 80 единиц.

На выходе 26 единиц. 21 единица кодирует артикуляционные особенности (точку артикуляции, звонкость, высоту гласных и т. д.) фонем, а 5 единиц кодируют ударение и границы слогов.

Достижения и ограничения

[ редактировать ]

NETtalk был создан для изучения механизмов обучения правильному произношению английского текста. Авторы отмечают, что обучение чтению включает в себя сложный механизм, в котором задействованы многие участки человеческого мозга. NETtalk специально не моделирует этапы обработки изображений и распознавания букв зрительной корой . Скорее, предполагается, что буквы были предварительно классифицированы и распознаны, и эти последовательности букв, состоящие из слов, затем отображаются нейронной сети во время обучения и во время тестирования производительности. Задача NETtalk — изучить правильные ассоциации между правильным произношением и заданной последовательностью букв в зависимости от контекста, в котором эти буквы появляются. Другими словами, NETtalk учится использовать буквы вокруг произнесенной в данный момент фонемы , которые дают подсказки относительно ее предполагаемого фонематического отображения.

  1. ^ Сейновский, Терренс Дж. и Чарльз Р. Розенберг. « Параллельные сети, которые учатся произносить английский текст ». Сложные системы 1.1 (1987): 145-168.
  2. ^ Тьерри Дютуа (30 ноября 2001 г.). Введение в синтез речи . Springer Science & Business Media. стр. 123–. ISBN  978-1-4020-0369-1 .
  3. ^ Хинтон, Джеффри (1991). Коннекционистская обработка символов (первое изд.). Массачусетский технологический институт Пресс. стр. 161–163. ISBN  0-262-58106-Х .
  4. ^ Перейти обратно: а б Сейновски, Терренс Дж. (2018). Революция глубокого обучения . Кембридж, Массачусетс, Лондон, Англия: MIT Press. ISBN  978-0-262-03803-4 .
  5. ^ Говорящие сети: устная история нейронных сетей . Массачусетский технологический институт Пресс. 28 февраля 2000 г. ISBN  978-0-262-26715-1 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 7e550af1f1403c66b9184227f9d1419a__1721012340
URL1:https://arc.ask3.ru/arc/aa/7e/9a/7e550af1f1403c66b9184227f9d1419a.html
Заголовок, (Title) документа по адресу, URL1:
NETtalk (artificial neural network) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)