Jump to content

Воспроизведение паттерна

паттерна Воспроизведение [1] [2] — это раннее говорящее устройство, которое было создано доктором Франклином С. Купером и его коллегами, в том числе Джоном М. Борстом и Кэрил Хаскинс , в лабораториях Хаскинса в конце 1940-х годов и завершено в 1950 году. Существовало несколько различных версий этого аппаратного устройства. В настоящее время выживает только один. Машина преобразует изображения акустических паттернов речи в виде спектрограммы обратно в звук. Используя это устройство, Элвин Либерман , Фрэнк Купер и Пьер Делаттр (позже к ним присоединились Кэтрин Саффорд Харрис , Ли Лискер и другие) смогли обнаружить акустические сигналы для восприятия фонетических сегментов (согласных и гласных). Эти исследования имели основополагающее значение для разработки современных методов синтеза речи , читающих машин для слепых, изучения восприятия и распознавания речи , а также развития моторной теории восприятия речи .

Для создания звука машина воспроизведения паттернов использует источник дугового света, который направлен на вращающийся диск с 50 концентрическими дорожками, прозрачность которых систематически меняется, чтобы создать 50 гармоник основной частоты. Далее свет проецируется на спектрограмму , коэффициент отражения которой соответствует уровню звукового давления части сигнала, а затем направляется на фотоэлектрический элемент, с помощью которого изменение света преобразуется в изменения звукового давления.

Воспроизведение паттернов последний раз использовалось Робертом Ремезом в экспериментальном исследовании в 1976 году. Сейчас воспроизведение паттернов находится в Музее лабораторий Хаскинса в Нью-Хейвене, штат Коннектикут .

Техника воспроизведения паттернов теперь также относится, в более общем плане, к алгоритмам или методам преобразования спектрограмм , кохлеаграмм и коррелограмм из изображений обратно в звуки.

Демонстрация в телешоу Adventure . Новаторские технологии в психолингвистике (телевидение CBS, 1953). [3]

Воспроизведение цифрового паттерна

[ редактировать ]

В 1970-х годах воспроизведение цифровых паттернов начало вытеснять более раннюю версию. Ранний прототип был разработан Патриком Наем, Филипом Рубином и коллегами из Haskins Laboratories . Он объединил в себе «повсеместный анализатор спектра» [1]. для автоматического спектрального анализа вместе с процессором дисплея VAX GT-40 для графического манипулирования отображаемой спектрограммой (форма «синтеза посредством искусства») и последующего повторного синтеза с использованием 40-канального банка фильтров. Это гибридное аппаратно-программное воспроизведение цифровых шаблонов было в конечном итоге заменено в Haskins Laboratories системой анализа и отображения HADES , разработанной Филипом Рубином и реализованной на Фортране на VAX компьютерах семейства . Более современная версия была описана Араи и его коллегами [2] . Доступна онлайн-демонстрация [3] .

См. также

[ редактировать ]
  1. ^ «Лаборатории Хаскинса» . Haskins.yale.edu . Проверено 21 октября 2016 г. [ постоянная мертвая ссылка ]
  2. ^ «История синтеза речи, 1770 – 1970» . Линг.су.се. ​08.07.1997. Архивировано из оригинала 06 марта 2015 г. Проверено 21 октября 2016 г.
  3. ^ 【1950 | Машина воспроизведения шаблонов】 Доктор Франклин С. Купер - Устройство раннего общения в 1950 году , получено 26 февраля 2023 г.

Библиография

[ редактировать ]
  • Купер Ф.С., Либерман А.М. и Борст Дж.М. Взаимное преобразование слышимых и видимых образов как основа исследования восприятия речи. Труды Национальной академии наук , 1951, 37, 318–325.
  • Купер, Франклин С., Делатр, Пьер К., Либерман, А.М., Борст, Дж.М. и Герстман, Л.Дж., Некоторые эксперименты по восприятию синтетических звуков речи. Журнал Акустического общества Америки , 1952, 24, 597–606.
  • Купер, Франклин С., Некоторые инструментальные средства исследования речи. В отчете четвертого ежегодного круглого стола по лингвистике и преподаванию языков . Вашингтон, округ Колумбия: Институт языков и лингвистики Джорджтаунского университета, 1953, 46–53.
  • Дж. М. Борст, Использование спектрограмм для анализа и синтеза речи, J. Audio Eng. Соц. , 4, 14–23, 1956.
  • Либерман, Элвин М., Некоторые результаты исследований восприятия речи. Журнал Акустического общества Америки , 1957, 29, 117–123.
  • Ремез, Роберт Э., Адаптация границы категорий между речью и неречевостью: аргументы против детекторов признаков. Когнитивная психология , 1979, 11, 38-57.
  • Малькольм Слейни . Воспроизведение шаблонов с 1950 по 1995 год. Материалы конференции IEEE по системам, человеку и кибернетике 1995 года . 22–25 октября 1995 г., Ванкувер, Канада.
  • Малкольм Слейни, Воспроизведение шаблонов в 90-х, в книге «Достижения в области нейронных систем обработки информации» 7 , Джеральд Тезауро, Дэвид Турецкий и Тодд Лин (ред.), MIT Press, Кембридж, Массачусетс, 1995.
  • Т. Араи, К. Ясу и Т. Гото, Воспроизведение цифровых образов, Proc. Встреча осени. Акуст. Соц. Япония , 429-430, 2005.
  • Т. Араи, К. Ясу и Т. Гото, Воспроизведение цифровых образов: преобразование спектрограмм в звук в образовательных целях, Acoust. наук. & Техн. , 27(6), 393-395, 2006 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b5da9698da45e002e361c8918618fa29__1698136320
URL1:https://arc.ask3.ru/arc/aa/b5/29/b5da9698da45e002e361c8918618fa29.html
Заголовок, (Title) документа по адресу, URL1:
Pattern playback - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)