Кеннет Н. Стивенс

Из Википедии, бесплатной энциклопедии
Кеннет Ноубл Стивенс
Рожденный ( 1924-03-24 ) 24 марта 1924 г.
Умер 19 августа 2013 г. ( 2013-08-19 ) (89 лет)
Национальность Канадский
Гражданство НАС
Альма-матер Массачусетский технологический институт , Университет Торонто
Награды Национальная медаль науки (1999 г.)
Научная карьера
Поля Электротехника , Акустическая фонетика
Учреждения С
Докторантура Лео Беранек
Другие научные консультанты Дж. К. Р. Ликлайдер , Уолтер А. Розенблит
Докторанты Джеймс Л. Фланаган
Кэрол Эспи-Уилсон
Лоуренс Р. Рабинер
Виктор Ю
Абир Алван

Кеннет Ноубл Стивенс (24 марта 1924 г.) [1] – 19 августа 2013 г.) был профессором электротехники и информатики Кларенса Дж. Лебеля, а также профессором медицинских наук и технологий в исследовательской лаборатории электроники Массачусетского технологического института . Стивенс был руководителем группы речевой коммуникации. [2] работал в исследовательской лаборатории электроники Массачусетского технологического института (RLE) и был одним из ведущих в мире ученых в области акустической фонетики .

Он был награжден Национальной медалью науки от президента Билла Клинтона в 1999 году и премией IEEE Джеймса Л. Фланагана в области обработки речи и звука в 2004 году.

Он умер в 2013 году от осложнений болезни Альцгеймера . [3]

Образование [ править ]

образование Раннее

Кен Стивенс родился 23 марта 1924 года в Торонто. [4] Его старший брат Пит родился в Англии; Кен родился четыре года спустя, вскоре после того, как семья эмигрировала в Канаду. Его детской мечтой было стать врачом, потому что он восхищался дядей, который был врачом. [5] Он учился в средней школе при отделе образования Университета Торонто .

Стивенс учился в инженерной школе Университета Торонто на полную стипендию. Все студенческие годы он жил дома. Хотя сам Стивенс не мог сражаться во Второй мировой войне из-за нарушения зрения, его брат отсутствовал всю войну; его родители каждый вечер слушали BBC, чтобы следить за обновлениями. [5] Стивенс специализировался в области инженерной физики в университете. [6] охватывающие темы от проектирования моторизованных машин до основ физики, которые преподаются на физическом факультете. Летом он работал в оборонной промышленности, в том числе одно лето в компании, занимавшейся разработкой радаров. В 1945 году он получил степени SB и SM. [7]

Стивенс работал учителем еще со студенческих лет, когда читал лекции по разделам домоводства, которые включали некоторые аспекты физики. [5] После получения степени магистра он остался в Университете Торонто в качестве преподавателя, преподавая курсы молодым людям, вернувшимся с войны, в том числе своему старшему брату. [5] Он был членом Фонда Онтарио с 1945 по 1946 год, затем до 1948 года работал преподавателем в Университете Торонто. [7]

Во время магистерских исследований Стивенс заинтересовался теорией управления и посещал курсы на факультете прикладной математики, где один из его профессоров рекомендовал ему подать заявление в Массачусетский технологический институт для получения докторской степени.

Докторантура [ править ]

Вскоре после того, как Стивенс поступил в Массачусетский технологический институт, новый профессор по имени Лео Беранек заметил, что Стивенс занимается акустикой. Беранек связался со Стивенсом в Торонто, чтобы спросить, будет ли он ассистентом преподавателя нового курса Беранека по акустике, и Стивенс согласился. Вскоре после этого Беранек снова связался со Стивенсом, чтобы предложить ему должность исследователя в новом речевом проекте, на что Стивенс также согласился. Радиационная лаборатория Массачусетского технологического института (корпус 20) после войны была преобразована в Научно-исследовательскую лабораторию электроники (РЛЭ); Среди других лабораторий в RLE разместилась новая акустическая лаборатория Беранека.

В ноябре 1949 года [8] Офис рядом с офисом Кена был отдан приглашенному докторанту из Швеции по имени Гуннар Фант , с которым у него сложились дружба и сотрудничество, которые продлились более полувека. Стивенс сосредоточился на изучении гласных во время своей докторской диссертации; в 1950 году он опубликовал короткую статью, в которой утверждал, что автокорреляция может использоваться для распознавания гласных. [9] в то время как в его докторской диссертации 1952 года сообщалось о результатах восприятия гласных, синтезированных с использованием набора электронных резонаторов. [10] Фант убедил Стивенса, что модель речевого тракта с линией передачи более гибкая, чем модель резонатора, и они вместе опубликовали эту работу в 1953 году. [11]

Кен благодарит Фанта за сотрудничество между факультетом лингвистики и исследовательской лабораторией электроники Массачусетского технологического института. [5] Роман Якобсон , фонолог из Гарварда , к 1957 году работал в Массачусетском технологическом институте, а Моррис Халле присоединился к лингвистическому факультету Массачусетского технологического института и перешёл в RLE в 1951 году. Сотрудничество Стивенса с Галле началось с акустики, [12] но сосредоточился на том, как акустика и артикуляция организуют звуковые системы языка. [13] [14] [15]

Стивенс защитил докторскую диссертацию в 1952 году; в его докторский комитет входили его советник Лео Беранек , а также Дж. К. Р. Ликлайдер и Уолтер А. Розенблит . [5] После получения докторской степени Стивенс пошел работать в компанию Bolt, Beranek and Newman (ныне BBN Technologies ) на Гарвард-сквер. [5] В начале 1950-х Беранек решил уйти с факультета Массачусетского технологического института, чтобы работать полный рабочий день в BBN. Он знал, что Стивенс любит преподавать, поэтому посоветовал Стивенсу подать заявку на должность преподавателя Массачусетского технологического института. Стивенс так и сделал и поступил на факультет в 1954 году.

Исследования, обслуживание обучение и

Научный вклад

Стивенс наиболее известен своим вкладом в области фонологии , восприятия речи и производства речи . Самая известная книга Стивенса «Акустическая фонетика». [16] организован по особенностям фонологической системы Стивенса.

в фонологию Вклад

Стивенс, пожалуй, наиболее известен своим предложением теории, которая отвечает на вопрос: почему звуки языков мира (их фонемы или сегменты) так похожи друг на друга? При первом изучении иностранного языка человека поражают удивительные различия, которые могут существовать между звуковой системой одного языка и любой другой. Стивенс перевернул восприятие студента с ног на голову: вместо того, чтобы спрашивать, почему языки различны, он спросил: если звуковая система каждого языка совершенно произвольна, почему языки так похожи? Его ответ — квантовая теория речи . [17] Квантовая теория поддерживается теорией изменения языка, разработанной в сотрудничестве с Сэмюэлем Джеем Кейзером , которая постулирует существование избыточных или улучшающих функций. [18]

Методика Стивенса в исследовании звуков речи состоит из трех этапов. Первый шаг — использовать физику (в основном модели трубок) для моделирования формы артикуляторов (например, формы передней и задней полости, округление или неокругление губ и т. д.). На основе моделей артикуляционной трубки можно рассчитать резонансные частоты, которые являются формантными частотами. После расчета резонансных частот речевые данные собираются и анализируются для сравнения с теоретическими расчетами. Этот второй этап является в основном экспериментальным, на котором знаки интереса обычно записываются либо изолированно, либо встраиваются в контролируемую несущую фразу, обычно произносимую несколькими носителями языка как женщинами, так и мужчинами. Ключом к сбору данных является контроль как можно большего количества факторов, чтобы интересующие акустические данные можно было исследовать с минимальным количеством артефактов. Последний этап исследования заключается в сравнении результатов данных с теоретическими предсказаниями и учете возникающих различий. Различия иногда можно объяснить тем фактом, что модели ламп обычно упрощаются, чтобы не учитывать потери из-за мягкости голосовых стенок (хотя в теоретическую модель можно добавить резисторы). Подсвязочная система также может влиять на продуктивную систему голосового тракта, когда голосовое отверстие велико (см. исследование подсвязочного резонанса на влияние речи). Предсказания теоретической модели могут дать общие прогнозы о том, что можно ожидать найти в реальной речи, а данные реальной речи также могут помочь уточнить исходную модель и дать лучшее понимание образования звуков речи.

Квантовая теория стремится элегантно описать (с помощью физики) и организовать все акустические характеристики всех возможных звуков в матрицу. (См. главу пятую в книге «Акустика, фонетика»). Окончательным ограничением всех звуков речи является сама физическая артикуляционная система, что подтверждает утверждение о том, что в языках может быть только конечный набор звуков. Причина, по которой набор речевых звуков конечен, заключается в том, что, хотя движение артикуляторов непрерывно, только определенные конфигурации имеют тенденцию быть артикуляционно и/или акустически стабильными, что приводит к фиксированию частот для формант, образующих звуки, относительно универсальные для всех. языки (т.е. гласные и согласные). Таким образом, каждый акустический звук можно описать несколькими определяющими признаками (обычно двоичными). Например, функция скругления губ (включенная или выключенная) является функцией. Высота языка (высокая или низкая) – еще одна особенность. В дополнение к этим определяющим характеристикам, которые служат основным описанием акустических звуков, существуют также улучшающие характеристики, которые помогают сделать звуки более узнаваемыми. Для каждой из этих особенностей можно применить методологию Стивенса, чтобы сначала использовать модель трубки для моделирования артикуляторов и спрогнозировать резонансные частоты, затем собрать данные для изучения акустических свойств этой особенности и, наконец, согласовать ее с теоретической моделью и суммируйте акустические свойства этого объекта.

Чтобы познакомиться с миром науки о речи, можно сначала прочитать книгу Денеса П. и Пинсона Э. «Речевая цепочка», где дается широкий обзор производства и передачи речи. Знакомятся со спектрограммами и формантными частотами, которые являются основным акустическим описанием звуковых сегментов.

голосовая щель [ править ]

Когда голосовые связки вибрируют, потоки воздуха проталкиваются (фильтруются) голосовым трактом, производя звук. Этот источник звука моделируется как источник тока в схеме, моделирующей производство звука. Изменения в речевом тракте могут привести к изменению производимого звука. Частота вибрации голосовых связок у женщин, как правило, выше, чем у мужчин, что делает женский голос более высоким, чем мужской.

Исследования (Hanson, HM, 1997) показали, что существует разница между тем, как женщины и мужчины вибрируют голосовые связки; Женская голосовая щель шире разбросана, что придает женским голосам более хриплый характер, чем мужским.

подглоточная система [ править ]

Подголосовая система относится к системе, которая находится под голосовой щелью в организме человека. В его состав входят трахея , бронхи и легкие . По сути, это фиксированная система, поэтому она не меняется для каждого отдельного динамика. Результаты исследований показали, что во время открытой фазы голосового цикла (когда голосовая щель открыта) связь вводится за счет подголосовой системы, акустически проявляясь в виде пар полюс/ноль в частотной области. Предполагается, что эти пары полюс/ноль, возникающие в результате связи, служат запрещенными или нестабильными областями в спектрах, служащими естественными границами для таких характеристик гласных , как + передний или + задний.

У взрослых мужчин резонансные частоты подсвязочной системы были измерены (инвазивными методами) и составили 600, 1550 и 2200 Гц. (Акустическая фонетика, стр. 197, Ишизака и др., Crane & Boves). Подглоточные резонансные частоты самок несколько выше из-за их меньших размеров. Одним из неинвазивных способов измерения этих пиков является использование акселерометра, помещенного над грудинной вырезкой (Henke), для регистрации ускорения кожи во время фонации. Вибрация будет захватывать резонансные частоты ниже голосовой щели (подгортанной системы).

голосовой тракт [ править ]

Голосовой тракт — это проход, расположенный над голосовой щелью, вплоть до открытия губ. Для моделирования речевого тракта обычно используется модель с двумя трубками: одна отражает размер (площадь поперечного сечения и длину) задней полости, а другая моделирует переднюю полость. Резонансные частоты, рассчитанные на основе модели трубки, являются формантными частотами. Для образования гласной шва /ə/ голосовой тракт относительно открыт на всем пути от голосовой щели до рта, поэтому модель трубки можно рассматривать как относительно однородную открытую трубку, в которой резонансные частоты (или форманты) находятся на равном расстоянии друг от друга. . Излучение во рту приведет к тому, что эти резонансные частоты будут примерно на пять процентов ниже. (Акустическая фонетика, стр. 139) Женские голосовые тракты (в среднем 14,1 см) в среднем короче мужских голосовых путей (в среднем 17,7 см), что делает их формантные частоты более высокими, чем у мужчин.

Поскольку стенки речевого тракта мягкие, в речевом тракте теряется энергия, что увеличивает пропускную способность формант.

носовая полость [ править ]

Когда небно-глоточный порт открывается во время произнесения определенных звуков, таких как /n/ и /m/, происходит сопряжение с военно-морской полостью, что придает звуку носовой характер.

восприятие речи Вклад в

Квантовая теория предполагает, что фонологический запас языка определяется в первую очередь акустическими характеристиками каждого сегмента, а границы определяются акустико-артикуляционным отображением. Подразумевается, что фонологические сегменты должны обладать некоторой акустической инвариантностью. [19] Блюмштейн и Стивенс [20] продемонстрировал то, что казалось инвариантной связью между акустическим спектром и воспринимаемым звуком: добавляя энергию к спектру всплеска «па» на определенной частоте, можно превратить его в «та» или «ка» соответственно, в зависимости от на частоте. Наличие дополнительной энергии вызывает восприятие языкового согласного; его отсутствие вызывает восприятие губ.

Недавняя работа Стивенса реструктурировала теорию акустической инвариантности в неглубокую иерархическую модель восприятия, модель акустических ориентиров и отличительных особенностей .

Вклад в производство речи [ править ]

Во время творческого отпуска в KTH в Швеции в 1962 году Стивенс вызвался участвовать в экспериментах по кинорадиографии , проводимых Свеном Оманом. Кинорадиографические фильмы Стивенса относятся к числу наиболее широко распространяемых; копии существуют на лазерных дисках, а некоторые доступны в Интернете. [21]

Вернувшись в Массачусетский технологический институт, Стивенс согласился руководить исследованиями студента-стоматолога по имени Джозеф С. Перкелл. Знания Перкелла в области анатомии полости рта позволили ему перенести рентгеновские снимки Стивенса на бумагу и опубликовать результаты. [22]

Другие вклады в изучение речеобразования включают модель, с помощью которой можно предсказать спектральную форму турбулентного речевого возбуждения (в зависимости от размеров турбулентной струи), а также работы, связанные с конфигурациями голосовых связок, которые приводят к различным режимам фонации. [23]

Фактически, спектральные свойства (форманты, полоса пропускания формант, другие голосовые характеристики) всех возможных звуковых фонем во всех языках теоретически можно смоделировать и предсказать с помощью моделей резонаторов, основанных на физике. Базовые трубчатые резонаторы можно использовать для общего прогнозирования формант гласных. Дополнительное уточнение базовой модели используется путем добавления в модель резисторов и/или конденсаторов для представления потерь энергии из-за стенок речевого тракта. Акустическая связь, обусловленная подсвязочной системой, также может быть смоделирована путем добавления дополнительных трубок к модели исходного речевого тракта, вводя полюс/ноль в спектры, которые представляют эффекты подголосовой связи. (Местоположения этих пар полюс/ноль являются резонансными частотами подглоточной системы). Голосовые характеристики, такие как высота голоса (F0), коэффициент открытия (H1-H2) и степень дыхания (H1-A3), также можно смоделировать и измерить на основе спектров. (Хэнсон и Стивенс).

наставник как Стивенс

Стивенс присоединился к Массачусетскому технологическому институту в качестве доцента в 1954 году. [24] Он стал доцентом в 1957 году, профессором в 1963 году и был назначен профессором под председательством Кларенса Дж. Лебеля в 1977 году. [7] Один из его давних соратников, Деннис Клатт (написавший DECtalk , работая в лаборатории Стивенса), сказал: «Как лидер Кен известен своей преданностью студентам и своей чудесной способностью управлять загруженной лабораторией, одновременно делая вид, что управляет ею». по принципу доброжелательной анархии». [4]

Первая докторская диссертация, которую Стивенс подписал в Массачусетском технологическом институте, была написана его однокурсником Джеймсом Л. Фланаганом в 1955 году. Фланаган поступил в аспирантуру Массачусетского технологического института в том же году, что и Стивенс, но без предварительной степени магистра; он получил степень магистра в 1950 году под руководством Беранека, затем защитил докторскую диссертацию под руководством Стивенса в 1955 году. [25]

По оценкам Стивенса в 2001 году, он руководил примерно сорока докторами наук. кандидаты. [5]

По случаю получения им Золотой медали Акустического общества Америки в 1995 году коллеги написали о Speech Group Стивенса, что «за почти четыре десятилетия своего существования» она «добилась выдающихся результатов в поддержке, которую она оказала женщины-исследователи, многие из которых впоследствии заняли высшие эшелоны исследовательских лабораторий по всему миру». [4] Коллеги назвали лабораторию Стивенса «национальным достоянием». [6]

Профессиональное обслуживание [ править ]

Стивенс был активным членом Акустического общества Америки с тех пор, как был аспирантом. Он был членом исполнительного совета с 1963 по 1966 год. [26] Вице-президент с 1971 по 1972 год и президент Общества с 1976 по 1977 год. [27] Он является членом ASA. В 1983 году он получил Серебряную медаль в области речевой коммуникации , а в 1995 году он получил Золотую медаль общества. [4]

Стивенс также активно работал в IEEE , где он имел звание IEEE Life Fellow. В 2004 году Кен Стивенс и Гуннар Фант стали первыми совместными лауреатами премии IEEE Джеймса Л. Фланагана в области обработки речи и звука . [28]

Стивенс был членом Американской академии искусств и наук , членом Национальной инженерной академии . [29] член Национальной академии наук , [30] США в 1999 году и лауреат Национальной медали науки . [6]

Ссылки [ править ]

  1. Согласно документам о натурализации и его словам, он родился 23 марта 1924 года.
  2. ^ «Группа речевой коммуникации MIT» .
  3. ^ «Кеннет Стивенс, почетный профессор EECS, умирает в возрасте 89 лет» . mit.edu . 23 августа 2013 г.
  4. ^ Перейти обратно: а б с д «Золотая медаль Акустического общества Америки, 1995: Кеннет Н. Стивенс» . Архивировано из оригинала 27 июня 2007 г. Проверено 2 июля 2013 г.
  5. ^ Перейти обратно: а б с д Это ж г час «Стенограмма устной истории AIP - доктор Кеннет Стивенс» . Архивировано из оригинала 28 августа 2013 г. Проверено 2 июля 2013 г.
  6. ^ Перейти обратно: а б с «Д. Хальбер, «Профессор RLE Кеннет Стивенс выигрывает Национальную медаль науки», 1 января 2000 г.» . Январь 2000 года.
  7. ^ Перейти обратно: а б с «Резюме консалтинга в области сенсиметрики, Кеннет Н. Стивенс» .
  8. ^ «Гуннар Фант, «Фонетика и фонология за последние 50 лет», представлено на конференции «От звука к смыслу: более 50 лет открытий в речевой коммуникации», июнь 2004 г.» (PDF) .
  9. ^ «К. Н. Стивенс, «Автокорреляционный анализ звуков речи», J. Acoust. Soc. Am. 22: 769–771, 1950» . Архивировано из оригинала 2 июля 2013 г.
  10. ^ К. Н. Стивенс, «Восприятие звуков, сформированных резонансными контурами», 1952 . OCLC   15508683 .
  11. ^ «Стивенс К.Н., Касовски С. и Фант Г. (1953) Электрический аналог речевого тракта, Журнал Акустического общества Америки 25, 734–742» . Архивировано из оригинала 2 июля 2013 г.
  12. ^ Галле, Моррис; Кеннет Н. Стивенс (1959). «Анализ через синтез». Учеб. Семинар по сжатию и обработке речи. Том. 2 .
  13. ^ Стивенс, Кеннет Н.; Моррис Галле (1967). «Замечания об анализе путем синтеза и отличительных особенностей». Модели восприятия речи и зрительной формы, стр. 88–102 . МТИ Пресс. ISBN  9780262230261 .
  14. ^ Галле, Моррис; Кеннет Н. Стивенс (2002) [впервые напечатано в 1971 году]. «Заметки об особенностях гортани», стр. 45–61 . Мутон де Грюйтер. ISBN  9783110171433 .
  15. ^ Галле, Моррис; Кеннет Н. Стивенс (1979). «Некоторые размышления о теоретических основах фонетики». Границы исследования речевой коммуникации, стр. 335–349 . Академическая пресса. ISBN  9780124498501 .
  16. ^ К. Н. Стивенс (2000). Акустическая фонетика . Современные исследования в области лингвистики. МТИ Пресс. ISBN  9780262194044 .
  17. ^ К. Н. Стивенс (1968). Квантовая природа речи: данные артикуляционно-акустических данных .
  18. ^ К.Н. Стивенс; С. Дж. Кейзер (1989). « Основные особенности и их усиление согласных», Language 65 (1): 81–106». Язык . 65 (1): 81–106. дои : 10.2307/414843 . JSTOR   414843 .
  19. ^ С. Е. Блюмштейн; К. Н. Стивенс (1979). « Акустическая инвариантность в производстве речи: данные измерений спектральных характеристик стоповых согласных», J. Acoust. Soc. Am. 66 (4): 1001-1017» . Архивировано из оригинала 2 июля 2013 г.
  20. ^ С. Е. Блюмштейн; К. Н. Стивенс (1980). « Перцепционная инвариантность и спектры начала стоповых согласных в различных средах гласных», J. Acoust. Soc. Am. 67 (2): 648–662» . Архивировано из оригинала 2 июля 2013 г.
  21. ^ «Рентгеновский фильм Кена Стивенса на YouTube» . YouTube . Архивировано из оригинала 14 декабря 2021 г.
  22. ^ Джозеф С. Перкелл (1969). Физиология речевого производства: результаты и последствия количественного кинорентгенографического исследования (научная монография) . МТИ Пресс. ISBN  978-0262661706 .
  23. ^ Стивенс, Кеннет Н.; 平野実; Фонд, Голос (1981). Физиология голосовых связок, 1980, Минору Хирано и Кеннет Н. Стивенс, ред . Издательство Токийского университета. ISBN  978-0860082811 .
  24. ^ «От звука к смыслу: более 50 лет открытий в речевой коммуникации» . 11 мая 2004 г.
  25. ^ Фредерик Небекер (8 апреля 1997 г.). «Устная история IEEE: Джеймс Л. Фланаган» .
  26. ^ «Бывшие и нынешние должностные лица и члены Исполнительного совета Акустического общества Америки» . [ постоянная мертвая ссылка ]
  27. ^ «Визуальный архив Эмилио Сегре, Галерея президентов обществ-членов» .
  28. ^ «Сеть глобальной истории IEEE, Кеннет Н. Стивенс» . 2 февраля 2016 г.
  29. ^ «Члены NAE: доктор Кеннет Н. Стивенс» .
  30. ^ «Альбертс бросает вызов новым членам НАН» . Ученый . 8 июня 1998 г.

Внешние ссылки [ править ]