Jump to content

Восприятие речи

(Перенаправлено из акустических реплик )

Восприятие речи – это процесс, посредством которого звуки языка слышны, интерпретируются и понимаются. Изучение восприятия речи тесно связано с областями фонологии и фонетики в лингвистике и когнитивной психологии и с восприятием в психологии . Исследования восприятия речи направлены на то, чтобы понять, как слушатели распознают звуки речи, и используют эту информацию для понимания разговорной речи. Исследования восприятия речи имеют применение при создании компьютерных систем, которые могут распознавать речь , для улучшения распознавания речи для слушателей с нарушениями слуха и языка, а также в преподавании иностранного языка.

Процесс восприятия речи начинается на уровне звукового сигнала и процесса прослушивания. (Полное описание процесса прослушивания см. в разделе «Слух ».) После обработки исходного слухового сигнала звуки речи подвергаются дальнейшей обработке для извлечения акустических сигналов и фонетической информации. Эту речевую информацию затем можно использовать для языковых процессов более высокого уровня, таких как распознавание слов.

Акустические сигналы

[ редактировать ]
Рисунок 1: Спектрограммы слогов «ди» (вверху), «да» (в центре) и «ду» (внизу), показывающие, как начальные формантные переходы , которые перцептивно определяют согласную [d], различаются в зависимости от идентичности следующей гласной. . ( Форманты выделены красными пунктирами; переходы — начала изгиба формантных траекторий.)

Акустические сигналы — это сенсорные сигналы, содержащиеся в звуковом сигнале речи, которые используются при восприятии речи для различения звуков речи, принадлежащих к разным фонетическим категориям. Например, одним из наиболее изученных сигналов речи является время начала голоса или VOT. VOT - это основной сигнал, сигнализирующий о разнице между звонкими и глухими взрывными звуками, такими как «b» и «p». Другие сигналы различают звуки, которые производятся в разных местах артикуляции или способах артикуляции . Речевая система также должна комбинировать эти сигналы, чтобы определить категорию конкретного звука речи. Об этом часто думают в терминах абстрактных представлений фонем . Эти представления затем можно объединить для использования в распознавании слов и других языковых процессах.

Нелегко определить, к каким акустическим сигналам чувствительны слушатели при восприятии того или иного звука речи:

На первый взгляд решение проблемы того, как мы воспринимаем речь, кажется обманчиво простым. Если бы можно было идентифицировать участки акустической волны, соответствующие единицам восприятия, то путь от звука к значению был бы ясен. Однако найти это соответствие или отображение оказалось крайне сложно даже после сорока пяти лет исследований этой проблемы. [1]

Если конкретный аспект формы акустического сигнала указывает на одну лингвистическую единицу, серии тестов с использованием синтезаторов речи будет достаточно, чтобы определить такой сигнал или сигналы. Однако есть два существенных препятствия:

  1. Один акустический аспект речевого сигнала может указывать на различные лингвистически значимые измерения. Например, продолжительность гласной в английском языке может указывать на то, является ли гласная ударной или находится ли она в слоге, закрытом звонким или глухим согласным, а в некоторых случаях (например, в американском английском /ɛ/ и /æ / ) он может различать идентичность гласных. [2] Некоторые эксперты даже утверждают, что длительность может помочь различать то, что в английском языке традиционно называют краткими и долгими гласными. [3]
  2. Одна языковая единица может определяться несколькими акустическими свойствами. Например, в классическом эксперименте Элвин Либерман (1957) показал, что начальные формантные переходы / d/ как фонема /d/ . различаются в зависимости от следующей гласной (см. рисунок 1), но все они интерпретируются слушателями [4]

Линейность и проблема сегментации

[ редактировать ]
Рисунок 2: Спектрограмма фразы «Я тебе должен». Чётко различимых границ между звуками речи нет.

Хотя слушатели воспринимают речь как поток дискретных единиц [ нужна ссылка ] ( фонемы , слоги и слова ), эту линейность трудно увидеть в физическом речевом сигнале (см. пример на рисунке 2). Звуки речи не следуют строго друг за другом, а перекрываются. [5] На звук речи влияют предшествующие и последующие. Это влияние может оказываться даже на расстоянии двух и более сегментов (и через границы слогов и слов). [5]

Поскольку речевой сигнал не является линейным, возникает проблема сегментации. Трудно выделить участок речевого сигнала как принадлежащий одной единице восприятия. Например, акустические свойства фонемы /d/ будут зависеть от образования следующей гласной (из-за коартикуляции ).

Отсутствие инвариантности

[ редактировать ]

Исследование и применение восприятия речи должно иметь дело с несколькими проблемами, возникающими из-за того, что было названо отсутствием инвариантности. Надежные постоянные связи между фонемой языка и ее акустическим проявлением в речи найти трудно. Для этого есть несколько причин:

Изменение, вызванное контекстом

[ редактировать ]

Фонетическая среда влияет на акустические свойства звуков речи. Например, /u/ в английском языке стоит на передней стороне, когда окружено корональными согласными . [6] Или время начала голоса , обозначающее границу между звонкими и глухими взрывными звуками, различно для губных, альвеолярных и велярных взрывных звуков и смещается под ударением или в зависимости от положения внутри слога. [7]

Вариация из-за разных речевых условий

[ редактировать ]

Одним из важных факторов, вызывающих вариации, является разная скорость речи. Многие фонематические контрасты состоят из временных характеристик (краткие и длинные гласные или согласные, аффрикаты и фрикативные звуки, взрывные звуки и скользящие, звонкие и глухие взрывные звуки и т. д.), и на них, безусловно, влияют изменения темпа речи . [1] Другим важным источником вариаций является артикуляционная тщательность и неряшливость, характерная для связной речи (артикуляционный «недолет», очевидно, отражается на акустических свойствах издаваемых звуков).

Изменение из-за разной личности говорящего

[ редактировать ]

Итоговая акустическая структура конкретных речевых произведений зависит от физических и психологических свойств отдельных говорящих. Мужчины, женщины и дети обычно издают голоса разной высоты. Поскольку речевые тракты говорящих имеют разный размер (особенно в зависимости от пола и возраста), резонансные частоты ( форманты ), которые важны для распознавания звуков речи, будут различаться по своим абсолютным значениям у разных людей. [8] (см. рисунок 3 для иллюстрации этого). Исследования показывают, что младенцы в возрасте 7,5 месяцев не могут распознавать информацию, представленную носителями разного пола; однако к 10,5 месяцам они могут обнаружить сходство. [9] Диалект и иностранный акцент также могут вызывать вариации, равно как и социальные характеристики говорящего и слушателя. [10]

Константность восприятия и нормализация

[ редактировать ]
Рисунок 3: На левой панели показаны три периферийные гласные американского английского языка /i/ , /ɑ/ и /u/ на стандартном графике F1 по F2 (в Гц). Несоответствие между мужскими, женскими и детскими ценностями очевидно. На правой панели формантные расстояния (в Барке ), а не абсолютные значения, показаны с использованием процедуры нормализации, предложенной Сырдалом и Гопалом в 1986 году. [11] Значения формант взяты из Hillenbrand et al. (1995) [8]

Несмотря на большое разнообразие говорящих и разные условия, слушатели воспринимают гласные и согласные как постоянные категории. Было высказано предположение, что это достигается посредством процесса нормализации восприятия, в котором слушатели отфильтровывают шум (т. е. вариации), чтобы прийти к основной категории. Различия в размерах голосовых трактов приводят к изменению формантной частоты у разных говорящих; поэтому слушатель должен настроить свою систему восприятия на акустические характеристики конкретного говорящего. Этого можно достичь, рассматривая соотношения формант, а не их абсолютные значения. [11] [12] [13] Этот процесс получил название нормализации голосового тракта (см. пример на рисунке 3). Аналогичным образом считается, что слушатели адаптируют восприятие продолжительности к текущему темпу речи, которую они слушают – это называется нормализацией скорости речи.

Имеет ли место нормализация на самом деле и какова ее точная природа, является предметом теоретических разногласий (см. теории ниже). Постоянство восприятия — явление, свойственное не только восприятию речи; оно существует и в других типах восприятия.

Категорическое восприятие

[ редактировать ]
Рисунок 4. Пример функций идентификации (красный) и дискриминации (синий).

Категориальное восприятие участвует в процессах перцептивной дифференциации. Люди воспринимают звуки речи категорично, то есть они чаще замечают различия между категориями (фонемами), чем внутри категорий. Таким образом, перцептивное пространство между категориями искривляется, центры категорий (или «прототипов») работают как решето. [14] или как магниты [15] для входящих звуков речи.

В искусственном континууме между глухим и звонким двугубным взрывным каждый новый шаг отличается от предыдущего количеством ВОТ . Первый звук — дозвонкий [б] , т. е. имеет отрицательный VOT. Затем, увеличивая ВОТ, оно достигает нуля, т.е. взрывной звук представляет собой простой безнаддувный глухой [р] . Постепенно, добавляя одинаковое количество VOT за раз, взрывной звук в конечном итоге превращается в глухой двугубный звук с сильным придыханием [pʰ] . (Такой континуум использовался в эксперименте Лискера и Абрамсона в 1970 году. [16] Звуки, которые они использовали, доступны в Интернете .) В этом континууме, например, из семи звуков, слушатели-носители английского языка идентифицируют первые три звука как /b/, а последние три звука как /p/ с четкой границей между двумя категориями. . [16] Тест двухальтернативной идентификации (или категоризации) даст прерывистую функцию категоризации (см. красную кривую на рисунке 4).

В тестах на способность различать два звука с разными значениями VOT, но с постоянным расстоянием VOT друг от друга (например, 20 мс), слушатели, скорее всего, будут работать на случайном уровне, если оба звука попадают в одну и ту же категорию и имеют значение около 100. %, если каждый звук попадает в другую категорию (см. синюю кривую дискриминации на рисунке 4).

Вывод, который следует сделать как по результатам идентификации, так и по тесту на дискриминацию, состоит в том, что слушатели будут иметь различную чувствительность к одному и тому же относительному увеличению числа голосовых слушателей в зависимости от того, была ли пересечена граница между категориями или нет. Подобная корректировка восприятия подтверждена и для других акустических сигналов.

Влияние сверху вниз

[ редактировать ]

В классическом эксперименте Ричард М. Уоррен (1970) заменил одну фонему слова кашляющим звуком. Перцептивно испытуемые без труда восстанавливали недостающий звук речи и не могли точно определить, какая фонема была нарушена. [17] явление, известное как эффект фонематического восстановления . Следовательно, процесс восприятия речи не обязательно является однонаправленным.

В другом базовом эксперименте сравнивалось распознавание естественно произносимых слов внутри фразы и тех же слов по отдельности, и было обнаружено, что в последнем случае точность восприятия обычно падает. Чтобы исследовать влияние семантических знаний на восприятие, Гарнес и Бонд (1976) аналогичным образом использовали предложения-носители, в которых целевые слова отличались только одной фонемой (например, гнедой/день/гей), качество которой менялось в течение континуума. Когда их помещали в разные предложения, каждое из которых естественным образом приводило к одной интерпретации, слушатели склонны судить о неоднозначных словах в соответствии со значением всего предложения. [18] . [19] То есть языковые процессы более высокого уровня, связанные с морфологией , синтаксисом или семантикой, могут взаимодействовать с основными процессами восприятия речи, помогая распознавать звуки речи.

Может случиться так, что слушателю не обязательно, а может быть, даже невозможно распознавать фонемы перед распознаванием более высоких единиц, таких как, например, слова. Получив из акустического сигнала хотя бы фундаментальную информацию о фонематической структуре воспринимаемого объекта, слушатели могут компенсировать отсутствующие или замаскированные шумом фонемы, используя свои знания разговорного языка. Компенсаторные механизмы могут действовать даже на уровне предложений, например, в выученных песнях, фразах и стихах, и этот эффект подкрепляется паттернами нейронного кодирования, соответствующими пропущенным фрагментам непрерывной речи. [20] несмотря на отсутствие всех соответствующих восходящих сенсорных данных.

Приобретенные нарушения речи

[ редактировать ]

Первая в истории гипотеза восприятия речи была использована у пациентов, у которых возник дефицит слухового понимания, также известный как рецептивная афазия . С тех пор было классифицировано множество нарушений, в результате чего было дано истинное определение «восприятия речи». [21] Термин «восприятие речи» описывает процесс интереса, который использует сублексические контексты для процесса исследования. Он состоит из множества различных языковых и грамматических функций, таких как: особенности, сегменты (фонемы), слоговая структура (единица произношения), фонологические формы слов (как звуки группируются вместе), грамматические особенности, морфемные (приставки и суффиксы) и смысловая информация (значение слов).В первые годы их больше интересовала акустика речи. Например, они изучали различия между /ba/ и /da/, но теперь исследования были направлены на реакцию мозга на раздражители. В последние годы была разработана модель, позволяющая понять, как работает восприятие речи; эта модель известна как модель двойного потока. Эта модель радикально изменилась по сравнению с тем, как психологи смотрят на восприятие. Первый раздел модели двойного потока — это вентральный путь. Этот путь включает среднюю височную извилину, нижнюю височную борозду и, возможно, нижняя височная извилина . Вентральный путь показывает фонологические представления лексическим или концептуальным представлениям, что является значением слов. Второй участок модели двойного потока — это дорсальный путь. Этот путь включает сильвиеву теменно-височную кору, нижнюю лобную извилину, переднюю островковую часть и премоторную кору. Его основная функция — воспринимать сенсорные или фонологические стимулы и переводить их в артикуляционно-двигательное представление (формирование речи). [22]

Афазия – это нарушение речевой обработки , вызванное повреждением головного мозга. Различные части речевой обработки страдают в зависимости от поврежденной области мозга, а афазия дополнительно классифицируется в зависимости от места повреждения или совокупности симптомов. Повреждение области Брока головного мозга часто приводит к выраженной афазии , которая проявляется нарушением речевой деятельности. Повреждение зоны Вернике часто приводит к рецептивной афазии , при которой нарушается обработка речи. [23]

Афазия с нарушением восприятия речи обычно проявляется поражениями или повреждениями, расположенными в левой височной или теменной долях . Лексические и семантические трудности являются общими, и понимание может быть нарушено. [23]

Агнозия — это «потеря или уменьшение способности распознавать знакомые объекты или стимулы, обычно в результате повреждения головного мозга». [24] Существует несколько различных видов агнозии, которые затрагивают все наши чувства, но наиболее распространенными, связанными с речью, являются речевая агнозия и фонагнозия .

Речевая агнозия . Чистая словесная глухота, или речевая агнозия, представляет собой нарушение, при котором человек сохраняет способность слышать, произносить речь и даже читать речь, но не может понимать или правильно воспринимать речь. Кажется, что эти пациенты обладают всеми навыками, необходимыми для правильной обработки речи, но у них нет опыта работы с речевыми стимулами. Пациенты сообщали: «Я слышу, как вы говорите, но не могу перевести это». [25] Хотя они физически воспринимают и обрабатывают речевые стимулы, не имея возможности определять смысл речи, они, по сути, вообще не способны воспринимать речь. Не существует известных методов лечения, но из тематических исследований и экспериментов известно, что речевая агнозия связана с поражением левого полушария или обоих, особенно с правосторонними височно-теменными дисфункциями. [26]

Фонагнозия : Фонагнозия связана с неспособностью узнавать знакомые голоса. В этих случаях речевые стимулы можно услышать и даже понять, но связь речи с определенным голосом теряется. Это может быть связано с «ненормальной обработкой сложных вокальных свойств (тембра, артикуляции и просодии — элементов, отличающих отдельный голос). [27] Не существует известного лечения; однако есть сообщение о женщине, страдающей эпилепсией, у которой наряду с другими нарушениями началась фонагнозия. Результаты ее ЭЭГ и МРТ показали «правое корково-теменное гиперинтенсивное поражение Т2 без усиления гадолиния и с дискретным нарушением диффузии молекул воды». [27] Таким образом, хотя никакого лечения не обнаружено, фонагнозия может коррелировать с постиктальной теменной кортикальной дисфункцией.

Восприятие речи младенцев

[ редактировать ]

Младенцы начинают процесс овладения языком , когда они способны обнаруживать очень небольшие различия между звуками речи. Они способны различать все возможные речевые контрасты (фонемы). Постепенно, по мере того, как они знакомятся со своим родным языком, их восприятие становится языково-специфичным, т.е. они учатся игнорировать различия внутри фонематических категорий языка (различия, которые вполне могут быть контрастными в других языках - например, в английском языке различаются две звонкости). категории взрывных звуков , тогда как в тайском языке есть три категории ; младенцы должны усвоить, какие различия являются отличительными в использовании их родного языка, а какие нет). По мере того, как младенцы учатся сортировать входящие звуки речи по категориям, игнорируя несущественные различия и усиливая контрастные, их восприятие становится категоричным . Младенцы учатся противопоставлять различные гласные фонемы своего родного языка примерно к 6 месяцам. Родные согласные контрасты приобретаются к 11 или 12 месяцам. [28] Некоторые исследователи предположили, что младенцы могут изучать звуковые категории своего родного языка посредством пассивного слушания, используя процесс, называемый статистическим обучением . Другие даже утверждают, что определенные звуковые категории являются врожденными, то есть генетически заданными (см. обсуждение врожденной и приобретенной категориальной различимости ).

Если однодневным младенцам предъявляют нормальный, ненормальный (монотонный) голос матери и голос незнакомца, они реагируют только на голос матери, говорящей нормально. Когда воспроизводится человеческий и нечеловеческий звук, младенцы поворачивают голову только в сторону источника человеческого звука. Было высказано предположение, что слуховое обучение начинается уже во внутриутробном периоде. [29]

Одним из методов, используемых для изучения восприятия речи младенцами, помимо процедуры поворота головы, упомянутой выше, является измерение скорости их сосания. В таком эксперименте ребенок сосет специальную соску под звуки звуков. Сначала устанавливается нормальная скорость сосания ребенка. Затем стимул воспроизводится повторно. Когда ребенок впервые слышит раздражитель, скорость сосания увеличивается, но по мере того, как ребенок привыкает к стимуляции, скорость сосания снижается и выравнивается. Затем ребенку воспроизводится новый стимул. Если ребенок воспринимает вновь введенный стимул как отличающийся от фонового, скорость сосания увеличится. [29] Скорость сосания и метод поворота головы — одни из наиболее традиционных поведенческих методов изучения восприятия речи. Среди новых методов (см. ниже «Методы исследования »), помогающих изучать восприятие речи, спектроскопия ближнего инфракрасного диапазона . у детей раннего возраста широко применяется [28]

Также было обнаружено, что хотя способность младенцев различать различные фонетические свойства разных языков начинает снижаться примерно в возрасте девяти месяцев, можно обратить вспять этот процесс, в достаточной степени знакомя их с новым языком. В исследовании, проведенном Патрицией К. Кул, Фэн-Минг Цао и Хуэй-Мэй Лю, было обнаружено, что если с младенцами разговаривает и взаимодействует с ними носитель китайского языка, их можно фактически подготовить к сохранению своих способностей. различать звуки речи на китайском языке, которые сильно отличаются от звуков речи в английском языке. Тем самым доказывая, что при правильных условиях можно предотвратить потерю у младенцев способности различать звуки речи на языках, отличных от тех, которые встречаются на родном языке. [30]

Межъязыковый и второй язык

[ редактировать ]

Большое количество исследований изучало, как пользователи языка воспринимают иностранную речь (так называемое восприятие межъязыковой речи) или речь на втором языке (восприятие речи на втором языке). Последнее относится к области овладения вторым языком .

Языки различаются по фонематическому запасу. Естественно, это создает трудности при знакомстве с иностранным языком. Например, если два звука иностранного языка отнесены к одной категории родного языка, то разницу между ними будет очень трудно различить. Классическим примером такой ситуации является наблюдение, что у японцев, изучающих английский язык, возникают проблемы с определением или различением английских жидких согласных /l/ и /r/ (см. «Восприятие английского языка /r/ и /l/ носителями японского языка »). [31]

Бест (1995) предложил модель перцептивной ассимиляции, которая описывает возможные модели ассимиляции межъязыковых категорий и предсказывает их последствия. [32] Флеге (1995) сформулировал модель обучения речи, которая сочетает в себе несколько гипотез о усвоении речи второго языка (L2) и которая, проще говоря, предсказывает, что звук L2, не слишком похожий на звук родного языка (L1), будет легче усвоить, чем звук L2, который относительно похож на звук L1 (поскольку обучающийся будет воспринимать его как более явно «отличающийся»). [33]

При нарушении речи или слуха

[ редактировать ]

Исследования того, как люди с нарушениями речи или слуха воспринимают речь, направлены не только на поиск возможных методов лечения. Это может дать представление о принципах, лежащих в основе нормального восприятия речи. [34] Примером могут служить два направления исследований:

Слушатели с афазией

[ редактировать ]

Афазия влияет как на выражение, так и на восприятие речи. Оба наиболее распространенных типа — экспрессивная афазия и рецептивная афазия — в некоторой степени влияют на восприятие речи. Выраженная афазия вызывает умеренные трудности понимания речи. Влияние рецептивной афазии на понимание гораздо более серьезное. Принято считать, что афазики страдают от дефицита восприятия. Они обычно не могут полностью различать место артикуляции и звонкости. [35] Что касается других функций, трудности различаются. Еще не доказано, страдают ли навыки восприятия речи низкого уровня у людей, страдающих афазией, или их трудности вызваны только нарушениями более высокого уровня. [35]

Слушатели с кохлеарными имплантами

[ редактировать ]

Кохлеарная имплантация восстанавливает доступ к акустическому сигналу у людей с нейросенсорной тугоухостью. Акустической информации, передаваемой имплантатом, обычно достаточно, чтобы пользователи имплантатов могли правильно распознавать речь знакомых им людей даже без визуальных подсказок. [36] Пользователям кохлеарного имплантата труднее понимать незнакомых говорящих и звуки. Перцептивные способности детей, получивших имплантат после двухлетнего возраста, значительно лучше, чем у тех, кому имплантировали во взрослом возрасте. Было показано, что ряд факторов влияет на характеристики восприятия, в частности: продолжительность глухоты до имплантации, возраст начала глухоты, возраст на момент имплантации (такие возрастные эффекты могут быть связаны с гипотезой критического периода ) и продолжительность использования имплантата. . Существуют различия между детьми с врожденной и приобретенной глухотой. Постлингвально глухие дети имеют лучшие результаты, чем прелингвально глухие, и быстрее адаптируются к кохлеарному имплантату. [36] У детей с кохлеарными имплантатами и нормальным слухом время появления гласных и голоса становится преобладающим в развитии раньше способности различать место артикуляции. Через несколько месяцев после имплантации у детей с кохлеарными имплантатами восприятие речи может нормализоваться.

Одна из фундаментальных проблем в изучении речи – как бороться с шумом. Об этом свидетельствует сложность распознавания человеческой речи, которую испытывают компьютерные системы распознавания. Хотя они могут хорошо распознавать речь, если обучены на голосе конкретного говорящего и в тихих условиях, эти системы часто плохо справляются с более реалистичными ситуациями прослушивания, когда люди понимают речь с относительной легкостью. Для имитации паттернов обработки, которые в нормальных условиях сохраняются в мозге, ключевым нейронным фактором является предварительные знания, поскольку надежная история обучения может в некоторой степени перекрывать экстремальные эффекты маскировки, возникающие при полном отсутствии непрерывных речевых сигналов. [20]

Музыкально-языковая связь

[ редактировать ]

Исследования взаимосвязи между музыкой и когнитивными способностями — новая область, связанная с изучением восприятия речи. Первоначально предполагалось, что нервные сигналы музыки обрабатываются в специализированном «модуле» в правом полушарии мозга. И наоборот, нейронные сигналы языка должны были обрабатываться аналогичным «модулем» в левом полушарии. [37] Однако исследования с использованием таких технологий, как аппараты фМРТ, показали, что две области мозга, которые традиционно считались исключительно обрабатывающими речь, области Брока и Вернике, также становятся активными во время музыкальной деятельности, такой как прослушивание последовательности музыкальных аккордов. [37] Другие исследования, например, проведенные Marques et al. в 2006 году показали, что 8-летние дети, прошедшие шестимесячное музыкальное обучение, продемонстрировали улучшение как показателей определения высоты звука, так и электрофизиологических показателей, когда их заставляли слушать неизвестный иностранный язык. [38]

И наоборот, некоторые исследования показали, что на наше восприятие музыки влияет не музыка, а родная речь. Одним из примеров является парадокс тритона . Парадокс тритона заключается в том, что слушателю предъявляют два сгенерированных компьютером тона (например, до и фа-диез), которые находятся на полоктавы (или тритона) друг от друга, а затем просят определить, является ли высота последовательности нисходящей или восходящий. Одно из таких исследований, проведенное г-жой Дианой Дойч, показало, что интерпретация слушателем восходящей или нисходящей высоты звука зависит от языка или диалекта слушателя, показывая различия между теми, кто вырос на юге Англии, и теми, кто вырос в Калифорнии, или теми, кто вырос во Вьетнаме и те жители Калифорнии, для которых родным языком был английский. [37] Второе исследование, проведенное в 2006 году на группе англоговорящих людей и трех группах студентов из Восточной Азии в Университете Южной Калифорнии, показало, что носители английского языка, начавшие музыкальное обучение в возрасте 5 лет или раньше, имели 8%-ный шанс иметь абсолютный слух. [37]

Речевая феноменология

[ редактировать ]

Опыт речи

[ редактировать ]

Кейси О'Каллаган в своей статье «Опыт речи » анализирует, отличается ли «перцептивный опыт прослушивания речи феноменальным характером» [39] что касается понимания языка, на котором слушают. Он утверждает, что опыт человека, когда он слышит язык, который он понимает, в отличие от опыта, когда он слушает язык, о котором он не знает, демонстрирует разницу в феноменальных особенностях , которые он определяет как «аспекты того, на что похож опыт». [39] для физического лица.

Если субъекту, который является носителем английского языка, предлагается стимул речи на немецком языке, цепочка фонем будет выглядеть как простые звуки и вызовет совершенно иной опыт, чем если бы точно такой же стимул был предъявлен субъекту, говорящему по-немецки. .

Он также исследует, как меняется восприятие речи при изучении языка. Если бы субъекту, не владеющему японским языком, был предоставлен стимул японской речи, а затем ему были даны точно такие же стимулы после изучения японского языка, у этого же самого человека был бы совершенно другой опыт.

Методы исследования

[ редактировать ]

Методы, используемые в исследовании восприятия речи, можно условно разделить на три группы: поведенческие, вычислительные и, в последнее время, нейрофизиологические методы.

Поведенческие методы

[ редактировать ]

Поведенческие эксперименты основаны на активной роли участника, т. е. испытуемым предъявляются стимулы и предлагается принять о них осознанное решение. Это может принимать форму теста на идентификацию, теста на распознавание , оценки сходства и т. д. Эксперименты такого типа помогают дать базовое описание того, как слушатели воспринимают и классифицируют звуки речи.

Синемавейв Речь

[ редактировать ]

Восприятие речи также анализировалось с помощью синусоидальной речи — формы синтетической речи, в которой человеческий голос заменяется синусоидальными волнами, имитирующими частоты и амплитуды, присутствующие в исходной речи. Когда испытуемым впервые знакомят с этой речью, синусоидальная речь интерпретируется как случайный шум. Но когда испытуемым сообщают, что стимулом на самом деле является речь, и рассказывают, что говорится, «происходит характерный, почти немедленный сдвиг». [39] тому, как воспринимается синусоидальная речь.

Вычислительные методы

[ редактировать ]

Компьютерное моделирование также использовалось для моделирования того, как речь может обрабатываться мозгом для формирования наблюдаемого поведения. Компьютерные модели использовались для решения нескольких вопросов восприятия речи, в том числе того, как сам звуковой сигнал обрабатывается для извлечения акустических сигналов, используемых в речи, и как речевая информация используется для процессов более высокого уровня, таких как распознавание слов. [40]

Нейрофизиологические методы

[ редактировать ]

Нейрофизиологические методы основаны на использовании информации, полученной в результате более прямых и не обязательно сознательных (предварительных) процессов. Испытуемым предъявляются речевые стимулы для выполнения различных типов задач и измеряются реакции мозга. Сам мозг может быть более чувствительным, чем кажется из-за поведенческих реакций. Например, испытуемый может не проявлять чувствительности к разнице между двумя звуками речи в тесте на различение, но реакции мозга могут выявить чувствительность к этим различиям. [28] Методы, используемые для измерения реакции нейронов на речь, включают потенциалы, связанные с событиями , магнитоэнцефалографию и спектроскопию ближнего инфракрасного диапазона . Одной из важных реакций, используемых с потенциалами, связанными с событием, является негативность несоответствия , которая возникает, когда речевые стимулы акустически отличаются от стимула, который субъект слышал ранее.

Нейрофизиологические методы были внедрены в исследования восприятия речи по нескольким причинам:

Поведенческие реакции могут отражать поздние сознательные процессы и зависеть от других систем, таких как орфография, и, таким образом, они могут маскировать способность говорящего распознавать звуки на основе акустического распределения более низкого уровня. [41]

Без необходимости принимать активное участие в тестировании можно протестировать даже младенцев; эта особенность имеет решающее значение при исследовании процессов приобретения. Возможность наблюдать слуховые процессы низкого уровня независимо от процессов более высокого уровня позволяет решить давние теоретические вопросы, например, обладает ли человек специализированным модулем восприятия речи. [42] [43] или лежит ли некая сложная акустическая инвариантность (см. отсутствие инвариантности выше). в основе распознавания речевого звука [44]

Теория двигателя

[ редактировать ]

Некоторые из самых ранних работ по изучению того, как люди воспринимают звуки речи, были проведены Элвином Либерманом и его коллегами из Haskins Laboratories . [45] Используя синтезатор речи, они создали звуки речи, которые менялись в зависимости от места артикуляции по континууму от /bɑ/ до /dɑ/ и до /ɡɑ/ . Слушателям предлагалось определить, какой звук они слышали, и отличить два разных звука. Результаты эксперимента показали, что слушатели группировали звуки в отдельные категории, хотя звуки, которые они слышали, постоянно менялись. На основании этих результатов они предложили понятие категориального восприятия как механизма, с помощью которого люди могут распознавать звуки речи.

Более поздние исследования с использованием различных задач и методов показывают, что слушатели очень чувствительны к акустическим различиям внутри одной фонетической категории, вопреки строгому категориальному подходу к восприятию речи.

Чтобы обеспечить теоретическое объяснение данных категориального восприятия , Либерман и его коллеги [46] разработал моторную теорию восприятия речи, где «сложное артикуляционное кодирование предполагалось декодируемым при восприятии речи теми же процессами, которые участвуют в производстве» [1] (это называется анализом через синтез). Например, английский согласный /d/ может различаться по своим акустическим деталям в разных фонетических контекстах (см. выше ), однако все звуки /d/ , воспринимаемые слушателем, попадают в одну категорию (звонкий альвеолярный взрывной звук), и это потому, что « лингвистические репрезентации — это абстрактные, канонические, фонетические сегменты или жесты, лежащие в основе этих сегментов». [1] Позднее при описании единиц восприятия Либерман отказался от артикуляционных движений и перешел к нейронным командам артикуляторам. [47] и даже позже к предполагаемым артикуляционным жестам, [48] таким образом, «нейронное представление высказывания, определяющее речь говорящего, представляет собой дистальный объект, который воспринимает слушатель». [48] Теория тесно связана с гипотезой модульности , которая предполагает существование модуля специального назначения, который считается врожденным и, вероятно, специфичным для человека.

Теорию критиковали за невозможность «представить объяснение того, как акустические сигналы преобразуются в предполагаемые жесты». [49] слушателями. Кроме того, неясно, как индексальная информация (например, личность говорящего) кодируется/декодируется вместе с лингвистически значимой информацией.

Образцовая теория

[ редактировать ]

Примерные модели восприятия речи отличаются от четырех упомянутых выше теорий, которые предполагают, что нет никакой связи между распознаванием слов и говорящего и что различия между говорящими являются «шумом», который необходимо отфильтровать.

Подходы, основанные на примерах, утверждают, что слушатели хранят информацию для распознавания как слов, так и говорящего. Согласно этой теории, в памяти слушателя сохраняются отдельные экземпляры звуков речи. В процессе восприятия речи запомненные экземпляры, например, слога, хранящиеся в памяти слушателя, сравниваются с входящим стимулом, чтобы можно было классифицировать стимул. Аналогичным образом, при распознавании говорящего активируются все следы памяти высказываний, произведенных этим говорящим, и определяется личность говорящего. В пользу этой теории свидетельствуют несколько экспериментов, о которых сообщил Джонсон. [13] это предполагает, что наша идентификация сигналов более точна, когда мы знакомы с говорящим или когда у нас есть визуальное представление о поле говорящего. Когда говорящий непредсказуем или неправильно идентифицирован пол, частота ошибок при определении слов намного выше.

Образцовые модели сталкиваются с несколькими возражениями, два из которых: (1) недостаточная емкость памяти для хранения каждого когда-либо услышанного высказывания и, что касается способности воспроизводить услышанное, (2) сохраняются ли или вычисляются также собственные артикуляционные жесты говорящего. при произнесении высказываний, которые звучали бы как слуховые воспоминания. [13] [49]

Акустические ориентиры и отличительные особенности

[ редактировать ]

Кеннет Н. Стивенс предложил акустические ориентиры и отличительные особенности как связь между фонологическими особенностями и слуховыми свойствами. Согласно этой точке зрения, слушатели проверяют входящий сигнал на наличие так называемых акустических ориентиров, которые представляют собой определенные события в спектре, несущие информацию о жестах, которые их вызвали. Поскольку эти жесты ограничены возможностями артикуляторов человека, а слушатели чувствительны к их слуховым коррелятам, отсутствие инвариантности в этой модели просто не существует. Акустические свойства достопримечательностей являются основой для установления отличительных особенностей. Связки из них однозначно определяют фонетические сегменты (фонемы, слоги, слова). [50]

Предполагается, что в этой модели входящий акустический сигнал сначала обрабатывается для определения так называемых ориентиров, которые представляют собой особые спектральные события в сигнале; например, гласные обычно характеризуются более высокой частотой первой форманты, согласные могут определяться как разрывы сигнала и иметь более низкие амплитуды в нижних и средних областях спектра. Эти акустические особенности являются результатом артикуляции. Фактически, вторичные артикуляционные движения могут использоваться, когда необходимо усиление ориентиров из-за внешних условий, таких как шум. Стивенс утверждает, что коартикуляция вызывает лишь ограниченное и, более того, систематическое и, следовательно, предсказуемое изменение сигнала, с которым способен справиться слушатель. Поэтому в рамках этой модели просто утверждается, что то, что называется отсутствием инвариантности, не существует.

Ориентиры анализируются для определения тех или иных артикуляционных событий (жестов), связанных с ними. На следующем этапе акустические сигналы извлекаются из сигнала вблизи ориентиров посредством мысленного измерения определенных параметров, таких как частоты спектральных пиков, амплитуды в низкочастотной области или время.

Следующий этап обработки включает в себя консолидацию акустических сигналов и выделение отличительных признаков. Это бинарные категории, связанные с артикуляцией (например, [+/- высокая], [+/- задняя часть], [+/- круглые губы] для гласных; [+/- сонорная], [+/- боковая] или [ +/- носовой] для согласных.

Совокупность этих признаков однозначно идентифицирует сегменты речи (фонемы, слоги, слова). Эти сегменты являются частью словаря, хранящегося в памяти слушателя. Его единицы активируются в процессе лексического доступа и сопоставляются с исходным сигналом, чтобы выяснить, совпадают ли они. В противном случае делается еще одна попытка с другим шаблоном-кандидатом. Таким итеративным способом слушатели реконструируют артикуляционные события, необходимые для создания воспринимаемого речевого сигнала. Поэтому это можно охарактеризовать как анализ через синтез.

Таким образом, эта теория утверждает, что дистальным объектом восприятия речи являются артикуляционные жесты, лежащие в основе речи. Слушатели понимают смысл речевого сигнала, обращаясь к ним. Модель относится к моделям, называемым анализом через синтез.

Нечетко-логическая модель

[ редактировать ]

Нечетко-логическая теория восприятия речи, разработанная Домиником Массаро. [51] предлагает, чтобы люди запоминали звуки речи вероятностным или поэтапным способом. Это предполагает, что люди запоминают описания единиц восприятия языка, называемых прототипами. В каждом прототипе могут сочетаться различные функции. Однако признаки не просто бинарные (истинные или ложные), существует нечеткое значение, соответствующее тому, насколько вероятно, что звук принадлежит к определенной речевой категории. Таким образом, при восприятии речевого сигнала наше решение о том, что мы на самом деле слышим, основывается на относительной точности соответствия информации о стимуле значениям конкретных прототипов. Окончательное решение основывается на множестве особенностей или источников информации, даже визуальной (это объясняет эффект Макгерка ). [49] Компьютерные модели теории нечеткой логики использовались, чтобы продемонстрировать, что предсказания теории о классификации звуков речи соответствуют поведению слушателей. [52]

Гипотеза речевого режима

[ редактировать ]

Гипотеза речевого режима — это идея о том, что восприятие речи требует использования специализированной умственной обработки. [53] [54] Гипотеза речевого режима является ответвлением теории модульности Фодора (см. Модульность сознания ). Он использует механизм вертикальной обработки, при котором ограниченные стимулы обрабатываются специальными областями мозга, специфичными для конкретных стимулов. [54]

Две версии гипотезы речевого режима: [53]

  • Слабая версия – прослушивание речи предполагает предварительное знание языка.
  • Сильная версия – прослушивание речи задействует специальные речевые механизмы для восприятия речи.

В поисках доказательств гипотезы речевого режима возникли три важные экспериментальные парадигмы. Это дихотическое слушание , категориальное восприятие и дуплексное восприятие . [53] В ходе исследований в этих категориях было обнаружено, что может существовать не конкретный режим речи, а режим для слуховых кодов, требующих сложной слуховой обработки. Также кажется, что модульность изучается в системах восприятия. [53] Несмотря на это, доказательства и контрдоказательства гипотезы речевого режима все еще неясны и требуют дальнейших исследований.

Теория прямого реализма

[ редактировать ]

Теория прямого реализма восприятия речи (в основном связанная с Кэрол Фаулер ) является частью более общей теории прямого реализма , которая постулирует, что восприятие позволяет нам иметь прямое осознание мира, поскольку оно предполагает прямое восстановление дистального источника речи. воспринимаемое событие. Что касается восприятия речи, теория утверждает, что объектами восприятия являются реальные движения речевого тракта или жесты, а не абстрактные фонемы или (как в теории моторики) события, которые причинно предшествуют этим движениям, то есть предполагаемые жесты. Слушатели воспринимают жесты не посредством специализированного декодера (как в «Теории моторики»), а потому, что информация в акустическом сигнале определяет жесты, которые его формируют. [55] Утверждая, что реальные артикуляционные жесты, производящие различные звуки речи, сами являются единицами восприятия речи, теория обходит проблему отсутствия инвариантности .

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б с д Найгаард, Л.К., Пизони, Д.Б. (1995). «Восприятие речи: новые направления в исследованиях и теории». В Дж. Л. Миллере; П.Д. Эймас (ред.). Справочник по восприятию и познанию: речь, язык и общение . Сан-Диего: Академическая пресса. {{cite encyclopedia}}: CS1 maint: несколько имен: список авторов ( ссылка )
  2. ^ Клатт, Д.Х. (1976). «Лингвистическое использование сегментной продолжительности в английском языке: акустические и перцептивные данные». Журнал Акустического общества Америки . 59 (5): 1208–1221. Бибкод : 1976ASAJ...59.1208K . дои : 10.1121/1.380986 . ПМИД   956516 .
  3. ^ Галле, М., Моханан, КП (1985). «Сегментарная фонология современного английского языка». Лингвистический запрос . 16 (1): 57–116. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ Либерман, AM (1957). «Некоторые результаты исследований восприятия речи» (PDF) . Журнал Акустического общества Америки . 29 (1): 117–123. Бибкод : 1957ASAJ...29..117L . дои : 10.1121/1.1908635 . hdl : 11858/00-001M-0000-002C-5789-A . Архивировано из оригинала (PDF) 3 марта 2016 г. Проверено 17 мая 2007 г.
  5. ^ Перейти обратно: а б Фаулер, Калифорния (1995). «Речевое производство». В Дж. Л. Миллере; П.Д. Эймас (ред.). Справочник по восприятию и познанию: речь, язык и общение . Сан-Диего: Академическая пресса.
  6. ^ Хилленбранд, Дж. М., Кларк, М. Дж., Нири, Т. М. (2001). «Влияние среды согласных на форманты гласных». Журнал Акустического общества Америки . 109 (2): 748–763. Бибкод : 2001ASAJ..109..748H . дои : 10.1121/1.1337959 . ПМИД   11248979 . S2CID   10751216 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  7. ^ Лискер Л., Абрамсон А.С. (1967). «Некоторые эффекты контекста на время появления голоса в английских взрывных звуках» (PDF) . Язык и речь . 10 (1): 1–28. дои : 10.1177/002383096701000101 . ПМИД   6044530 . S2CID   34616732 . Архивировано из оригинала (PDF) 3 марта 2016 г. Проверено 17 мая 2007 г. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  8. ^ Перейти обратно: а б Хилленбранд Дж., Гетти Л.А., Кларк М.Дж., Уиллер К. (1995). «Акустические характеристики гласных американского английского языка». Журнал Акустического общества Америки . 97 (5, ч. 1): 3099–3111. Бибкод : 1995ASAJ...97.3099H . дои : 10.1121/1.411872 . ПМИД   7759650 . S2CID   10104073 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  9. ^ Хьюстон, Дерек М.; Юсчик, Питер В. (октябрь 2000 г.). «Роль информации, специфичной для говорящего, в сегментации слов младенцами» (PDF) . Журнал экспериментальной психологии: человеческое восприятие и деятельность . 26 (5): 1570–1582. дои : 10.1037/0096-1523.26.5.1570 . ПМИД   11039485 . Архивировано из оригинала (PDF) 30 апреля 2014 г. Проверено 1 марта 2012 г.
  10. ^ Привет, Дженнифер; Драгер, Кэти (2010). «Мягкие игрушки и восприятие речи». Лингвистика . 48 (4): 865–892. дои : 10.1515/LING.2010.027 . S2CID   143639653 .
  11. ^ Перейти обратно: а б Сырдал, АК ; Гопал, HS (1986). «Перцептивная модель распознавания гласных, основанная на слуховом представлении гласных американского английского». Журнал Акустического общества Америки . 79 (4): 1086–1100. Бибкод : 1986ASAJ...79.1086S . дои : 10.1121/1.393381 . ПМИД   3700864 .
  12. ^ Стрэндж, В. (1999). «Восприятие гласных: динамическое постоянство». В Дж. М. Пикетте (ред.). Акустика речевого общения: основы, теория восприятия речи и технология . Нидхэм-Хайтс (Массачусетс): Аллин и Бэкон.
  13. ^ Перейти обратно: а б с Джонсон, К. (2005). «Нормализация говорящего при восприятии речи» (PDF) . В Пизони, Д.Б.; Ремез Р. (ред.). Справочник по восприятию речи . Оксфорд: Издательство Блэквелл . Проверено 17 мая 2007 г.
  14. ^ Трубецкой, Николай С. (1969). Принципы фонологии . Беркли и Лос-Анджелес: Издательство Калифорнийского университета. ISBN  978-0-520-01535-7 .
  15. ^ Айверсон П., Куль П.К. (1995). «Отображение эффекта перцептивного магнита для речи с использованием теории обнаружения сигналов и многомерного масштабирования». Журнал Акустического общества Америки . 97 (1): 553–562. Бибкод : 1995ASAJ...97..553I . дои : 10.1121/1.412280 . ПМИД   7860832 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  16. ^ Перейти обратно: а б Лискер Л., Абрамсон А.С. (1970). «Звуковое измерение: некоторые эксперименты по сравнительной фонетике» (PDF) . Учеб. 6-й Международный конгресс фонетических наук . Прага: Академия. стр. 563–567. Архивировано из оригинала (PDF) 3 марта 2016 г. Проверено 17 мая 2007 г. {{cite conference}}: CS1 maint: несколько имен: список авторов ( ссылка )
  17. ^ Уоррен, РМ (1970). «Восстановление недостающих звуков речи». Наука . 167 (3917): 392–393. Бибкод : 1970Sci...167..392W . дои : 10.1126/science.167.3917.392 . ПМИД   5409744 . S2CID   30356740 .
  18. ^ Гарнес С., Бонд З.С. (1976). «Взаимосвязь между акустической информацией и семантическим ожиданием». Фонология 1976 . Инсбрук. стр. 285–293. {{cite conference}}: CS1 maint: несколько имен: список авторов ( ссылка )
  19. ^ Чонман А., Ван Ю, Ким Б.Х. (декабрь 2003 г.). «Вклад семантической и лицевой информации в восприятие несвистящих фрикативов» (PDF) . Дж. Язык речи. Слышать. Рез . 46 (6): 1367–77. дои : 10.1044/1092-4388(2003/106) . hdl : 1808/13411 . ПМИД   14700361 . Архивировано из оригинала (PDF) 14 июня 2013 г. Проверено 14 сентября 2017 г.
  20. ^ Перейти обратно: а б Сервантес Константино, форвард; Саймон, JZ (2018). «Восстановлению и эффективности нейронной обработки непрерывной речи способствуют предварительные знания» . Границы системной нейронауки . 12 (56): 56. дои : 10.3389/fnsys.2018.00056 . ПМК   6220042 . ПМИД   30429778 .
  21. ^ Поппель, Дэвид; Монахан, Филип Дж. (2008). «Восприятие речи: когнитивные основы и корковая реализация» . Современные направления психологической науки . 17 (2): 80–85. дои : 10.1111/j.1467-8721.2008.00553.x . ISSN   0963-7214 . S2CID   18628411 .
  22. ^ Хикок Г., Поппель Д. (май 2007 г.). «Корковая организация обработки речи». Нат. Преподобный Нейроски . 8 (5): 393–402. дои : 10.1038/nrn2113 . ПМИД   17431404 . S2CID   6199399 .
  23. ^ Перейти обратно: а б Хесслер, Дорте; Джонкерс, Бастиансе (декабрь 2010 г.). «Влияние фонетических размеров на афазическое восприятие речи». Клиническая лингвистика и фонетика . 12. 24 (12): 980–996. дои : 10.3109/02699206.2010.507297 . ПМИД   20887215 . S2CID   26478503 .
  24. ^ «Определение АГНОЗИИ» . www.merriam-webster.com . Проверено 15 декабря 2017 г.
  25. ^ Ховард, Гарри (2017). «Добро пожаловать в мозг и язык» . Добро пожаловать в мозг и язык .
  26. ^ Ламберт, Дж. (1999). «Слуховая агнозия с относительным сохранным восприятием речи» . Нейрокейз . 5 (5): 71–82. дои : 10.1016/s0010-9452(89)80007-3 . ПМИД   2707006 .
  27. ^ Перейти обратно: а б Роча, София; Аморим, Хосе Мануэль; Мачадо, Альваро Александре; Феррейра, Карла Мария (01 апреля 2015 г.). «Фонагнозия и неспособность воспринимать ход времени при эпилепсии правой теменной доли». Журнал нейропсихиатрии и клинических нейронаук . 27 (2): e154–e155. дои : 10.1176/appi.neuropsych.14040073 . ISSN   0895-0172 . ПМИД   25923865 .
  28. ^ Перейти обратно: а б с Минагава-Каваи Ю., Мори К., Наои Н., Кодзима С. (2006). «Процессы нейронной настройки у младенцев во время приобретения специфического для языка фонематического контраста» . Журнал неврологии . 27 (2): 315–321. doi : 10.1523/JNEUROSCI.1984-06.2007 . ПМК   6672067 . ПМИД   17215392 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  29. ^ Перейти обратно: а б Кристал, Дэвид (2005). Кембриджская энциклопедия языка . Кембридж: КУБОК. ISBN  978-0-521-55967-6 .
  30. ^ Куль, Патрисия К.; Фэн-Мин Цао; Хуэй-Мэй Лю (июль 2003 г.). «Опыт иностранного языка в младенчестве: влияние кратковременного воздействия и социального взаимодействия на фонетическое обучение» . Труды Национальной академии наук . 100 (15): 9096–9101. Бибкод : 2003PNAS..100.9096K . дои : 10.1073/pnas.1532872100 . ПМК   166444 . ПМИД   12861072 .
  31. ^ Айверсон П., Куль П.К., Акахане-Ямада Р., Диеш Э., Токура Ю., Кеттерманн А., Зиберт К. (2003). «Перцепционная интерференция, объясняющая трудности с усвоением неродных фонем». Познание . 89 (1): Б47–Б57. дои : 10.1016/S0010-0277(02)00198-1 . ПМИД   12499111 . S2CID   463529 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  32. ^ Бест, Коннектикут (1995). «Прямой реалистический взгляд на восприятие межъязыковой речи: новые направления в исследованиях и теории». В Уинифред Стрэндж (ред.). Восприятие речи и языковой опыт: Теоретические и методологические вопросы . Балтимор: Йорк Пресс. стр. 171–204.
  33. ^ Флеге, Дж. (1995). «Освоение второй языковой речи: теория, выводы и проблемы». В Уинифред Стрэндж (ред.). Восприятие речи и языковой опыт: Теоретические и методологические вопросы . Балтимор: Йорк Пресс. стр. 233–277.
  34. ^ Улер; Ёсинага-Итано; Габбард; Ротплетц; Дженкинс (март 2011 г.). «Младенческое восприятие речи у молодых пользователей кохлеарных имплантатов». Журнал Американской академии аудиологии . 22 (3): 129–142. дои : 10.3766/jaaa.22.3.2 . ПМИД   21545766 .
  35. ^ Перейти обратно: а б Чепе, В.; Осман-Саги, Дж.; Мольнар, М.; Госи, М. (2001). «Нарушение восприятия речи у пациентов с афазией: событийный потенциал и нейропсихологическая оценка». Нейропсихология . 39 (11): 1194–1208. дои : 10.1016/S0028-3932(01)00052-5 . ПМИД   11527557 . S2CID   17307242 .
  36. ^ Перейти обратно: а б Лоизу, П. (1998). «Введение в кохлеарные имплантаты». Журнал обработки сигналов IEEE . 39 (11): 101–130. дои : 10.1109/79.708543 .
  37. ^ Перейти обратно: а б с д Дойч, Диана; Хентхорн, Тревор; Долсон, Марк (весна 2004 г.). «Речевые модели, услышанные в раннем возрасте, влияют на более позднее восприятие парадокса тритона» (PDF) . Музыкальное восприятие . 21 (3): 357–72. дои : 10.1525/mp.2004.21.3.357 . Проверено 29 апреля 2014 г.
  38. ^ Маркес, C и др. (2007). Музыканты обнаруживают нарушение высоты звука на иностранном языке лучше, чем немузыканты: поведенческие и электрофизиологические данные. «Журнал когнитивной нейронауки, 19», 1453–1463.
  39. ^ Перейти обратно: а б с О'Каллаган, Кейси (2010). «Опыт речи» . Философские вопросы . 20 : 305–327. дои : 10.1111/j.1533-6077.2010.00186.x .
  40. ^ Макклелланд, Дж. Л. и Элман, Дж. Л. (1986). «Модель восприятия речи TRACE» (PDF) . Когнитивная психология . 18 (1): 1–86. дои : 10.1016/0010-0285(86)90015-0 . ПМИД   3753912 . S2CID   7428866 . Архивировано из оригинала (PDF) 21 апреля 2007 г. Проверено 19 мая 2007 г.
  41. ^ Казанина Н., Филлипс К., Идсарди В. (2006). «Влияние значения на восприятие звуков речи» (PDF) . ПНАС . Том. 30. С. 11381–11386 . Проверено 19 мая 2007 г. {{cite conference}}: CS1 maint: несколько имен: список авторов ( ссылка ) [ постоянная мертвая ссылка ]
  42. ^ Гокен, Дж. М. и Фокс Р. А. (2001). «Нейрологические данные в поддержку специализированного модуля фонетической обработки» . Мозг и язык . 78 (2): 241–253. дои : 10.1006/brln.2001.2467 . ПМИД   11500073 . S2CID   28469116 .
  43. ^ Деэн-Ламбертц, Г .; Пальер, К.; Серниклас, В.; Шпренгер-Шарол, Л.; Жобер, А.; Деэн, С. (2005). «Нейронные корреляты переключения со слухового восприятия на речевое» (PDF) . НейроИмидж . 24 (1): 21–33. doi : 10.1016/j.neuroimage.2004.09.039 . ПМИД   15588593 . S2CID   11899232 . Проверено 4 июля 2007 г.
  44. ^ Няэтянен, Р. (2001). «Восприятие звуков речи человеческим мозгом, отражающееся в несоответствии негатива (ММН) и его магнитного эквивалента (ММНм)» . Психофизиология . 38 (1): 1–21. дои : 10.1111/1469-8986.3810001 . ПМИД   11321610 .
  45. ^ Либерман, А.М., Харрис, К.С., Хоффман, Х.С., Гриффит, Британская Колумбия (1957). «Дискриминация звуков речи внутри границ фонем и за их пределами» (PDF) . Журнал экспериментальной психологии . 54 (5): 358–368. дои : 10.1037/h0044417 . ПМИД   13481283 . S2CID   10117886 . Проверено 18 мая 2007 г. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  46. ^ Либерман А.М., Купер Ф.С., Шанквейлер Д.П. и Стаддерт-Кеннеди М. (1967). «Восприятие речевого кода» (PDF) . Психологический обзор . 74 (6): 431–461. дои : 10.1037/h0020279 . ПМИД   4170865 . Проверено 19 мая 2007 г. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  47. ^ Либерман, AM (1970). «Грамматики речи и языка» (PDF) . Когнитивная психология . 1 (4): 301–323. дои : 10.1016/0010-0285(70)90018-6 . Архивировано из оригинала (PDF) 31 декабря 2015 г. Проверено 19 июля 2007 г.
  48. ^ Перейти обратно: а б Либерман, А.М. и Маттингли, И.Г. (1985). «Пересмотренная моторная теория восприятия речи» (PDF) . Познание . 21 (1): 1–36. CiteSeerX   10.1.1.330.220 . дои : 10.1016/0010-0277(85)90021-6 . ПМИД   4075760 . S2CID   112932 . Архивировано из оригинала (PDF) 15 апреля 2021 г. Проверено 19 июля 2007 г.
  49. ^ Перейти обратно: а б с Хейворд, Катрина (2000). Экспериментальная фонетика: Введение . Харлоу: Лонгман.
  50. ^ Стивенс, КН (2002). «К модели лексического доступа, основанной на акустических ориентирах и отличительных особенностях» (PDF) . Журнал Акустического общества Америки . 111 (4): 1872–1891. Бибкод : 2002ASAJ..111.1872S . дои : 10.1121/1.1458026 . ПМИД   12002871 . Архивировано из оригинала (PDF) 9 июня 2007 г. Проверено 17 мая 2007 г.
  51. ^ Массаро, Д.В. (1989). «Тестирование модели TRACE и нечеткой логической модели восприятия речи». Когнитивная психология . 21 (3): 398–421. дои : 10.1016/0010-0285(89)90014-5 . ПМИД   2758786 . S2CID   7629786 .
  52. ^ Оден, Г.К., Массаро, Д.В. (1978). «Интеграция признаковой информации в восприятие речи». Психологический обзор . 85 (3): 172–191. дои : 10.1037/0033-295X.85.3.172 . ПМИД   663005 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  53. ^ Перейти обратно: а б с д Ингрэм, Джон. КЛ (2007). Нейролингвистика: введение в обработку разговорной речи и ее нарушения . Кембридж: Издательство Кембриджского университета. стр. 113–127 .
  54. ^ Перейти обратно: а б Паркер, Эллен М.; Р.Л. Диль; КР Клюендер (1986). «Торговые отношения в речевой и неречевой форме» . Внимание, восприятие и психофизика . 39 (2): 129–142. дои : 10.3758/bf03211495 . ПМИД   3725537 .
  55. ^ Рэнди Л. Диль; Эндрю Дж. Лотто; Лори Л. Холт (2004). «Восприятие речи». Ежегодный обзор психологии . 55 (1): 149–179. doi : 10.1146/annurev.psych.55.090902.142028 . ПМИД   14744213 . S2CID   937985 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ff44bdceb4c5f75cab4d334363b044f3__1719553860
URL1:https://arc.ask3.ru/arc/aa/ff/f3/ff44bdceb4c5f75cab4d334363b044f3.html
Заголовок, (Title) документа по адресу, URL1:
Speech perception - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)