Виземе
![]() | Эта статья включает список литературы , связанную литературу или внешние ссылки , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( январь 2023 г. ) |
Висема — это любой из нескольких звуков речи , которые выглядят одинаково, например, при чтении по губам (Fisher 1968).
Висемы и фонемы не имеют однозначного соответствия. Часто одной виземе соответствуют несколько фонем, так как несколько фонем при произношении выглядят на лице одинаково, например /k, ɡ, ŋ/ : /k/), , (висема: /k/), /t͡ʃ, /t͡ʃ, ʃ, d͡ʒ, ʒ/ ʃ, d͡ʒ, ʒ/ (визема : /ch/), /t, d, n, l/ (висема: /t/) и /p, b, m/ (висема: /p/). Таким образом, такие слова, как домашнее животное, колокольчик и мужчины , трудно различить читающим по губам, поскольку все они выглядят как /домашнее животное/. Однако во время реальной речи могут быть различия во времени и продолжительности с точки зрения визуальной «подписи» данного жеста, которую невозможно передать с помощью одной фотографии. И наоборот, некоторые звуки, которые трудно различить акустически, четко различимы лицом (Chen 2001). Например, акустически говорящие английские /l/ и /r/ могут быть очень похожими (особенно в таких кластерах, как «трава» и «стекло»), однако визуальная информация может демонстрировать явный контраст. Об этом свидетельствует более частая ошибка в словах по телефону, чем при личной встрече. Некоторые лингвисты утверждают, что речь лучше всего понимать как бимодальную (слуховую и зрительную), и понимание может быть нарушено, если одна из этих двух областей отсутствует ( МакГурк и Макдональд 1976 ).
Висемы часто могут быть юмористическими, как, например, фраза «слоновий сок», которая при чтении по губам кажется идентичной «Я люблю тебя».
Приложения для изучения визем включают обработку речи , распознавание речи и компьютерную анимацию лица .
См. также
[ редактировать ]Ссылки
[ редактировать ]- Чен Т. и Рао Р.Р. (май 1998 г.). «Аудиовизуальная интеграция в мультимодальной коммуникации». Труды IEEE 86, 837–852. дои : 10.1109/5.664274 .
- Чен, Т. (2001). «Аудиовизуальная обработка речи». Журнал обработки сигналов IEEE 18, 9–21. дои : 10.1109/79.911195
- Фишер, CG (1968). «Путаница среди визуально воспринимаемых согласных». Журнал исследований речи и слуха , 11 (4): 796–804. два : 10.1044/jshr.1104.796 .
- МакГерк Х. и Макдональд Дж. (1976, декабрь). «Слышать губы и видеть голоса». Природа 264, 746–748. два : 10.1038/264746a0 .
- Патрик Люси, Терренс Мартин, Шридха Шридхаран (2004). «Смешиваемость фонем, сгруппированных по их виземным классам, в шумной среде» . Представлено на Десятой Австралийской международной конференции по речевым наукам и технологиям, Университет Маккуори , Сидней, 8–10 декабря 2004 г.