Оценка произношения
Автоматическая оценка произношения — это использование распознавания речи для проверки правильности произносимой речи . [1] [2] в отличие от ручной оценки, проводимой инструктором или инспектором. [3] Эта технология, также называемая проверкой речи, оценкой произношения и оценкой произношения , основным применением этой технологии является компьютерное обучение произношению (CAPT) в сочетании с компьютерным обучением компьютерному изучению языка (CALL), исправлению речи или уменьшению акцента. . Оценка произношения не определяет незнакомую речь (как при диктовке или автоматической транскрипции учащегося ), а вместо этого, заранее зная ожидаемое слово(а), пытается проверить правильность произношения и, в идеале, его разборчивость для слушателей. [4] [5] иногда наряду с часто несущественной просодией, такой как интонация , высота звука , темп , ритм , слог и словесное ударение . [6] Оценка произношения также используется при обучении чтению , например, в таких продуктах, как Microsoft Teams. [7] и от Амиры Лиринг. [8] Автоматическую оценку произношения также можно использовать для диагностики и лечения речевых нарушений, таких как апраксия . [9]
Самые ранние работы по оценке произношения избегали измерения подлинной разборчивости слушателя. [10] недостаток исправлен в 2011 году в Технологическом университете Тоёхаси , [11] и включен в тест Versant High Stakes на свободное владение английским языком от Pearson. [12] и мобильные приложения от 17zuoye Education & Technology , [13] но в 2023 году все еще отсутствуют продукты из Google Поиска , [14] Майкрософт , [15] Служба образовательного тестирования , [16] Речь, [17] и ЭЛЬЗА. [18] Оценка подлинной разборчивости слушателя необходима для предотвращения неточностей из- за смещения акцента , особенно при оценке важных вопросов; [19] [20] [21] из слов с множественным правильным произношением; [22] и от ошибок кодирования фонем в машиночитаемых словарях произношения. [23] В 2022 году исследователи обнаружили, что некоторые новые системы преобразования речи в текст, основанные на сквозном обучении с подкреплением для преобразования аудиосигналов непосредственно в слова, дают показатели достоверности слов и фраз, тесно коррелирующие с подлинной разборчивостью слушателя. [24] В Общеевропейских стандартов владения языком (CEFR) разборчивость перевешивает формально правильное произношение на всех уровнях. критериях оценки «общего фонологического контроля» [25]
Хотя пока еще не существует отраслевых стандартов для оценки точности оценки произношения, исследователи время от времени публикуют оценочные речевые корпуса , чтобы другие могли их использовать для улучшения качества оценки. [26] [27] Такие оценочные базы данных часто подчеркивают формально безударное произношение, исключая подлинную разборчивость, очевидную из слепого слушателя транскрипций . [5] Некоторые многообещающие области для улучшения, разрабатываемые в 2024 году, включают извлечение артикуляционных особенностей . [28] [29] [30] и перенести обучение, чтобы подавить ненужные исправления. [31] Другие интересные разработки, находящиеся в стадии разработки, включают « дополненной реальности интерфейсы » для мобильных устройств, использующие оптическое распознавание символов для обучения произношению текста, найденного в пользовательской среде. [32] [33]
См. также [ править ]
- Фонетика
- Сегментация речи - в этом контексте часто называемая «принудительным выравниванием» (звука по ожидаемым фонемам). [34]
- Статистическая классификация
Ссылки [ править ]
- ^ Эль Хейр, Ясин; и др. (21 октября 2023 г.), Автоматическая оценка произношения — обзор , Конференция по эмпирическим методам обработки естественного языка, arXiv : 2310.13974 , S2CID 264426545
- ^ Эхсани, Фарзад; Кнодт, Ева (июль 1998 г.). «Речевые технологии в компьютерном изучении языка: сильные и слабые стороны новой парадигмы CALL» . Изучение языков и технологии . 2 (1). Национальный ресурсный центр иностранных языков Гавайского университета; Центр языкового образования и исследований Мичиганского государственного университета: 54–73 . Проверено 11 февраля 2023 г.
- ^ Айзекс, Талия; Хардинг, Люк (июль 2017 г.). «Оценка произношения» . Обучение языку . 50 (3): 347–366. дои : 10.1017/S0261444817000118 . ISSN 0261-4448 . S2CID 209353525 .
- ^ Лукина, Анастасия; и др. (6 сентября 2015 г.), «Точность произношения и разборчивость неродной речи» (PDF) , INTERSPEECH 2015 , Дрезден, Германия: Международная ассоциация речевой коммуникации , стр. 1917–1921,
только 16% изменчивости на уровне слов. Разборчивость речи можно объяснить наличием явных ошибок в произношении.
- ^ Jump up to: а б О'Брайен, Мэри Грэнтэм; и др. (31 декабря 2018 г.). «Направления будущего технологий в исследованиях и преподавании произношения» . Журнал произношения второго языка . 4 (2): 182–207. doi : 10.1075/jslp.17001.obr . hdl : 2066/199273 . ISSN 2215-1931 . S2CID 86440885 .
Исследователи произношения в первую очередь заинтересованы в улучшении разборчивости и понятности учащихся L2, но они еще не собрали достаточного количества репрезентативных и надежных данных (записей речи с соответствующими аннотациями и суждениями), показывающих, какие ошибки влияют на эти речевые аспекты, а какие нет. Эти данные необходимы для обучения алгоритмов ASR для оценки разборчивости учащихся L2.
- ^ Эскенази, Максин (январь 1999 г.). «Использование автоматической обработки речи для обучения произношению иностранного языка: некоторые проблемы и прототип» . Изучение языков и технологии . 2 (2): 62–76 . Проверено 11 февраля 2023 г.
- ^ Тольфсен, Майк (9 февраля 2023 г.). «Тренер по чтению в иммерсивном Reader, а также новые функции прогресса чтения в Microsoft Teams» . Образовательный блог Techcommunity . Майкрософт . Проверено 12 февраля 2023 г.
- ^ Банерджи, Олина (7 марта 2023 г.). «Школы используют голосовые технологии для обучения чтению. Помогает ли это?» . Новости EdSurge . Проверено 7 марта 2023 г.
- ^ Волосы, Адам; и др. (19 июня 2018 г.). «Мир апраксии: Логопедическая игра для детей с нарушениями звука речи». Материалы 17-й конференции ACM по интерактивному дизайну и детям (PDF) . стр. 119–131. дои : 10.1145/3202185.3202733 . ISBN 9781450351522 . S2CID 13790002 .
- ^ Бернштейн, Джаред; и др. (18 ноября 1990 г.), «Автоматическая оценка и тренировка английского произношения» (PDF) , Первая международная конференция по обработке разговорной речи (ICSLP 90) , Кобе, Япония: Международная ассоциация речевой коммуникации , стр. 1185–1188 , получено 11 февраля. В 2023 году слушатели
значительно различаются по способности предсказывать непонятные слова.... Таким образом, кажется, что рейтинг качества является более желательным... баллом автоматической оценки.
(раздел 2.2.2.) - ^ Хироши, Кибиши; Накагава, Сейичи (28 августа 2011 г.), «Новые параметры оценки произношения в презентациях английского языка на международных конференциях» (PDF) , INTERSPEECH 2011 , Флоренция, Италия: Международная ассоциация речевой коммуникации , стр. 1149–1152 , дата обращения 11 февраля 2023 г. ,
мы исследовали взаимосвязь между оценкой произношения/разборчивостью и различными акустическими показателями, а затем объединили эти показатели.... Насколько нам известно, автоматическая оценка разборчивости еще не изучалась.
- ^ Бонк, Билл (25 августа 2020 г.). «Новые инновации в оценивании: индекс разборчивости Versant» . Ресурсы для изучающих английский язык и преподавателей . Пирсон Инглиш. Архивировано из оригинала 27 января 2023 г. Проверено 11 февраля 2023 г.
вам не нужен идеальный акцент, грамматика или словарный запас, чтобы вас было понятно. На самом деле вам просто нужно, чтобы слушатели были понятны без особых усилий.
- ^ Гао, Юань; и др. (25 мая 2018 г.), «Устранение разборчивости разговорного английского языка с помощью выравнивания и извлечения функций PocketSphinx существенно улучшается по сравнению с современным уровнем техники», 2-я конференция IEEE по расширенному управлению информацией, коммуникациям, электронике и автоматизации (IMCEC 2018) , arXiv : 1709.01713 , doi : 10.1109/IMCEC.2018.8469649 , S2CID 31125681
- ^ Снир, Таль (14 ноября 2019 г.). «Как произносится квокка? Практикуйтесь с поиском» . Ключевое слово . Google . Проверено 11 февраля 2023 г.
- ^ «Инструмент оценки произношения» . Студия речи Azure Cognitive Services . Майкрософт . Проверено 11 февраля 2023 г.
- ^ Чен, Лей; и др. (декабрь 2018 г.). Автоматизированная оценка неродной речи: использование механизма SpeechRater v. 5.0 . Серия отчетов об исследованиях ETS. Том. 2018. Принстон, Нью-Джерси: Служба образовательного тестирования. стр. 1–31. дои : 10.1002/ets2.12198 . ISSN 2330-8516 . S2CID 69925114 . Проверено 11 февраля 2023 г.
- ^ Альнафиса, Мутлеб (сентябрь 2022 г.), «Обзор технологий: речь» , Материалы 12-й конференции по изучению и преподаванию второго языка (виртуальный PSLLT) , вып. 40, том. 12, Сент-Катаринс, Онтарио, ISSN 2380-9566 , получено 14 февраля 2023 г.
{{citation}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Горэм, Джон; и др. (10 марта 2022 г.). Распознавание речи для изучения английского языка (видео) . Технология преподавания и изучения языков . Решения для образования . Проверено 14 февраля 2023 г.
- ^ «Компьютер говорит нет: ирландский ветеринар провалил устный тест по английскому языку, необходимый для пребывания в Австралии» . Хранитель . Австралийское агентство Ассошиэйтед Пресс. 8 августа 2017 года . Проверено 12 февраля 2023 г.
- ^ Ферье, Трейси (9 августа 2017 г.). «Бывший читатель новостей из Австралии со степенью английского языка провалил тест по английскому для робота» . Сидней Морнинг Геральд . Проверено 12 февраля 2023 г.
- ^ Мэйн, Эд; Уотсон, Ричард (9 февраля 2022 г.). «Английский тест, разрушивший тысячи жизней» . Новости Би-би-си . Проверено 12 февраля 2023 г.
- ^ Джойс, Кэти Спратт (24 января 2023 г.). «13 слов, которые можно произнести двумя способами» . Читательский дайджест . Проверено 23 февраля 2023 г.
- ^ Например, CMUDICT , «Произносящий словарь КМУ» . www.speech.cs.cmu.edu . Проверено 15 февраля 2023 г. Сравните «четыре», заданное как «F AO R», с гласной АО, как в слове «пойманный», с словом «гребение», заданным как «R OW», с гласной OW, как в слове «овсянка».
- ^ Ту, Зехай; Ма, Нин; Баркер, Джон (2022). «Неконтролируемые меры неопределенности автоматического распознавания речи для неинтрузивного прогнозирования разборчивости речи» (PDF) . Учеб. Интерспич 2022 . ИНТЕРСПИЧ 2022. ISCA. стр. 3493–3497. doi : 10.21437/Interspeech.2022-10408 . Проверено 17 декабря 2023 г.
- ^ Общеевропейские ориентиры для изучения, преподавания и оценки языков: Сопутствующий том с новыми дескрипторами . Программа языковой политики, Отдел образовательной политики, Департамент образования, Совет Европы . Февраль 2018. с. 136. OCLC 1090351600 .
- ^ Видаль, Хасмин; и др. (15 сентября 2019 г.), «EpaDB: база данных для разработки систем оценки произношения» (PDF) , Interspeech 2019 , стр. 589–593, doi : 10.21437/Interspeech.2019-1839 , hdl : 11336/161618 , S2CID 202742421 , получено 19 февраля 2023 г .; ZIP-файл базы данных.
- ^ Чжан, Джунбо; и др. 30 ( , августа г. 2021 ) S2CID 233025050 , получено 19 февраля 2023 г .; Репозиторий корпуса GitHub.
- ^ Ву, Питер; и др. (14 февраля 2023 г.), «Независимая от говорящего акусто-артикуляционная речевая инверсия», arXiv : 2302.06774 [ eess.AS ]
- ^ Чо, Чхоль Джун; Мохамед, Абдельрахман; Блэк, Алан В.; Ануманчипалли, Гопала К. (16 января 2024 г.). «Модели речи с самоконтролем предполагают универсальную артикуляционную кинематику» . arXiv.org . Проверено 19 мая 2024 г.
- ^ Маллела, Джханси; Алуру, Сай Харшита; Ярра, Чирандживи (28 февраля 2024 г.). Изучение использования самоконтролируемых представлений для автоматического определения ударения в слоге . Национальная конференция по коммуникациям. Ченнаи, Индия. стр. 1–6. дои : 10.1109/NCC60321.2024.10486028 . Проверено 10 июня 2024 г.
- ^ Санчинетти, Марсело; и др. (23 мая 2022 г.). «Подход к трансферному обучению для оценки произношения». ICASSP 2022–2022 Международная конференция IEEE по акустике, речи и обработке сигналов (ICASSP) . стр. 6812–6816. arXiv : 2111.00976 . дои : 10.1109/ICASSP43922.2022.9747727 . ISBN 978-1-6654-0540-9 . S2CID 249437375 .
- ^ Че Далим, Че Самиха; и др. (февраль 2020 г.). «Использование дополненной реальности с речевым вводом для изучения неродного языка детьми» (PDF) . Международный журнал человеко-компьютерных исследований . 134 : 44–64. дои : 10.1016/j.ijhcs.2019.10.002 . S2CID 208098513 . Проверено 28 февраля 2023 г.
- ^ Толба, Рахма М.; и др. (2023). «Мобильная дополненная реальность для изучения фонетики: обзор (2012–2022 гг.)» . Расширенная реальность и метавселенная . Спрингерские труды по бизнесу и экономике. Springer International Publishing: 87–98. дои : 10.1007/978-3-031-25390-4_7 . ISBN 978-3-031-25389-8 . Проверено 28 февраля 2023 г.
- ^ Матхад, Викрам К.; и др. (2021). «Влияние ошибок принудительного выравнивания на автоматическую оценку произношения» (PDF) . 22-я ежегодная конференция Международной ассоциации речевой коммуникации (INTERSPEECH 2021) . Международная ассоциация речевой коммуникации. стр. 176–180. дои : 10.21437/interspeech.2021-1403 . ISBN 9781713836902 . S2CID 239694157 . Проверено 10 марта 2023 г.