Jump to content

База данных неродной речи

(Перенаправлено из баз данных неродной речи )

База данных неродной речи — это речевая база данных неродного произношения английского языка . Такие базы данных используются при разработке: многоязычных систем автоматического распознавания речи , систем преобразования текста в речь , тренажеров произношения и систем изучения второго языка . [1]

Таблица 1: Сокращения языков, используемых в Таблице 2.
арабский А японский Дж
китайский С корейский К
чешский июнь Малазийский М
датский Д норвежский Н
Голландский У меня есть португальский П
Английский И Русский Р
Французский Ф испанский С
немецкий Г Шведский Швеция
Греческий Это идет тайский Т
индонезийский В вьетнамский V
итальянский я    


Фактическая таблица с информацией о различных базах данных показана в таблице 2.

Таблица 2. Обзор неродных баз данных
Корпус Автор Доступно на Языки #Динамики Родной язык #И т. д. Продолжительность Дата Примечания
КОТОРЫЙ [2] Евросоюз И Дут и другие 100 часов записи встреч
ATR-Грюн [3] Группа ATR И 96 CGFJ Индия 15000   2004 рейтинг квалификации
BAS Странный корпус 1+10 [4]   ЭЛРА Г 139 50 стран 7500   1998  
Ресторан Беркли [5] ИКСИ И 55 GIHCFSJ 2500 1994  
Трансляция новостей [6]   НРС И         1997  
Кембридж-Витт [7] Витт Университет Кембриджа И 10 ДЖИКС 1200   1999  
Кембридж-Йе [8] Вы Университет Кембриджа И 20 С 1600   2005  
Детские новости [9] Томокиё КМУ И 62 Джей Си 7500   2000 частично спонтанно
КЛИПС-ИМАГ [10] Тан КЛИПС-ИМАГ Ф 15 C V   6 часов 2006  
CLSU [11]   НРС И   22 страны 5000   2007 телефон, спонтанно
КМУ [12]   КМУ И 64 Г 452 0,9 часа   нет в наличии
Кросс Таунс [13] Повреждать U. Bochum EFGI Че Дут 161 ЭФГИС 72000 133ч. 2006 названия городов
Дюк-Арслан [14] Арслан Университет Дьюка И 93 15 стран 2200   1995 частично телефонная речь
ЭРЖ [15] Минемацу Ю.Токио И 200 Дж 68000   2002 рейтинг квалификации
Фишер [16] НРС И много 200 часов телефонная речь
Фитт [17] Фитт Университет Эдинбурга ФИН Гре 10 И 700   1995 названия городов
Френки [18]   У. Эрланген И 19 Г 2148      
латиноамериканец [19] Бирн   И 22 С   20 часов 1998 частично спонтанно
HLTC [20]   Гонконг И 44 С   3h 2010 доступен по запросу
IBM-Фишер [21]   ИБМ И 40 СФГИ 2000   2002 цифры
ВЫЗОВ [22] [23] Чен я 2 Р, А*СТАР С 305 24 страны 90841 142 часа 2015 фонетическая и тональная транскрипция (на языке пиньинь), рейтинги владения языком
ОСТРОВ [24] Этвелл Я/ЭЛДА И 46 GI 4000 18 часов 2000  
Юпитер [25] ты С И неизвестный неизвестный 5146   1999 телефонная речь
К-SEC [26] Ри СиТЭК И неизвестный К     2004
ЛДЦ WSJ1 [27]   НРС   10   800 1 час 1994  
Прыгнуть [28] кишка Университет Мюнстера НАПРИМЕР 127 41 разные 73.941 слов 12 часов 2003  
ТУМАН [29]   ЭЛРА ЭФГ 75 У меня есть 2200   1996  
НАТО HIWIRE [30]   НАТО И 81 F Гре ЕСТЬ 8100   2007 чистая речь
НАТО М-АТЦ [31] Голубь НАТО И 622 ФГИС 9833 17 часов 2007 сильный фоновый шум
НАТО N4 [32]   НАТО И 115 неизвестный   7,5 ч. 2006 сильный фоновый шум
день рождения [33]     D Dut EFG Gre INPS Swe   (121000)   1995 только лексикон
ПФ-СТАР [34]   У. Эрланген И 57 Г 4627 3,4 часа 2005 речь детей
Санстар [35]   Евросоюз И 100 ГСИПД 40000   1992 речь в парламенте
ТЦ-СТАР [36] Холм ГОТОВИТЬ ES неизвестный страны ЕС   13:00 2006 несколько наборов данных
ТЕД [37] Планка ГОТОВИТЬ И 40(188) много   10 часов (47 часов) 1994 евроречь 93
ТЛТС [38]   ДАРПА А   И   1 час 2004  
Токио-Кикуко [39]   Ю.Токио Дж 140 10 стран 35000   2004 рейтинг квалификации
Вербмобиль [40]   Университет Мюнхена И 44 Г   1,5 часа 1994 очень спонтанно
ПУСТОТА [41]   Евросоюз ФГ 178 ФГ 2500   1998 об автомобильной навигации
WP арабский [42] Камень НРС А 35 И 800 1 час 2002  
WP Русский [43] Камень НРС Р 26 И 2500 2 часа 2003  
WP испанский [44] Морган НРС С   И     2006  
WSJ говорил [45]     И 10 неизвестный 800   1993  


В таблице неродных баз данных используются некоторые сокращения названий языков. Они перечислены в Таблице 1. В Таблице 2 представлена ​​следующая информация о каждом корпусе: Название корпуса, учреждение, где корпус можно получить или, по крайней мере, должна быть доступна дополнительная информация, язык, на котором фактически говорили носители. , количество говорящих, родной язык говорящих, общее количество неродных высказываний, содержащихся в корпусе, продолжительность в часах неродной части, дата первого публичного обращения к этому корпусу, некоторый свободный текст выделение особых аспектов этой базы данных и ссылка на другую публикацию. Ссылка в последнем поле в большинстве случаев дается на статью, специально посвященную описанию этого корпуса первоначальными коллекционерами. В некоторых случаях идентифицировать такую ​​бумагу не удавалось. В этих случаях дается ссылка на статью, в которой используется этот корпус.

Некоторые записи оставлены пустыми, а другие помечены как неизвестные. Разница здесь в том, что пустые записи относятся к атрибутам, значение которых просто неизвестно. Однако неизвестные записи указывают на то, что в самой базе данных информация об этом атрибуте отсутствует. Например, в базе данных погоды Юпитера [46] никаких сведений о происхождении говорящих не приводится. Поэтому эти данные будут менее полезны для проверки обнаружения акцента или подобных проблем.

Там, где это возможно, это стандартное название корпуса, однако для некоторых более мелких корпусов не было установленного названия, и поэтому пришлось создать идентификатор. В таких случаях используется сочетание учреждения и сборщика базы данных.

В случае, когда в базах данных присутствует родная и неродная речь, перечисляются только признаки неродной части корпуса. Большинство корпусов представляют собой сборники прочитанной речи. Если вместо этого корпус частично или полностью состоит из спонтанных высказываний, это указывается в столбце «Специальные».

  1. ^ М. Рааб, Р. Грюн и Э. Ноэт, Базы данных неродной речи , в Proc. ASRU, Киото, Япония, 2007 г.
  2. ^ Проект AMI, «Корпус собраний AMI» [1] .
  3. ^ Р. Грюн, Т. Синкарек и С. Накамура, «База данных неродного английского языка с несколькими акцентами», в ASJ, 2004.
  4. ^ Университет Мюнхена, «Баварский архив странных корпусов речевых сигналов», [2] .
  5. ^ Джурафски и др., «Ресторанный проект Беркли», Proc. МЦСЛП 1994.
  6. ^ Л. Томокиё, Распознавание неродной речи: характеристика и адаптация к неродному использованию в распознавании речи , доктор философии. диссертация, Университет Карнеги-Меллон, Пенсильвания, 2001 г.
  7. ^ С. Витт, Использование распознавания речи в компьютерном изучении языка , доктор философии. диссертация, Инженерный факультет Кембриджского университета, Великобритания, 1999 г.
  8. ^ Х. Йе и С. Янг, Улучшение качества распознавания речи новичков в разговорном разговорном взаимодействии при изучении языка , в Proc. Интерспич, Лиссабон, Португалия, 2005 г.
  9. ^ Л. Томокиё, Распознавание неродной речи: характеристика и адаптация к неродному использованию в распознавании речи , доктор философии. диссертация, Университет Карнеги-Меллон, Пенсильвания, 2001 г.
  10. ^ Т.П. Тан и Л. Безасье, Французский корпус для автоматического распознавания речи на неродном языке , в LREC, Генуя, Италия, 2006.
  11. ^ Т. Ландер, CSLU: Английский с иностранным акцентом, выпуск 1.2 , Tech. Член палаты представителей, LDC, Филадельфия, Пенсильвания, 2007 г.
  12. ^ З. Ван, Т. Шульц и А. Вайбель, Сравнение методов адаптации акустической модели к неродной речи , в Proc. МКАССП , 2003.
  13. ^ С. Шаден, Моделирование акцентированных вариантов произношения на иностранных языках на основе правил , доктор философии. диссертация, Университет Дуйсбург-Эссен, 2006 г.
  14. ^ Л. М. Арслан и Дж. Х. Хансен, Частотные характеристики речи с иностранным акцентом , в Proc. ICASSP , Мюнхен, Германия , 1997, стр. 1123-1126.
  15. ^ Н. Минемацу и др., Разработка базы данных английской речи, читаемой японцами для поддержки исследований CALL , в ICA, Киото, Япония, 2004, стр. 577-560.
  16. ^ Кристофер Сиери, Дэвид Миллер, Кевин Уокер, Корпус Фишера: ресурс для следующих поколений преобразования речи в текст , Proc. ЛРЭЦ 2004 г.
  17. ^ С. Фитт, Произношение незнакомых названий местных и неродных городов , в Proc. Eurospeech, 1995, стр. 2227–2230.
  18. ^ Г. Стеммер, Э. Ноэт и Х. Ниманн, Акустическое моделирование иностранных слов в немецкой системе распознавания речи , в Proc. Eurospeech, П. Далсгаард, Б. Линдберг и Х. Беннер, ред., 2001, том. 4, стр. 2745-2748.
  19. ^ У. Бирн, Э. Кнодт, С. Худанпур и Дж. Бернштейн, Готово ли автоматическое распознавание речи к неродной речи? Усилия по сбору данных и первоначальные эксперименты по моделированию разговорного латиноамериканского английского языка , в STiLL, Мархолмен, Швеция, 1998, стр. 37-40.
  20. ^ Ю. Ли, П. Фунг, П. Сюй и Ю. Лю, Асимметричное акустическое моделирование для распознавания речи на разных языках , в ICASSP, Прага, Чехия, 2011, стр. 37-40.
  21. ^ В. Фишер, Э. Янке и С. Кунцманн, Недавний прогресс в декодировании неродной речи с помощью многоязычных акустических моделей , в Proc. Eurospeech, 2003, стр. 3105–3108.
  22. ^ Нэнси Ф. Чен, Ронг Тонг, Даррен Ви, Пейсюань Ли, Бин Ма, Хайчжоу Ли, Корпус iCALL: китайский язык, на котором говорят неносители языка европейского происхождения , в Proc. Интерспич, 2015.
  23. ^ Нэнси Ф. Чен, Виваек Шивакумар, Махеш Харикумар, Бин Ма, Хайчжоу Ли. Масштабная характеристика ошибок мандаринского произношения, совершаемых носителями европейских языков , в сб. Интерспич, 2013.
  24. ^ В. Мензель, Э. Этвелл, П. Бонавентура, Д. Херрон, П. Ховарт, Р. Мортон и К. Саутер, Корпус разговорного английского языка для неродных языков ISLE , в LREC, Афины, Греция, 2000, стр. .957-963.
  25. ^ К. Ливеску, Анализ и моделирование неродной речи для автоматического распознавания речи , магистерская диссертация, Массачусетский технологический институт, Кембридж, Массачусетс, 1999.
  26. ^ СК. Ри и ​​Ш. Ли и СК. Канг и YJ. Ли, Проектирование и создание корпуса корейско-разговорного английского языка (K-SEC) , Proc. МЦСЛП 2004 г.
  27. ^ Л. Томокиё, Распознавание неродной речи: характеристика и адаптация к неродному использованию в распознавании речи , доктор философии. диссертация, Университет Карнеги-Меллон, Пенсильвания, 2001 г.
  28. ^ Гут, У., Неродная речь. Корпусный анализ фонологических и фонетических свойств английского и немецкого языков L2 , Франкфурт-на-Майне: Питер Ланг, 2009.
  29. ^ Институт исследований человеческого фактора TNO, Многоязычная совместимость Mist в базе данных речевых технологий , Tech. Представитель ELRA, Париж, Франция, 2007 г., номер каталога ELRA S0238.
  30. ^ JC Segura et al., База данных HIWIRE, шумный и неродной английский речевой корпус для общения в кабине экипажа , 2007, [3] .
  31. ^ С. Пиджен, В. Шен и Д. ван Леувен, Проектирование и характеристика базы данных связи чужого военного воздушного движения , в ICSLP, Антверпен, Бельгия, 2007.
  32. ^ Л. Бенарус и др., Корпус родной и неродной речи НАТО (n4) , в Proc. семинара MIST (ESCA-NATO), Лёсден, сентябрь 1999 г.
  33. ^ Консорциум Onomastica, Лексикон межъязыкового произношения ONOMASTICA , в Proc. Eurospeech, Мадрид, Испания, 1995, стр. 829–832.
  34. ^ К. Хакер, Т. Синкарек, А. Майер, А. Хесслер и Э. Ноэт, Повышение просодических особенностей и особенностей произношения для обнаружения неправильного произношения у неродных детей , в Proc. ICASSP, Гонолулу, Гавайи, 2007 г., стр. 197–200.
  35. ^ К. Тейшейра, И. Транкозо и А. Серралейру, Распознавание неродного акцента , в Proc. Eurospeech, Родос, Греция, 1997, стр. 2375-2378.
  36. ^ Х. Хеувел, К. Шукри, К. Голлан, А. Морено и Д. Мостефа, TC-STAR: Новые языковые ресурсы для целей ASR и SLT , в LREC, Генуя, 2006, стр. 2570-2573.
  37. ^ Л. Ф. Ламель , Ф. Шиль, А. Фурсен, Дж. Мариани и Х. Тиллманн, Трансязычная английская база данных TED , в ICSLP, Иокогама, Япония, сентябрь 1994 г.
  38. ^ Н. Мот, Л. Джонсон, А. Сети, Дж. Сильва и С. Нараянан, Тактическое обнаружение языка и моделирование речевых ошибок обучающегося: случай обучения арабскому тактическому языку для носителей американского английского языка , в Proc. ИнСТИЛ, июнь 2004 г.
  39. ^ К. Нишина, Разработка базы данных японской речи, читаемой не носителями языка, для построения системы CALL , в ICA, Киото, Япония, 2004, стр. 561-564.
  40. ^ Университет Мюнхена, Проект Verbmobil , [4] .
  41. ^ И. Транкозу, К. Виана, И. Маскареньяш и К. Тейшейра, О выведении правил для нативного произношения в навигационных запросах , в Proc. Евроречь, 1999.
  42. ^ А. ЛаРокка и Р. Шуайри, Корпус арабской речи Вест-Пойнт , Tech. Представитель, LDC, Филадельфия, Пенсильвания, 2002 г.
  43. ^ А. ЛаРокка и К. Томей, Корпус русской речи Вест-Пойнт , Tech. Представитель, LDC, Филадельфия, Пенсильвания, 2003 г.
  44. ^ Дж. Морган, Героическая испанская речь Вест-Пойнта , Tech. Представитель, LDC, Филадельфия, Пенсильвания, 2006 г.
  45. ^ И. Амдал, Ф. Коркмазский и А. К. Сурендран, Совместное моделирование произношения неносителей языка с использованием методов, основанных на данных , в ICSLP, Пекин, Китай, 2000, стр. 622-625.
  46. ^ К. Ливеску, Анализ и моделирование неродной речи для автоматического распознавания речи , магистерская диссертация, Массачусетский технологический институт, Кембридж, Массачусетс, 1999.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 498684dfd7b260a1250b159c9fcfde9d__1651780740
URL1:https://arc.ask3.ru/arc/aa/49/9d/498684dfd7b260a1250b159c9fcfde9d.html
Заголовок, (Title) документа по адресу, URL1:
Non-native speech database - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)