Речь, сжатая по времени
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Речь со сжатием по времени относится к аудиозаписи устного текста, в которой текст представлен в гораздо более коротком интервале времени, чем при обычной речи в реальном времени . [1] Основная цель — сделать так, чтобы записанная речь содержала больше слов за определенный промежуток времени, но при этом оставалась понятной. Например: абзац, чтение которого обычно занимает 20 секунд, вместо этого может быть представлен за 15 секунд, что соответствует сжатию времени на 25 % (5 секунд из 20).
Термин «речь со сжатием по времени» не следует путать со « сжатием речи », которое контролирует диапазон громкости звука, но не изменяет его временную оболочку.
Методы
[ редактировать ]Хотя некоторые ораторские способности способны говорить со скоростью, значительно превышающей общие нормы, [2] [3] термин «речь со сжатием по времени» чаще всего относится к примерам, в которых сокращение времени было достигнуто посредством некоторой формы электронной обработки записанной речи. [4] [5]
В общем, записанную речь можно сжать по времени электронным способом путем: увеличения ее скорости (линейное сжатие); удаление пауз (выборочное редактирование); комбинация этих двух (нелинейное сжатие). [5] Скорость записи можно увеличить, что приведет к более быстрому воспроизведению материала (и, следовательно, за более короткий промежуток времени), но это имеет нежелательный побочный эффект в виде увеличения частоты всего отрывка, повышения высота голоса, что может снизить разборчивость.
Обычно между словами и предложениями есть паузы и даже небольшие паузы внутри определенных слов, которые можно уменьшить или удалить («отредактировать»), что также уменьшит количество времени, занимаемое полной записью речи. Однако это также может привести к удалению словесной «пунктуации» из речи, что приведет к неестественному смыканию слов и предложений, что снова ухудшит разборчивость.
Гласные обычно удерживаются не менее 20 миллисекунд в течение многих циклов основной высоты звука. Системы DSP могут определять начало и конец каждого цикла, а затем пропускать некоторую часть этих циклов, заставляя материал воспроизводиться с большей скоростью, без изменения высоты тона, сохраняя «нормальный» тон голоса. [6]
В настоящее время предпочтительный метод сжатия времени называется «нелинейным сжатием», который использует комбинацию выборочного удаления пауз; ускорение речи, чтобы сокращенное молчание звучало нормально пропорционально тексту; и, наконец, применение различных алгоритмов обработки данных, чтобы вернуть речь к нужному тону. [5] Это дает более приемлемый результат, чем любой из двух предыдущих методов; однако, если не сдерживаться, удаление пауз и увеличение скорости может сделать выбор звука речи более настойчивым, возможно, до неприятности. [7]
Приложения
[ редактировать ]Реклама
[ редактировать ]Сжатая по времени речь часто используется в телевизионной и радиорекламе. Преимущество речи со сжатием по времени заключается в том, что то же количество слов можно сжать за меньший промежуток времени, что снижает затраты на рекламу и/или позволяет включить больше информации в данную радио- или телевизионную рекламу. Обычно это наиболее заметно в насыщенных информацией предостережениях и заявлениях об отказе от ответственности, представленных (обычно в соответствии с юридическими требованиями) в конце рекламных роликов — звуковой эквивалент « мелкого шрифта » в печатном контракте. [8] Эта практика, однако, не нова: до того, как были разработаны электронные методы, ораторы, которые могли говорить очень быстро и при этом быть понятыми, широко использовались в качестве ораторов для радио- и телевизионной рекламы и особенно для записи таких заявлений об отказе от ответственности.
Образование
[ редактировать ]Сжатая по времени речь имеет образовательные приложения, например, для повышения информационной плотности тренингов, а также в качестве учебного пособия. Ряд исследований показал, что среднестатистический человек способен относительно легко понимать речь, произносимую с более высокой, чем обычно, скоростью, при этом пик приходится на сжатие примерно 25% (то есть на 25% быстрее, чем обычно); эта возможность была продемонстрирована на нескольких языках. [9] Разговорная речь (на английском языке) происходит со скоростью около 150 слов в минуту (слов в минуту), однако среднестатистический человек без особых затруднений способен понимать речь, представленную со скоростью до 200-250 слов в минуту. [10] [11] Слепые и сильно ослабленные по зрению испытуемые набирали одинаковые уровни понимания, но с еще более высокими показателями — до 300–350 слов в минуту. [12] Было обнаружено, что слепые люди широко используют сжатую по времени речь, например, при просмотре записанных лекций в средней школе и колледже или при профессиональных тренингах. Было обнаружено, что показатели понимания у пожилых слепых субъектов такие же хорошие, а в некоторых случаях и выше, чем у более молодых зрячих субъектов. [13]
Другие исследования показали, что способность понимать сильно сжатую по времени речь имеет тенденцию снижаться с возрастом. [14] а также снижается, когда язык сжатой по времени речи не является родным языком слушателя. [15] Однако неносители языка могут улучшить свой уровень понимания сжатой по времени речи с помощью многодневных тренировок. [16]
Голосовая почта
[ редактировать ]Системы голосовой почты используют сжатую по времени речь еще с 1970-х годов. В этом приложении технология позволяет быстро просматривать сообщения в системах с высоким трафиком относительно небольшим количеством людей. [17]
Потоковое мультимедиа
[ редактировать ]Речь со сжатием по времени изучалась как один из множества взаимосвязанных факторов, которыми можно манипулировать для повышения эффективности потоковой передачи мультимедийных презентаций за счет значительного сокращения времени задержки , возникающего при передаче больших медиафайлов в цифровом кодировании. [18]
Ссылки
[ редактировать ]- ^ Н., Пэм М.С., «РЕЧЬ, СЖАТАЯ ПО ВРЕМЕНИ», в PsychologyDictionary.org, 29 апреля 2013 г., https://psychologydictionary.org/time-compressed-speech/ (по состоянию на 20 февраля 2019 г.).
- ^ «Очень краткая история стиля быстрой речи» . thevoe.com . 4 декабря 2014 г.
- ^ «Понимание напева аукциониста» . rmfarm.tripod.com .
- ^ «Сжатая речь» . ссылка.com .
- ^ Jump up to: а б с «Определение словаря сжатия времени — определено сжатие времени» . www.yourdictionary.com .
- ^ Тимоти Д. Грин. «Программирование встраиваемых систем с помощью PIC16F877» . 2008. п. 159.
- ^ «Рекламные тактики, которые больше всего беспокоят американцев - Consumer Reports» . www.consumerreports.org .
- ^ «Техники, восприятие и применение речи со сжатием по времени» (PDF) . mit.edu .
- ^ Палье, Кристоф; Себастьян-Галлес, Нурия; Дюпу, Эммануэль; Кристоф, Энн; Мелер, Жак (1 июля 1998 г.). «Перцептивная адаптация к сжатой по времени речи: межлингвистическое исследование» . Память и познание . 26 (4): 844–851. дои : 10.3758/BF03211403 . ПМИД 9701975 .
- ^ Барабас, А.Ф.; Исследование запоминания и удержания ускоренного изложения лекций ; Журнал связи ; 18 (3), 1968: стр. 283–287.
- ^ Бенц, ЧР; Влияние сжатой по времени речи на понимание визуально-ориентированной телевизионной лекции (1971); цитируется в Справочнике исследований в области образовательных коммуникаций и технологий ; Дэвид Х. Джонассен; Ассоциация образовательных коммуникаций и технологий (AECT); Блумингтон, Индиана: 2004.
- ^ «Понимание сверхбыстрой речи – слепые против людей с нормальным слухом (2007)» (PDF) . icphs2007.de .
- ^ Гордон-Салант, С. и Фридман, С.А.; Распознавание быстрой речи слепыми и зрячими взрослыми ; Журнал исследований речи, языка и слуха ; 54(2), апрель 2011 г.: стр.622-631.
- ^ Гордон-Салант, С. и Фитцгиббонс, П.Дж.; Источники возрастных затруднений распознавания речи, сжатой по времени ; Журнал исследований языка, речи и слуха ; 44(4), август 2001 г.: стр.709-19.
- ^ Чжоа, Ю.; Влияние контроля слушателями скорости речи на понимание второго языка ; Прикладная лингвистика ; 18(1), март 2997 г.: стр. 49-68.
- ^ Банай, К. и Лавнер, Ю.; Перцептивное обучение речи, сжатой по времени: более чем быстрая адаптация ; ПЛоС Один ; Национальный институт здравоохранения; Бетесда, Мэриленд: &(10), октябрь 2012 г.
- ^ Аронс, Б. «Техники, восприятие и применение речи со сжатием по времени». В материалах конференции 1992 года, Американское общество голосового ввода-вывода , сентябрь 1992 года, стр. 169–177.
- ^ Омоиги, Н., Хе, Л., Гупта, А., Грудин, Дж., и Саноки, Э.; Сжатие времени: системные проблемы, использование и польза ; Исследования Майкрософт ; Редмонд, Вашингтон: 1999.
Дальнейшее чтение
[ редактировать ]Алгоритмы сжатия времени
[ редактировать ]- М. Ковелл, М. Уитготт и М. Слейни, «Mach1: Неравномерная временная модификация речи», в Proc. ИКАССП, том. 1. Сиэтл, США: IEEE, май 1998 г., стр. 349–352.
- М. Демол, В. Верхелст, К. Струйве и П. Верхове, «Эффективное неравномерное масштабирование речи по времени с помощью WSOLA», в Proceedings of SPECOM, Петрас, Греция, октябрь 2005 г., стр. 163–166.
См. также
[ редактировать ]- Изменение высоты тона звука
- Джон Мошитта-младший , представитель, способный очень быстро говорить.