Jump to content

Речь, сжатая по времени

Речь со сжатием по времени относится к аудиозаписи устного текста, в которой текст представлен в гораздо более коротком интервале времени, чем при обычной речи в реальном времени . [1] Основная цель — сделать так, чтобы записанная речь содержала больше слов за определенный промежуток времени, но при этом оставалась понятной. Например: абзац, чтение которого обычно занимает 20 секунд, вместо этого может быть представлен за 15 секунд, что соответствует сжатию времени на 25 % (5 секунд из 20).

Термин «речь со сжатием по времени» не следует путать со « сжатием речи », которое контролирует диапазон громкости звука, но не изменяет его временную оболочку.

Хотя некоторые ораторские способности способны говорить со скоростью, значительно превышающей общие нормы, [2] [3] термин «речь со сжатием по времени» чаще всего относится к примерам, в которых сокращение времени было достигнуто посредством некоторой формы электронной обработки записанной речи. [4] [5]

В общем, записанную речь можно сжать по времени электронным способом путем: увеличения ее скорости (линейное сжатие); удаление пауз (выборочное редактирование); комбинация этих двух (нелинейное сжатие). [5] Скорость записи можно увеличить, что приведет к более быстрому воспроизведению материала (и, следовательно, за более короткий промежуток времени), но это имеет нежелательный побочный эффект в виде увеличения частоты всего отрывка, повышения высота голоса, что может снизить разборчивость.

Обычно между словами и предложениями есть паузы и даже небольшие паузы внутри определенных слов, которые можно уменьшить или удалить («отредактировать»), что также уменьшит количество времени, занимаемое полной записью речи. Однако это также может привести к удалению словесной «пунктуации» из речи, что приведет к неестественному смыканию слов и предложений, что снова ухудшит разборчивость.

Гласные обычно удерживаются не менее 20 миллисекунд в течение многих циклов основной высоты звука. Системы DSP могут определять начало и конец каждого цикла, а затем пропускать некоторую часть этих циклов, заставляя материал воспроизводиться с большей скоростью, без изменения высоты тона, сохраняя «нормальный» тон голоса. [6]

В настоящее время предпочтительный метод сжатия времени называется «нелинейным сжатием», который использует комбинацию выборочного удаления пауз; ускорение речи, чтобы сокращенное молчание звучало нормально пропорционально тексту; и, наконец, применение различных алгоритмов обработки данных, чтобы вернуть речь к нужному тону. [5] Это дает более приемлемый результат, чем любой из двух предыдущих методов; однако, если не сдерживаться, удаление пауз и увеличение скорости может сделать выбор звука речи более настойчивым, возможно, до неприятности. [7]

Приложения

[ редактировать ]

Сжатая по времени речь часто используется в телевизионной и радиорекламе. Преимущество речи со сжатием по времени заключается в том, что то же количество слов можно сжать за меньший промежуток времени, что снижает затраты на рекламу и/или позволяет включить больше информации в данную радио- или телевизионную рекламу. Обычно это наиболее заметно в насыщенных информацией предостережениях и заявлениях об отказе от ответственности, представленных (обычно в соответствии с юридическими требованиями) в конце рекламных роликов — звуковой эквивалент « мелкого шрифта » в печатном контракте. [8] Эта практика, однако, не нова: до того, как были разработаны электронные методы, ораторы, которые могли говорить очень быстро и при этом быть понятыми, широко использовались в качестве ораторов для радио- и телевизионной рекламы и особенно для записи таких заявлений об отказе от ответственности.

Образование

[ редактировать ]

Сжатая по времени речь имеет образовательные приложения, например, для повышения информационной плотности тренингов, а также в качестве учебного пособия. Ряд исследований показал, что среднестатистический человек способен относительно легко понимать речь, произносимую с более высокой, чем обычно, скоростью, при этом пик приходится на сжатие примерно 25% (то есть на 25% быстрее, чем обычно); эта возможность была продемонстрирована на нескольких языках. [9] Разговорная речь (на английском языке) происходит со скоростью около 150 слов в минуту (слов в минуту), однако среднестатистический человек без особых затруднений способен понимать речь, представленную со скоростью до 200-250 слов в минуту. [10] [11] Слепые и сильно ослабленные по зрению испытуемые набирали одинаковые уровни понимания, но с еще более высокими показателями — до 300–350 слов в минуту. [12] Было обнаружено, что слепые люди широко используют сжатую по времени речь, например, при просмотре записанных лекций в средней школе и колледже или при профессиональных тренингах. Было обнаружено, что показатели понимания у пожилых слепых субъектов такие же хорошие, а в некоторых случаях и выше, чем у более молодых зрячих субъектов. [13]

Другие исследования показали, что способность понимать сильно сжатую по времени речь имеет тенденцию снижаться с возрастом. [14] а также снижается, когда язык сжатой по времени речи не является родным языком слушателя. [15] Однако неносители языка могут улучшить свой уровень понимания сжатой по времени речи с помощью многодневных тренировок. [16]

Голосовая почта

[ редактировать ]

Системы голосовой почты используют сжатую по времени речь еще с 1970-х годов. В этом приложении технология позволяет быстро просматривать сообщения в системах с высоким трафиком относительно небольшим количеством людей. [17]

Потоковое мультимедиа

[ редактировать ]

Речь со сжатием по времени изучалась как один из множества взаимосвязанных факторов, которыми можно манипулировать для повышения эффективности потоковой передачи мультимедийных презентаций за счет значительного сокращения времени задержки , возникающего при передаче больших медиафайлов в цифровом кодировании. [18]

  1. ^ Н., Пэм М.С., «РЕЧЬ, СЖАТАЯ ПО ​​ВРЕМЕНИ», в PsychologyDictionary.org, 29 апреля 2013 г., https://psychologydictionary.org/time-compressed-speech/ (по состоянию на 20 февраля 2019 г.).
  2. ^ «Очень краткая история стиля быстрой речи» . thevoe.com . 4 декабря 2014 г.
  3. ^ «Понимание напева аукциониста» . rmfarm.tripod.com .
  4. ^ «Сжатая речь» . ссылка.com .
  5. ^ Jump up to: а б с «Определение словаря сжатия времени — определено сжатие времени» . www.yourdictionary.com .
  6. ^ Тимоти Д. Грин. «Программирование встраиваемых систем с помощью PIC16F877» . 2008. п. 159.
  7. ^ «Рекламные тактики, которые больше всего беспокоят американцев - Consumer Reports» . www.consumerreports.org .
  8. ^ «Техники, восприятие и применение речи со сжатием по времени» (PDF) . mit.edu .
  9. ^ Палье, Кристоф; Себастьян-Галлес, Нурия; Дюпу, Эммануэль; Кристоф, Энн; Мелер, Жак (1 июля 1998 г.). «Перцептивная адаптация к сжатой по времени речи: межлингвистическое исследование» . Память и познание . 26 (4): 844–851. дои : 10.3758/BF03211403 . ПМИД   9701975 .
  10. ^ Барабас, А.Ф.; Исследование запоминания и удержания ускоренного изложения лекций ; Журнал связи ; 18 (3), 1968: стр. 283–287.
  11. ^ Бенц, ЧР; Влияние сжатой по времени речи на понимание визуально-ориентированной телевизионной лекции (1971); цитируется в Справочнике исследований в области образовательных коммуникаций и технологий ; Дэвид Х. Джонассен; Ассоциация образовательных коммуникаций и технологий (AECT); Блумингтон, Индиана: 2004.
  12. ^ «Понимание сверхбыстрой речи – слепые против людей с нормальным слухом (2007)» (PDF) . icphs2007.de .
  13. ^ Гордон-Салант, С. и Фридман, С.А.; Распознавание быстрой речи слепыми и зрячими взрослыми ; Журнал исследований речи, языка и слуха ; 54(2), апрель 2011 г.: стр.622-631.
  14. ^ Гордон-Салант, С. и Фитцгиббонс, П.Дж.; Источники возрастных затруднений распознавания речи, сжатой по времени ; Журнал исследований языка, речи и слуха ; 44(4), август 2001 г.: стр.709-19.
  15. ^ Чжоа, Ю.; Влияние контроля слушателями скорости речи на понимание второго языка ; Прикладная лингвистика ; 18(1), март 2997 г.: стр. 49-68.
  16. ^ Банай, К. и Лавнер, Ю.; Перцептивное обучение речи, сжатой по времени: более чем быстрая адаптация ; ПЛоС Один ; Национальный институт здравоохранения; Бетесда, Мэриленд: &(10), октябрь 2012 г.
  17. ^ Аронс, Б. «Техники, восприятие и применение речи со сжатием по времени». В материалах конференции 1992 года, Американское общество голосового ввода-вывода , сентябрь 1992 года, стр. 169–177.
  18. ^ Омоиги, Н., Хе, Л., Гупта, А., Грудин, Дж., и Саноки, Э.; Сжатие времени: системные проблемы, использование и польза ; Исследования Майкрософт ; Редмонд, Вашингтон: 1999.

Дальнейшее чтение

[ редактировать ]

Алгоритмы сжатия времени

[ редактировать ]
  • М. Ковелл, М. Уитготт и М. Слейни, «Mach1: Неравномерная временная модификация речи», в Proc. ИКАССП, том. 1. Сиэтл, США: IEEE, май 1998 г., стр. 349–352.
  • М. Демол, В. Верхелст, К. Струйве и П. Верхове, «Эффективное неравномерное масштабирование речи по времени с помощью WSOLA», в Proceedings of SPECOM, Петрас, Греция, октябрь 2005 г., стр. 163–166.

См. также

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 22603508093d57bfef70f5004c47763b__1713498780
URL1:https://arc.ask3.ru/arc/aa/22/3b/22603508093d57bfef70f5004c47763b.html
Заголовок, (Title) документа по адресу, URL1:
Time-compressed speech - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)