Лессак Технологии
Lessac Technologies, Inc. (LTI) — американская фирма, которая разрабатывает программное обеспечение для синтеза голоса , лицензирует технологии и продает синтезированные романы в формате MP3. [1] В настоящее время фирма имеет семь выданных патентов. [2] [3] [4] [5] [6] [7] [8] и еще три ожидают разработки автоматизированных методов преобразования цифрового текста в человеческую речь, более точного распознавания человеческой речи и вывода текста, представляющего слова и фразы указанной речи, а также распознавания эмоционального состояния говорящего.
Технология LTI частично основана на работах покойного Артура Лессака , профессора театра Государственного университета Нью-Йорка и создателя Lessac Kinesensic Training, а LTI лицензировала эксклюзивные права на использование произведений Артура Лессака, защищенных авторским правом, в области синтез речи и распознавание речи . Основываясь на представлении о том, что музыка — это речь, а речь — это музыка, работы и книги Лессака сосредоточены на энергиях тела и речи и на том, как они сочетаются друг с другом. Система текстовых аннотаций Артура Лессака, которая изначально была разработана для помощи актерам, певцам и ораторам в разметке сценариев для подготовки к выступлению, адаптирована в системе синтеза речи LTI как базовое представление синтезируемой речи (Lessemes), в отличие от ко многим другим системам, использующим фонетическое представление. [9] [10] [11]
Программное обеспечение LTI состоит из двух основных компонентов: (1) лингвистический интерфейс, который преобразует простой текст в последовательность просодических и фоносенсорных графических символов (лессем) на основе системы аннотаций Артура Лессака, которая определяет речевые единицы, подлежащие синтезу; (2) серверная часть обработки сигналов, которая принимает лессемы в качестве акустических данных и выдает на выходе синтезированную речь, звучащую по-человечески, используя выбор единиц и конкатенацию.
Система преобразования текста в речь LTI заняла второе место во всемирном конкурсе Blizzard Challenge 2011 и 2012 годов. Команда, занявшая первое место в 2011 году, также использовала «внешнюю» технологию LTI, но со своей собственной серверной частью. [12] [13] Конкурс Blizzard Challenge, проводимый Институтом языковых технологий Университета Карнеги-Меллона , был задуман как способ оценить методы синтеза речи, предлагая различным исследовательским группам создавать голоса из одних и тех же записей актеров озвучивания и сравнивать результаты с помощью тестов на прослушивание.
LTI была основана в 2000 году Х. Дональдом Уилсоном (председатель), юристом, предпринимателем LexisNexis и деловым партнером Артура Лессака; и Гэри А. Марпл (главный изобретатель) после того, как Марпл предположил, что кинесентическая тренировка голоса Артура Лессака может быть применима к компьютерной лингвистике. После смерти Уилсона в 2006 году генеральным директором фирмы стал его племянник Джон Райхенбах.
Ссылки
[ редактировать ]- ^ «Первые аудиокниги с синтетической речью», отраслевой аналитик Уолт Тетшнер в ежемесячном отраслевом информационном бюллетене ASRNews.
- ↑ 8 мая 2012 г. (№ 8,175,879) Системная текстовая аннотация для выразительной просодии при синтезе и распознавании речи : «Lessac+Technologies»
- ↑ 25 января 2011 г. (№ 7,877,259) речевые текстовые коды и их использование в компьютеризированных речевых системах : «Lessac+Technologies»
- ↑ 9 октября 2007 г. (№ 7,280,964) «Метод Lessac+Technologies распознавания разговорной речи с распознаванием цвета языка : »
- ^ 8 ноября 2005 г. (№ 6,963,841) Метод тренировки речи с альтернативной базой данных правильного произношения :
- ↑ 8 марта 2005 г. (№ 6,865,533) Преобразование текста в речь :
- ↑ 25 января 2005 г. (№ 6,847,931) Выразительный синтаксический анализ при компьютеризированном преобразовании текста в речь :
- ^ 22 июня 2012 г. (Уведомление о разрешении по заявке № US 11/909,514) Компьютеризированный синтезатор речи для синтеза речи из текста :
- ^ М. Манро, С. Тернер, А. Манро и К. Кэмпбелл [ред.] (2010), Коллективные сочинения о голосе Лессака и работе с телом: Festschrift, Llumina Press. ISBN 1605943436 (в частности, глава в ней под названием «Использование лессем в синтезе речи» Р. Нитисароя и Г. А. Марпла)
- ^ «TTS находит свой путь», Лорен Шопп, опубликовано 1 ноября 2007 г.): http://www.speechtechmag.com/Articles/Editorial/Feature/TTS-Is-Finding-Its-Way-40067.aspx ; а именно параграфы 5–7 «Определения выражения»
- ^ Лессак, Артур (1997). Использование и тренировка человеческого голоса: биодинамический подход к голосовой жизни (3-е изд.) . Маунтин-Вью, Калифорния: Mayfield Pub.. стр. xv, 291 стр. : больной. ; 22 см.. ISBN 1-55934-696-5 . LCCN 96018629; и Лессак, Артур (1981, c1978), Мудрость тела: использование и тренировка человеческого тела (1-е изд.) . Нью-Йорк, штат Нью-Йорк: Специалисты по драматическим книгам. стр. VII, 278 с. : больной. ; 27 см.. ISBN 0-89676-070-7 . LCCN 81005472. OCLC 7671791.
- ^ * «Данные для Blizzard Challenge 2011… предоставлены Lessac Technologies» (информация о Blizzard Challenge 2011 включена на страницу SynSig): http://www.synsig.org/index.php/Blizzard_Challenge_2011
- ^ Участие в Blizzard Challenge: http://festvox.org/blizzard/bc2011/LESSAC_Blizzard2011.pdf.