Язык разметки синтеза речи
Язык разметки синтеза речи ( SSML ) — это XML на основе язык разметки для приложений синтеза речи . Это рекомендация W3C рабочей группы по голосовому браузеру . SSML часто встраивается в сценарии VoiceXML для управления интерактивными телефонными системами. Однако его также можно использовать отдельно, например, для создания аудиокниг. Для настольных приложений популярны другие языки разметки, в том числе встроенные речевые команды Apple и разметка Microsoft SAPI Text to Speech (TTS), также являющаяся языком XML. Он также используется для создания звуков через API преобразования текста в речь Azure Cognitive Services или при написании сторонних навыков для Google Assistant или Amazon Alexa .
SSML основан на языке разметки речи Java (JSML), разработанном Sun Microsystems , хотя текущая рекомендация была разработана в основном поставщиками синтеза речи. Он охватывает практически все аспекты синтеза, хотя некоторые области остались неопределенными, поэтому каждый поставщик принимает свой вариант языка. Кроме того, при отсутствии разметки предполагается, что синтезатор будет самостоятельно интерпретировать текст.
Пример
[ редактировать ]Вот пример документа SSML:
<?xml version="1.0"?>
<speak xmlns="http://www.w3.org/2001/10/synthesis"
xmlns:dc="http://purl.org/dc/elements/1.1/"
version="1.0">
<metadata>
<dc:title xml:lang="en">Telephone Menu: Level 1</dc:title>
</metadata>
<p>
<s xml:lang="en-US">
<voice name="David" gender="male" age="25">
For English, press <emphasis>one</emphasis>.
</voice>
</s>
<s xml:lang="es-MX">
<voice name="Miguel" gender="male" age="25">
Para español, oprima el <emphasis>dos</emphasis>.
</voice>
</s>
</p>
</speak>
Функции
[ редактировать ]SSML задает достаточное количество разметки для просодии , которая не включена в приведенный выше пример. Сюда входит разметка для
- подача
- контур
- диапазон шага
- ставка
- продолжительность
- объем
См. также
[ редактировать ]- Спецификация словаря произношения (PLS)
- Спецификация грамматики распознавания речи (SRGS)
- Семантическая интерпретация для распознавания речи (SISR)
- Язык разметки синтеза речи SABLE , предназначенный для объединения SSML, STML и JSML.