Реализация (лингвистика)
В лингвистике ; реализация — это процесс, посредством которого некоторая поверхностная репрезентация выводится из лежащей в ее основе репрезентации то есть способ, которым некий абстрактный объект лингвистического анализа создается в реальном языке. фонемы Часто говорят, что реализуются через звуки речи . Различные звуки, которые могут реализовывать определенную фонему, называются ее аллофонами .
Реализация также является подзадачой генерации естественного языка , которая включает в себя создание реального текста на человеческом языке (английском, французском и т. д.) из синтаксического представительство. Для реализации доступен ряд программных пакетов, большинство из которых были разработаны академическими исследовательскими группами NLG. Оставшаяся часть этой статьи посвящена реализации такого рода.
Пример
[ редактировать ]Например, следующий код Java вызывает simplenlg систему [2] [1] распечатать текст Женщины не курят. :
NPPhraseSpec subject = nlgFactory.createNounPhrase("the", "woman");
subject.setPlural(true);
SPhraseSpec sentence = nlgFactory.createClause(subject, "smoke");
sentence.setFeature(Feature.NEGATED, true);
System.out.println(realiser.realiseSentence(sentence));
В этом примере компьютерная программа определила лингвистические составляющие предложения (глагол, подлежащее), а также лингвистические особенности (подлежащее во множественном числе, отрицание), и на основе этой информации реализатор построил фактическое предложение.
Обработка
[ редактировать ]Реализация включает в себя три вида обработки:
Синтаксическая реализация : использование грамматических знаний для выбора флексий, добавления служебных слов, а также для определения порядка компонентов. Например, в английском языке подлежащее обычно предшествует глаголу, а отрицательная форма Smoke — Don’t Smoke .
Морфологическая реализация : Вычисление изменяемых форм, например, форма множественного числа женщины — женщины (не женщины ).
Орфографическая реализация : работа с регистром, пунктуацией и форматированием. Например, напишите The с заглавной буквы , потому что это первое слово предложения.
Приведенные выше примеры очень просты, большинство реализаторов способны на значительно более сложную обработку.
Системы
[ редактировать ]За последние 20 лет был разработан ряд реализаций. Эти системы различаются сложностью и изощренностью своей обработки, надежностью в работе с необычными случаями, а также тем, осуществляется ли к ним программный доступ через API или они принимают на вход текстовое представление синтаксической структуры.
Существуют также серьезные различия в прагматических факторах, таких как документация, поддержка, условия лицензирования, скорость и использование памяти и т. д.
Невозможно описать здесь всех реализаторов, но вот некоторые из новых областей:
- Simplenlg [3] : механизм реализации документов с API, который должен был быть простым в изучении и использовании, ориентированный на ограничение области действия только поиском поверхностной области документа.
- KPML [4] : это старейший реализатор, который разрабатывался под разными видами с 1980-х годов. Он поставляется с грамматиками для десяти разных языков.
- FUF/SURGE [5] : реализатор, который широко использовался в 1990-х годах и до сих пор используется в некоторых проектах.
- OpenCCG [6] : реализатор с открытым исходным кодом, который имеет ряд приятных функций, таких как возможность использовать статистические языковые модели для принятия решений по реализации.
Ссылки
[ редактировать ]Внешние ссылки
[ редактировать ]- [7] - Портал ACL NLG (содержит ссылки на вышеупомянутых и многих других реализаторов)