Алгоритм внутри-вне
Для алгоритмов синтаксического анализа в информатике алгоритм «внутри-вне» — это способ переоценки вероятностей производства в вероятностной бесконтекстной грамматике . Он был представлен Джеймсом К. Бейкером в 1979 году как обобщение прямого и обратного алгоритма оценки параметров скрытых марковских моделей на стохастические контекстно-свободные грамматики . Он используется для вычисления ожиданий, например, как часть алгоритма максимизации ожидания (алгоритм обучения без учителя).
Внутренние и внешние вероятности.
[ редактировать ]Внутренняя вероятность это общая вероятность генерации слов , учитывая, что корень нетерминальный и грамматика : [1]
Внешняя вероятность - общая вероятность начала со стартового символа и генерация нетерминала и все слова снаружи , учитывая грамматику : [1]
Вычисление внутренних вероятностей
[ редактировать ]Базовый случай:
Общий случай:
Предположим, существует правило в грамматике, то вероятность генерации начиная с поддерева с корнем в является:
Внутренняя вероятность это просто сумма всех таких возможных правил:
Вычисление внешних вероятностей
[ редактировать ]Базовый случай:
Здесь стартовый символ .
Общий случай:
Предположим, существует правило в грамматике, которая генерирует .Тогда левый вклад этого правила во внешнюю вероятность является:
Теперь предположим, что существует правило в грамматике. Тогда право вклад этого правила во внешнюю вероятность является:
Внешняя вероятность это сумма левого и правоговклады по всем таким правилам:
Ссылки
[ редактировать ]- ^ Jump up to: а б Мэннинг, Кристофер Д.; Хинрих Шютце (1999). Основы статистической обработки естественного языка . Кембридж, Массачусетс, США: MIT Press. стр. 388–402 . ISBN 0-262-13360-1 .
- Дж. Бейкер (1979): Обучаемые грамматики для распознавания речи . В книге Дж. Дж. Вольфа и Д. Х. Клатта, редакторов, «Документы по речевой коммуникации, представленные на 97-м собрании Акустического общества Америки» , страницы 547–550, Кембридж, Массачусетс, июнь 1979 г. Массачусетский технологический институт.
- Карим Лари , Стив Дж. Янг (1990): Оценка стохастических контекстно-свободных грамматик с использованием алгоритма внутри-вне . Компьютерная речь и язык , 4:35–56.
- Карим Лари , Стив Дж. Янг (1991): Приложения стохастических контекстно-свободных грамматик с использованием алгоритма Inside-Outside . Компьютерная речь и язык , 5:237–257.
- Фернандо Перейра, Ив Шабес (1992): Переоценка внутри и снаружи из частично заключенных в скобки корпусов . Материалы 30-го ежегодного собрания Ассоциации компьютерной лингвистики, Ассоциация компьютерной лингвистики , 128–135.