Обозначение таблички
В выводе байесовском табличное обозначение представляет собой метод представления переменных, которые повторяются в графической модели . Вместо рисования каждой повторяющейся переменной по отдельности используется пластина или прямоугольник для группировки переменных в подграф, которые повторяются вместе, а на пластине рисуется число, обозначающее количество повторений подграфа на пластине. [1] Предполагается, что подграф дублируется определенное количество раз, переменные в подграфе индексируются по числу повторений, а любые связи, пересекающие границу пластины, реплицируются один раз для каждого повторения подграфа. [2]
Пример
[ редактировать ]
В этом примере мы рассматриваем скрытое распределение Дирихле , байесовскую сеть , которая моделирует то, как документы в корпусе тематически связаны. Есть две переменные, которых нет ни на одной пластине; α — параметр равномерного априора Дирихле для распределения тем по документам, а β — параметр равномерного априора Дирихле для распределения слов по темам.
Самая внешняя табличка представляет все переменные, относящиеся к конкретному документу, включая , распределение тем для документа i . Буква М в углу таблички означает, что переменные внутри повторяются М раз, по одному разу для каждого документа. Внутренняя пластина представляет переменные, связанные с каждым из слова в документе i : — распределение тем для j -го слова в документе i , и это фактическое использованное слово.
N . в углу представляет собой повторение переменных на внутренней пластине раз, по одному разу для каждого слова в документе i . Круг, обозначающий отдельные слова, затенен, что указывает на то, что каждое является наблюдаемой , а остальные кружки пусты, что указывает на то, что остальные переменные являются скрытыми переменными . Направленные ребра между переменными указывают на зависимости между переменными: например, каждая зависит от и β .
Расширения
[ редактировать ]
Различные авторы создали ряд расширений для выражения большего количества информации, чем просто условные отношения. Однако немногие из них стали стандартными. Возможно, наиболее часто используемое расширение — это использование прямоугольников вместо кругов для обозначения неслучайных переменных — либо вычисляемых параметров, гиперпараметров с фиксированным значением (или вычисляемых с помощью эмпирического байесовского метода ), либо переменных, значения которых вычисляются детерминированно на основе случайного значения. переменная.
На диаграмме справа показаны еще несколько нестандартных соглашений, используемых в некоторых статьях Википедии (например, вариационный Байес ):
- Переменные, которые на самом деле являются случайными векторами , обозначаются путем помещения размера вектора в скобки в середине узла.
- Переменные, которые на самом деле являются случайными матрицами, обозначаются аналогичным образом: размер матрицы заключен в скобки в середине узла, а размер строки отделяется запятыми от размера столбца.
- Категориальные переменные обозначаются размещением их размера (без скобок) в середине узла.
- Категориальные переменные, которые действуют как «переключатели» и которые выбирают одну или несколько других случайных величин для воздействия из большого набора таких переменных (например, компонентов смеси), обозначаются стрелкой специального типа, содержащей волнистую линию и оканчивающуюся знаком Т-переход.
- Жирный шрифт постоянно используется для векторных или матричных узлов (но не для категориальных узлов).
Программная реализация
[ редактировать ]Обозначение пластин было реализовано в различных пакетах рисования TeX / LaTeX , а также как часть графических пользовательских интерфейсов к программам байесовской статистики, таким как BUGS , BayesiaLab и PyMC .
Ссылки
[ редактировать ]- ^ Гахрамани, Зубин (август 2007 г.). Графические модели (Речь). Тюбинген, Германия . Проверено 21 февраля 2008 г.
- ^ Бантин, Рэй Л. (декабрь 1994 г.). «Операции по обучению с графическими моделями» (PDF) . Журнал исследований искусственного интеллекта . 2 . Фонд доступа к искусственному интеллекту: 159–225. arXiv : cs/9412102 . Бибкод : 1994cs.......12102B . дои : 10.1613/jair.62 . ISSN 1076-9757 . S2CID 11672931 . Проверено 21 февраля 2008 г.