Обучение на основе объяснений

Обучение на основе объяснений ( EBL ) — это форма машинного обучения , в которой используется очень сильная или даже совершенная теория предметной области (т. е. формальная теория предметной области, подобная модели предметной области в разработке онтологий , не путать с предметной областью Скотта). теория ) с целью сделать обобщения или сформировать понятия на обучающих примерах. ^[1] Он также связан с кодированием (памятью), чтобы помочь в обучении . ^[2]

Подробности

Примером EBL, использующего идеальную теорию предметной области, является программа, которая учится играть в шахматы на примере. Конкретная шахматная позиция, содержащая такую важную особенность, как «Вынужденная потеря черного ферзя в два хода», включает в себя множество не относящихся к делу особенностей, таких как специфическое разброс пешек на доске. EBL может взять один обучающий пример и определить, какие функции важны для формирования обобщения. ^[3]

Теория предметной области является совершенной или полной , если она в принципе содержит всю информацию, необходимую для решения любого вопроса о предметной области. Например, теория предметной области в шахматах — это просто правила шахмат. Зная правила, в принципе, можно вывести лучший ход в любой ситуации. Однако на практике сделать такой вывод невозможно из-за комбинаторного взрыва . EBL использует обучающие примеры, чтобы сделать поиск дедуктивных следствий теории предметной области эффективным на практике.

По сути, система EBL работает, находя способ вывести каждый обучающий пример из существующей базы данных системы по теории предметной области. Наличие краткого доказательства обучающего примера расширяет базу данных предметной теории, позволяя системе EBL очень быстро находить и классифицировать будущие примеры, похожие на обучающий пример. ^[4] Главный недостаток метода — стоимость применения макросов изученного доказательства, поскольку их становится много, — был проанализирован Минтоном. ^[5]

Базовая формулировка

Программное обеспечение EBL принимает четыре входа:

пространство гипотез (множество всех возможных выводов)
теория предметной области (аксиомы об интересующей области)
обучающие примеры (конкретные факты, исключающие какую-то возможную гипотезу)
критерии работоспособности (критерии определения того, какие функции в предметной области эффективно распознаваемы, например, какие функции можно непосредственно обнаружить с помощью датчиков) ^[6]

Приложение

Особенно хорошей областью применения EBL является обработка естественного языка (NLP). Здесь богатая теория предметной области, то есть грамматика естественного языка, хотя и не совершенная и не полная, настраивается на конкретное приложение или конкретное использование языка с использованием древовидного банка (обучающих примеров). Рейнер был пионером в этой работе. ^[7] Первым успешным промышленным применением был коммерческий интерфейс NL для реляционных баз данных. ^[8] Этот метод был успешно применен к нескольким крупномасштабным системам синтаксического анализа естественного языка. ^[9] где проблема полезности была решена путем исключения исходной грамматики (теория предметной области) и использования специализированных методов LR-анализа, что привело к огромному ускорению, за счет снижения охвата, но с выигрышем в устранении неоднозначности. Методы, подобные EBL, также применялись для генерации поверхностей, в отличие от синтаксического анализа. ^[10]

При применении EBL к НЛП критерии работоспособности могут быть созданы вручную. ^[11] или может быть выводится из дерева с использованием энтропии его или-узлов ^[12] или компромисс целевого охвата/устранения неоднозначности (= компромисс полноты/точности = f-показатель). ^[13] EBL также можно использовать для компиляции языковых моделей на основе грамматики для распознавания речи из общих грамматик унификации. ^[14] Обратите внимание, как проблема полезности, впервые выявленная Минтоном, была решена путем отказа от исходной теории грамматики/предметной области, и что цитируемые статьи имеют тенденцию содержать специализацию фразовой грамматики — полную противоположность первоначальному обобщению, основанному на объяснении термина. Возможно, лучшим названием для этого метода было бы сокращение пространства поиска на основе данных. Среди других людей, которые работали над EBL для НЛП, — Гюнтер Нейман, Аравинд Джоши, Шринивас Бангалор и Халил Симаан.

См. также

Ссылки

^ «Специальный вопрос объяснения в прецедентном рассуждении». Обзор искусственного интеллекта . 24 (2). Октябрь 2005 г.
^ Калин-Джегеман, Роберт Дж.; Хорн Ратнер, Хилари (1 декабря 2005 г.). «Роль кодирования в эффекте самообъяснения» . Познание и обучение . 23 (4): 523–543. дои : 10.1207/s1532690xci2304_4 . ISSN 0737-0008 . S2CID 145410154 .
^ Пример черной королевы из Митчелл, Том (1997). Машинное обучение . МакГроу-Хилл. стр. 308–309 . ISBN 0-07-042807-7 .
^ Митчелл, Том (1997). Машинное обучение . МакГроу-Хилл. стр. 320 . ISBN 0-07-042807-7 . В своей чистой форме EBL предполагает переформулирование теории предметной области для создания общих правил, которые классифицируют примеры за один шаг вывода.
^ Минтон, Стивен (1990). «Количественные результаты, касающиеся проблемы полезности в обучении, основанном на объяснениях». Искусственный интеллект . 42 (2–3): 363–392. дои : 10.1016/0004-3702(90)90059-9 .
^ Келлер, Ричард (1988). «Определение функциональности обучения на основе объяснений» (PDF) . Искусственный интеллект . 35 (2): 227–241. дои : 10.1016/0004-3702(88)90013-6 . Проверено 22 февраля 2009 г. Текущее определение операциональности: Описание понятия является функциональным , если его можно эффективно использовать для распознавания экземпляров понятия, которое оно обозначает. После формулирования общего определения в статье фактически выступают против него в пользу более точных критериев.
^ Рейнер, Мэнни (1988). «Применение обобщения на основе объяснений к обработке естественного языка». Процессы. Международная конференция по вычислительной технике пятого поколения, Киото. стр. 1267–1274.
^ Самуэльссон, Кристер; Мэнни Рейнер (1991). «Количественная оценка обучения на основе объяснений как инструмента оптимизации крупномасштабной системы естественного языка». Процессы. 12-я Международная совместная конференция по искусственному интеллекту, Сидней. стр. 609–615. {{cite news}}: CS1 maint: местоположение ( ссылка )
^ Самуэльссон, Кристер (1994). Быстрый анализ естественного языка с использованием обучения на основе объяснений . Стокгольм: Докторская диссертация, Королевский технологический институт.
^ Самуэльссон, Кристер (1996). «Оптимизация таблиц формирования поверхности на основе примеров». в Р. Миткове и Н. Николове (ред.) «Последние достижения в обработке естественного языка», вып. 136 книги «Актуальные проблемы лингвистической теории»: Джон Бенджаминс, Амстердам. {{cite news}}: CS1 maint: местоположение ( ссылка )
^ Рейнер, Мэнни; Дэвид Картер (1996). «Быстрый синтаксический анализ с использованием обрезки и специализации по грамматике» . Процессы. ACL, Санта-Крус.
^ Самуэльссон, Кристер (1994). «Грамматическая специализация через пороги энтропии» . Процессы. ACL, Лас-Крусес. стр. 188–195.
^ Канкедда, Никола; Кристер Самуэльссон (2000). «Специализация по корпусной грамматике». Материалы 4-го семинара по компьютерному изучению естественного языка. {{cite news}}: CS1 maint: местоположение ( ссылка )
^ Рейнер, Мэнни; Бет Энн Хоккей; Пьеретта Бульон (н. д.). Использование лингвистики в распознавании речи: компилятор грамматики Regulus . Центр изучения языка и информации. ISBN 1-57586-526-2 .

[1] «Специальный вопрос объяснения в прецедентном рассуждении». Обзор искусственного интеллекта . 24 (2). Октябрь 2005 г.

[2] Калин-Джегеман, Роберт Дж.; Хорн Ратнер, Хилари (1 декабря 2005 г.). «Роль кодирования в эффекте самообъяснения» . Познание и обучение . 23 (4): 523–543. дои : 10.1207/s1532690xci2304_4 . ISSN 0737-0008 . S2CID 145410154 .

[3] Пример черной королевы из Митчелл, Том (1997). Машинное обучение . МакГроу-Хилл. стр. 308–309 . ISBN 0-07-042807-7 .

[4] Митчелл, Том (1997). Машинное обучение . МакГроу-Хилл. стр. 320 . ISBN 0-07-042807-7 . В своей чистой форме EBL предполагает переформулирование теории предметной области для создания общих правил, которые классифицируют примеры за один шаг вывода.

[5] Минтон, Стивен (1990). «Количественные результаты, касающиеся проблемы полезности в обучении, основанном на объяснениях». Искусственный интеллект . 42 (2–3): 363–392. дои : 10.1016/0004-3702(90)90059-9 .

[6] Келлер, Ричард (1988). «Определение функциональности обучения на основе объяснений» (PDF) . Искусственный интеллект . 35 (2): 227–241. дои : 10.1016/0004-3702(88)90013-6 . Проверено 22 февраля 2009 г. Текущее определение операциональности: Описание понятия является функциональным , если его можно эффективно использовать для распознавания экземпляров понятия, которое оно обозначает. После формулирования общего определения в статье фактически выступают против него в пользу более точных критериев.

[7] Рейнер, Мэнни (1988). «Применение обобщения на основе объяснений к обработке естественного языка». Процессы. Международная конференция по вычислительной технике пятого поколения, Киото. стр. 1267–1274.

[8] Самуэльссон, Кристер; Мэнни Рейнер (1991). «Количественная оценка обучения на основе объяснений как инструмента оптимизации крупномасштабной системы естественного языка». Процессы. 12-я Международная совместная конференция по искусственному интеллекту, Сидней. стр. 609–615. {{cite news}}: CS1 maint: местоположение ( ссылка )

[9] Самуэльссон, Кристер (1994). Быстрый анализ естественного языка с использованием обучения на основе объяснений . Стокгольм: Докторская диссертация, Королевский технологический институт.

[10] Самуэльссон, Кристер (1996). «Оптимизация таблиц формирования поверхности на основе примеров». в Р. Миткове и Н. Николове (ред.) «Последние достижения в обработке естественного языка», вып. 136 книги «Актуальные проблемы лингвистической теории»: Джон Бенджаминс, Амстердам. {{cite news}}: CS1 maint: местоположение ( ссылка )

[11] Рейнер, Мэнни; Дэвид Картер (1996). «Быстрый синтаксический анализ с использованием обрезки и специализации по грамматике» . Процессы. ACL, Санта-Крус.

[12] Самуэльссон, Кристер (1994). «Грамматическая специализация через пороги энтропии» . Процессы. ACL, Лас-Крусес. стр. 188–195.

[13] Канкедда, Никола; Кристер Самуэльссон (2000). «Специализация по корпусной грамматике». Материалы 4-го семинара по компьютерному изучению естественного языка. {{cite news}}: CS1 maint: местоположение ( ссылка )

[14] Рейнер, Мэнни; Бет Энн Хоккей; Пьеретта Бульон (н. д.). Использование лингвистики в распознавании речи: компилятор грамматики Regulus . Центр изучения языка и информации. ISBN 1-57586-526-2 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]