Обучение, основанное на ошибках
Часть серии о |
Машинное обучение и интеллектуальный анализ данных |
---|
Обучение, основанное на ошибках, — это тип метода обучения с подкреплением . модели Этот метод настраивает параметры на основе разницы между предлагаемыми и фактическими результатами. Эти модели выделяются тем, что они зависят от обратной связи с окружающей средой, а не от явных ярлыков или категорий. [1] Они основаны на идее, что овладение языком предполагает минимизацию ошибки прогнозирования (MPSE). [2] Используя эти ошибки прогнозирования, модели последовательно уточняют ожидания и уменьшают сложность вычислений. Обычно эти алгоритмы управляются алгоритмом GeneRec. [3]
Обучение, основанное на ошибках, широко применяется в когнитивных науках и компьютерном зрении . Эти методы также нашли успешное применение в обработке естественного языка (НЛП), включая такие области, как маркировка частей речи , [4] анализ [4] распознавание названного объекта (NER), [5] машинный перевод (МП), [6] распознавание речи (СР) [4] и диалоговые системы . [7]
определение Формальное
Модели обучения, основанные на ошибках, — это модели, которые полагаются на обратную связь об ошибках прогнозирования для корректировки ожиданий или параметров модели. Ключевые компоненты обучения, основанного на ошибках, включают в себя следующее:
- Набор состояний, представляющих различные ситуации, с которыми может столкнуться учащийся.
- Набор действий, которые учащийся может предпринять в каждом состоянии.
- Функция прогнозирования который дает текущий прогноз учащегося о результате действий в штате .
- Функция ошибки который сравнивает фактический результат с предсказанием и выдает значение ошибки.
- Правило обновления это корректирует прогноз в свете ошибки . [2]
Алгоритмы [ править ]
Алгоритмы обучения, управляемые ошибками, относятся к категории алгоритмов обучения с подкреплением , которые используют несоответствие между реальными и ожидаемыми результатами системы для регулирования параметров системы. Эти алгоритмы, обычно применяемые в контролируемом обучении, снабжены набором пар ввода-вывода для облегчения процесса обобщения. [2]
Широко используемый алгоритм обучения обратного распространения ошибки известен как GeneRec , обобщенный алгоритм рециркуляции, в основном используемый для предсказания генов в последовательностях ДНК . Многие другие алгоритмы обучения, основанные на ошибках, созданы на основе альтернативных версий GeneRec. [3]
Приложения [ править ]
наука Когнитивная
Более простые модели обучения, основанного на ошибках, эффективно фиксируют сложные когнитивные явления человека и предвидят неуловимое поведение. Они обеспечивают гибкий механизм моделирования процесса обучения мозга, охватывающий восприятие , внимание , память и принятие решений . Используя ошибки в качестве направляющих сигналов, эти алгоритмы умело адаптируются к меняющимся требованиям и целям окружающей среды, фиксируя статистические закономерности и структуру. [2]
Более того, когнитивная наука привела к созданию новых алгоритмов обучения, основанных на ошибках, которые являются биологически приемлемыми и эффективными в вычислительном отношении . Эти алгоритмы, в том числе сети глубокого убеждения , импульсные нейронные сети и резервуарные вычисления , следуют принципам и ограничениям мозга и нервной системы. Их основная цель — выявить возникающие свойства и динамику нейронных цепей и систем. [2] [8]
Компьютерное зрение [ править ]
Компьютерное зрение — это сложная задача, которая включает в себя понимание и интерпретацию визуальных данных, таких как изображения или видео. [9]
В контексте обучения, основанного на ошибках, модель компьютерного зрения учится на ошибках, которые она допускает в процессе интерпретации. При возникновении ошибки модель обновляет свои внутренние параметры, чтобы избежать повторения той же ошибки в будущем. Этот повторяющийся процесс обучения на ошибках помогает со временем улучшить производительность модели. [9]
Чтобы НЛП преуспело в компьютерном зрении, оно использует методы глубокого обучения. Эту форму компьютерного зрения иногда называют нейрокомпьютерным зрением (NCV), поскольку в ней используются нейронные сети. Таким образом, NCV интерпретирует визуальные данные на основе статистического подхода, метода проб и ошибок и может обрабатывать контекст и другие тонкости визуальных данных. [9]
языка Обработка естественного
Маркировка частей речи [ править ]
Маркировка части речи (POS) является важнейшим компонентом обработки естественного языка (NLP). Это помогает устранить двусмысленность человеческого языка на разных уровнях анализа. Кроме того, его выходные данные (размеченные данные) могут использоваться в различных приложениях НЛП, таких как извлечение информации , поиск информации , ответы на вопросы , распознавание речи , преобразование текста в речь, частичный синтаксический анализ и исправление грамматики. [4]
Разбор [ править ]
Синтаксический анализ в НЛП предполагает разбиение текста на более мелкие части ( фразы ) на основе грамматических правил. Если предложение не может быть разобрано, оно может содержать грамматические ошибки.
В контексте обучения на основе ошибок синтаксический анализатор учится на ошибках, которые он допускает в процессе анализа. При возникновении ошибки анализатор обновляет свою внутреннюю модель, чтобы избежать повторения той же ошибки в будущем. Этот итеративный процесс обучения на ошибках помогает со временем улучшить производительность анализатора. [4]
В заключение отметим, что обучение, основанное на ошибках, играет решающую роль в повышении точности и эффективности анализаторов НЛП, позволяя им учиться на своих ошибках и соответствующим образом адаптировать свои внутренние модели.
Распознавание именованных объектов (NER) [ править ]
NER — это задача идентификации и классификации объектов (таких как люди, места, организации и т. д.) в тексте. Обучение, основанное на ошибках, может помочь модели учиться на ложноположительных и ложноотрицательных результатах, а также улучшить ее отзыв и точность (NER). [5]
В контексте обучения, основанного на ошибках, значение NER весьма велико. Традиционные методы маркировки последовательностей идентифицируют вложенные объекты слой за слоем. Если при распознавании внутренней сущности возникает ошибка , это может привести к неправильной идентификации внешней сущности, что приводит к проблеме, известной как распространение ошибок вложенных сущностей. [10] [11]
Именно здесь роль NER становится решающей в обучении, основанном на ошибках. Точно распознавая и классифицируя объекты, он может помочь свести к минимуму эти ошибки и повысить общую точность процесса обучения. Кроме того, методы NER, основанные на глубоком обучении, оказались более точными, поскольку они способны собирать слова, что позволяет им лучше понимать семантические и синтаксические отношения между различными словами. [10] [11]
Машинный перевод [ править ]
Машинный перевод — это сложная задача, включающая преобразование текста с одного языка на другой. [6] В контексте обучения на основе ошибок модель машинного перевода учится на ошибках, которые она допускает в процессе перевода. При возникновении ошибки модель обновляет свои внутренние параметры, чтобы избежать повторения той же ошибки в будущем. Этот итеративный процесс обучения на ошибках помогает со временем улучшить производительность модели. [12]
Распознавание речи [ править ]
Распознавание речи — сложная задача, которая включает в себя преобразование устной речи в письменный текст. В контексте обучения на основе ошибок модель распознавания речи учится на ошибках, которые она допускает в процессе распознавания. При возникновении ошибки модель обновляет свои внутренние параметры, чтобы избежать повторения той же ошибки в будущем. Этот итеративный процесс обучения на ошибках помогает со временем улучшить производительность модели. [13]
Диалоговые системы [ править ]
Диалоговые системы — популярная задача НЛП, поскольку они имеют многообещающее применение в реальной жизни. Это также сложные задачи, поскольку здесь задействовано множество задач НЛП, заслуживающих изучения.
В контексте обучения, основанного на ошибках, диалоговая система учится на ошибках, которые она допускает в процессе диалога. При возникновении ошибки модель обновляет свои внутренние параметры, чтобы избежать повторения той же ошибки в будущем. Этот итеративный процесс обучения на ошибках помогает со временем улучшить производительность модели. [7]
Преимущества [ править ]
Обучение, основанное на ошибках, имеет ряд преимуществ перед другими типами алгоритмов машинного обучения:
- Они могут учиться на обратной связи и исправлять свои ошибки, что делает их адаптивными и устойчивыми к шуму и изменениям данных.
- Они могут обрабатывать большие и многомерные наборы данных , поскольку не требуют явного проектирования функций или предварительных знаний о распределении данных.
- Они могут добиться высокой точности и производительности, поскольку могут изучить сложные и нелинейные зависимости между входными и выходными данными. [2]
Ограничения [ править ]
Хотя обучение, основанное на ошибках, имеет свои преимущества, их алгоритмы также имеют следующие ограничения:
- Они могут страдать от переоснащения , что означает, что они запоминают данные обучения и не могут обобщить новые и невидимые данные. Это можно смягчить, используя методы регуляризации , такие как добавление штрафного члена к функции потерь или уменьшение сложности модели. [14]
- Они могут быть чувствительны к выбору функции ошибок , скорости обучения , инициализации весов и других гиперпараметров , которые могут повлиять на сходимость и качество решения. Это требует тщательной настройки и экспериментирования или использования адаптивных методов, которые автоматически настраивают гиперпараметры.
- Они могут быть дорогостоящими и трудоемкими в вычислительном отношении , особенно для нелинейных и глубоких моделей, поскольку требуют нескольких итераций (повторений) и вычислений для обновления весов системы. Эту проблему можно облегчить, используя параллельные и распределенные вычисления или используя специализированное оборудование, такое как графические процессоры или TPU. [2]
Ссылки [ править ]
- ^ Садре, Рамин; Прас, Айко (19 июня 2009 г.). Масштабируемость сетей и услуг: Третья международная конференция по автономной инфраструктуре, управлению и безопасности, AIMS 2009, Энсхеде, Нидерланды, 30 июня – 2 июля 2009 г., Материалы . Спрингер. ISBN 978-3-642-02627-0 .
- ↑ Перейти обратно: Перейти обратно: а б с д и ж г Хоппе, Дороти Б.; Хендрикс, Петра; Рамскар, Майкл; ван Рей, Жакольен (01 октября 2022 г.). «Исследование обучения, основанного на ошибках, в простых двухслойных сетях с точки зрения различительного обучения» . Методы исследования поведения . 54 (5): 2221–2251. дои : 10.3758/s13428-021-01711-5 . ISSN 1554-3528 . ПМК 9579095 . ПМИД 35032022 .
- ↑ Перейти обратно: Перейти обратно: а б О'Рейли, Рэндалл К. (1 июля 1996 г.). «Биологически правдоподобное обучение, основанное на ошибках, с использованием различий локальной активации: обобщенный алгоритм рециркуляции» . Нейронные вычисления . 8 (5): 895–938. дои : 10.1162/neco.1996.8.5.895 . ISSN 0899-7667 .
- ↑ Перейти обратно: Перейти обратно: а б с д и Мохаммад, Саиф и Тед Педерсен. « Сочетание лексических и синтаксических функций для контролируемого устранения неоднозначности смысла слов ». Материалы восьмой конференции по компьютерному изучению естественного языка (CoNLL-2004) в HLT-NAACL 2004. 2004.АПА
- ↑ Перейти обратно: Перейти обратно: а б Флориан, Раду и др. « Распознавание именованного объекта посредством комбинации классификаторов ». Материалы седьмой конференции по изучению естественного языка в HLT-NAACL 2003. 2003.
- ↑ Перейти обратно: Перейти обратно: а б Розовская, Алла и Дэн Рот. « Исправление грамматических ошибок: машинный перевод и классификаторы » . Материалы 54-го ежегодного собрания Ассоциации компьютерной лингвистики (Том 1: Длинные статьи) . 2016.
- ↑ Перейти обратно: Перейти обратно: а б Иосиф, Илья; Класинас, Иоаннис; Атанасопулу, Грузия; Палоянниди, Елизавета; Георгиладакис, Спирос; Лука, Катерина; Потамианос, Александрос (01 января 2018 г.). «Понимание речи для систем разговорного диалога: от сбора корпуса до введения грамматических правил» . Компьютерная речь и язык . 47 : 272–297. дои : 10.1016/j.csl.2017.08.002 . ISSN 0885-2308 .
- ^ Бенджио, Ю. (2009). Изучение глубокой архитектуры для ИИ. Основы и тенденции® в машинном обучении, 2 (1), 1-127
- ↑ Перейти обратно: Перейти обратно: а б с Вулодимос, Афанасий; Дуламис, Николаос; Дуламис, Анастасиос; Протопападакис, Эфтихиос (01 февраля 2018 г.). «Глубокое обучение для компьютерного зрения: краткий обзор» . Вычислительный интеллект и нейронаука . 2018 : e7068349. дои : 10.1155/2018/7068349 . ISSN 1687-5265 . ПМЦ 5816885 . ПМИД 29487619 .
- ↑ Перейти обратно: Перейти обратно: а б Чанг, Хау-Шиуань; Вембу, Шанкар; Мохан, Сунил; Уппаал, Рия; МакКаллум, Эндрю (01 сентября 2020 г.). «Использование прогнозирования затухания ошибок для решения практических проблем глубокого активного обучения для распознавания именованных объектов» . Машинное обучение . 109 (9): 1749–1778. arXiv : 1911.07335 . дои : 10.1007/s10994-020-05897-1 . ISSN 1573-0565 .
- ↑ Перейти обратно: Перейти обратно: а б Гао, Вэньчао; Ли, Ю; Гуань, Сяоле; Чен, Шию; Чжао, Шаньшань (25 августа 2022 г.). «Исследование распознавания именованных объектов на основе многозадачного обучения и биаффинного механизма» . Вычислительный интеллект и нейронаука . 2022 : e2687615. дои : 10.1155/2022/2687615 . ISSN 1687-5265 . ПМЦ 9436550 . ПМИД 36059424 .
- ^ Тан, Чжисин; Ян, Цзунхан; Хуан, Сюаньчэн; Сунь, Лю, Ян (01.01.2020 г.) «Нейронный машинный перевод: обзор методов, ресурсов и инструментов» . . AI Open . 1 : 5–21 arXiv : 2012.15515 . doi : 10.1016 . j.aiopen.2020.11.001 / .
- ^ А. Тхакур, Л. Ахуджа, Р. Вашиш и Р. Саймон, « НЛП и распознавание речи с использованием искусственного интеллекта: аналитический обзор », 2023 г., 10-я Международная конференция по вычислениям для устойчивого глобального развития (INDIACom) , Нью-Дели, Индия, 2023 г., стр. 1390-1396.
- ^ Аджила, Сэмюэл А.; Лунг, Чунг-Хорнг; Дас, Анураг (01 июня 2022 г.). «Анализ алгоритмов машинного обучения на основе ошибок при обнаружении и категоризации сетевых аномалий» . Анналы телекоммуникаций . 77 (5): 359–370. дои : 10.1007/s12243-021-00836-0 . ISSN 1958-9395 .