Прогнозирующее обучение
Прогнозирующее обучение — это метод машинного обучения , при котором модели искусственного интеллекта предоставляются новые данные для лучшего понимания ее среды, возможностей и ограничений. Эта техника широко применяется в нейробиологии , бизнесе , робототехнике , компьютерном зрении и других областях. Эта концепция была разработана и расширена французским ученым-компьютерщиком Яном Лекуном в 1988 году во время его карьеры в Bell Labs , где он обучал модели распознавать почерк, чтобы финансовые компании могли автоматизировать обработку чеков. [1]
Математическая основа прогнозного обучения зародилась в 17 веке, когда британская страховая компания Lloyd's использовала модели прогнозного анализа для получения прибыли. [2] Начавшись как математическая концепция, эта концепция расширила возможности искусственного интеллекта. Прогнозирующее обучение — это попытка обучения с минимумом уже существующей ментальной структуры. Он был вдохновлен рассказом Пиаже о детях, познающих мир посредством взаимодействия. Книга Гэри Дрешера «Придуманные умы» сыграла решающую роль в развитии этой концепции. [3]
Идея о том, что предсказания и бессознательные выводы используются мозгом для построения модели мира, в которой он может определять причины восприятия , восходит еще к Германом фон Гельмгольцем повторению этого исследования . Позднее эти идеи были подхвачены в области предиктивного кодирования . Другая родственная теория прогнозирующего обучения — это Джеффа Хокинса , теория предсказания памяти которая изложена в его книге «Об интеллекте» .
Математические процедуры
[ редактировать ]Тренировочный процесс
[ редактировать ]Подобно машинному обучению, прогнозирующее обучение направлено на экстраполяцию значения неизвестной зависимой переменной y по независимым входным данным x = (x 1 , x 2 , … , x n ) . Набор атрибутов можно разделить на категориальные данные (неизмеримые факторы, такие как раса, пол или принадлежность) и числовые данные (измеримые значения, такие как температура, годовой доход и средняя скорость). Каждый набор входных значений передается в нейронную сеть для прогнозирования значения y. Чтобы точно предсказать результат, веса нейронной сети (показывающие, насколько каждая переменная-предиктор влияет на результат) должны постепенно корректироваться с использованием стохастического градиентного спуска, чтобы приблизить оценки к фактическим данным.
Как только в модель машинного обучения будут внесены достаточные корректировки и обучение для прогнозирования значений, более близких к фактическим значениям, она сможет правильно прогнозировать выходные данные новых данных с небольшой ошибкой ε (обычно ε <0,001 ) по сравнению с фактическими данными.
Максимальная точность
[ редактировать ]Чтобы обеспечить максимальную точность модели прогнозируемого обучения, прогнозируемые значения ŷ = F(x) по сравнению с фактическими значениями y не должны превышать определенный порог ошибки по формуле риска
,
где L представляет функцию потерь , y — фактические данные, а F (x) — прогнозируемые данные. Эта функция ошибок затем используется для постепенной корректировки весов модели, чтобы в конечном итоге получить хорошо обученный прогноз
. [4]
Даже если вы постоянно обучаете модель машинного обучения, добиться нулевой ошибки невозможно. Но если ошибка достаточно незначительна, то говорят, что модель сходится, и будущие прогнозы будут точными в подавляющем большинстве случаев.
Ансамблевое обучение
[ редактировать ]В некоторых случаях использования одного подхода машинного обучения недостаточно для получения точной оценки определенных данных. Ансамблевое обучение — это комбинация нескольких алгоритмов машинного обучения для создания более точной оценки. Каждая модель машинного обучения представлена функцией
F(x) = а 0 + а м ж м (х) ,
где M — количество использованных методов, a 0 — смещение, a m — вес, соответствующий каждой m-й переменной, а f m (x) — функция активации, соответствующая каждой переменной. Модель ансамблевого обучения представлена как линейная комбинация прогнозов каждого составляющего подхода:
{â m } = аргумент мин L(y i ,a 0 + а м ж м (х я )) + λ |а м | ,
где y i — фактическое значение, второй параметр — это значение, предсказанное каждым составляющим методом, а λ — коэффициент, представляющий изменение каждой модели для определенной предикторной переменной. [4]
Приложения
[ редактировать ]Когнитивное развитие
[ редактировать ]Сенсомоторные сигналы — это нервные импульсы, посылаемые в мозг при физическом прикосновении. Использование прогнозирующего обучения для обнаружения сенсомоторных сигналов играет ключевую роль в раннем когнитивном развитии , поскольку человеческий мозг представляет сенсомоторные сигналы прогнозирующим образом (он пытается минимизировать ошибку прогнозирования между входящими сенсорными сигналами и прогнозированием сверху вниз ). Чтобы обновить нескорректированный предиктор, его необходимо обучить с помощью сенсомоторного опыта, поскольку он по своей сути не обладает способностью прогнозирования. [5] В недавней исследовательской работе доктор Юкиэ Нагай предложил новую архитектуру прогнозирующего обучения для прогнозирования сенсомоторных сигналов на основе двухмодульного подхода: сенсомоторной системы, которая взаимодействует с окружающей средой, и предсказателя, который имитирует сенсомоторную систему в мозге. [5]
Пространственно-временная память
[ редактировать ]Компьютеры используют прогнозирующее обучение в пространственно-временной памяти, чтобы полностью создать изображение по заданным составным кадрам . В этой реализации используются прогнозирующие рекуррентные нейронные сети , которые представляют собой нейронные сети, предназначенные для работы с последовательными данными, такими как временные ряды . [ нужна ссылка ] Использование прогнозирующего обучения в сочетании с компьютерным зрением позволяет компьютерам создавать собственные изображения, что может быть полезно при воспроизведении последовательных явлений, таких как репликация нитей ДНК, распознавание лиц или даже создание рентгеновских изображений.
Поведение потребителей в социальных сетях
[ редактировать ]В недавнем исследовании данные о поведении потребителей были собраны из различных социальных сетей, таких как Facebook, Twitter, LinkedIn, YouTube, Instagram и Pinterest. Использование аналитики прогнозного обучения позволило исследователям обнаружить различные тенденции в поведении потребителей, такие как определение того, насколько успешной может быть кампания, оценка справедливой цены на продукт для привлечения потребителей, оценка того, насколько безопасны данные и анализ конкретной аудитории. потребителей, на которых они могли бы ориентироваться для конкретных продуктов. [6]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Янн ЛеКун «Прогнозирующее обучение: новый рубеж в области искусственного интеллекта» » . Лаборатория Nokia Bell . 17 февраля 2017 г. Проверено 4 ноября 2023 г.
- ^ Корпорация, Прогнозирующий успех (06 мая 2019 г.). «Краткая история прогнозной аналитики» . Середина . Проверено 27 октября 2023 г.
- ^ Дрешер, Гэри Л. (1991). Придуманные умы: конструктивистский подход к искусственному интеллекту . МТИ Пресс. ISBN 978-0-262-04120-1 .
- ^ Jump up to: а б Фридман, Джером Х.; Попеску, Богдан Э. (17 сентября 2008 г.). «Прогнозирующее обучение с помощью ансамблей правил» . Анналы прикладной статистики . 2 (3): 916–954. arXiv : 0811.1679 . дои : 10.1214/07-AOAS148 . ISSN 1932-6157 .
- ^ Jump up to: а б Нагай, Юкиэ (29 апреля 2019 г.). «Прогнозирующее обучение: его ключевая роль в раннем когнитивном развитии» . Философские труды Королевского общества B: Биологические науки . 374 : 20180030.doi : (1771 ) 10.1098/rstb.2018.0030 . ISSN 0962-8436 . ПМЦ 6452246 . ПМИД 30852990 .
- ^ Чаудхари, Киран; Алам, Мансаф; Аль-Рахами, Мабрук С.; Гумаи, Абду (25 мая 2021 г.). «Математическое моделирование на основе машинного обучения для прогнозирования поведения потребителей в социальных сетях с использованием анализа больших данных» . Журнал больших данных . 8 (1): 73. дои : 10.1186/s40537-021-00466-2 . ISSN 2196-1115 .