Обучение дополненному алгоритму
Алгоритм с расширенным обучением — это алгоритм , который может использовать прогноз для повышения своей производительности. [1] В то время как в обычные алгоритмы вводится только экземпляр задачи, алгоритмы с расширенным обучением принимают дополнительный параметр.Этот дополнительный параметр часто является предсказанием какого-либо свойства решения.Этот прогноз затем используется алгоритмом для улучшения времени его работы или качества вывода.
Описание
[ редактировать ]Алгоритм с расширенным обучением обычно принимает входные данные . Здесь это проблемный экземпляр и это совет: предсказание определенного свойства оптимального решения. Тип экземпляра проблемы и прогноз зависят от алгоритма. Алгоритмы расширенного обучения обычно удовлетворяют следующим двум свойствам:
- Последовательность. Алгоритм с расширенным обучением считается последовательным, если можно доказать, что алгоритм имеет хорошую производительность, когда ему предоставляется точный прогноз. [1] Обычно это определяется количественно путем определения границы производительности, которая зависит от ошибки прогноза.
- Надежность. Алгоритм называется устойчивым, если его производительность в наихудшем случае может быть ограничена, даже если данный прогноз неточен. [1]
Алгоритмы расширенного обучения обычно не предписывают, как следует делать прогноз. Для этой цели машинное обучение . можно использовать [ нужна ссылка ]
Примеры
[ редактировать ]Бинарный поиск
[ редактировать ]Алгоритм бинарного поиска — это алгоритм поиска элементов отсортированного списка. . Это требует шаги по поиску элемента с некоторым известным значением в списке длины .С предсказанием на должность , можно использовать следующий алгоритм расширенного обучения. [1]
- Сначала посмотрите на положение в списке. Если , элемент найден.
- Если , посмотрите позиции до тех пор, пока индекс с найден.
- Теперь выполните двоичный поиск по .
- Если , делаем то же, что и в предыдущем случае, но вместо этого рассмотрим .
Ошибка определяется как , где это реальный показатель .В алгоритме дополненного обучения проверка позиций берет шаги.Затем выполняется бинарный поиск по списку размером не более , что занимает шаги. Это делает общее время работы алгоритма .Таким образом, когда ошибка невелика, алгоритм работает быстрее, чем обычный двоичный поиск. Это показывает, что алгоритм непротиворечив.Даже в худшем случае ошибка будет максимум . Тогда алгоритм занимает не более шагов, поэтому алгоритм устойчив.
Больше примеров
[ редактировать ]Алгоритмы дополненного обучения известны благодаря:
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д Митценмахер, Михаэль ; Васильвицкий, Сергей (31 декабря 2020 г.). «Алгоритмы с предсказаниями». Помимо анализа алгоритмов наихудшего случая . Издательство Кембриджского университета. стр. 646–662. arXiv : 2006.09123 . дои : 10.1017/9781108637435.037 .
- ^ Ван, Шуфан; Ли, Цзянь; Ван, Шицян (2020). «Онлайн-алгоритмы для проката лыж в нескольких магазинах с советами, полученными на основе машинного обучения». NIPS'20: Материалы 34-й Международной конференции по нейронным системам обработки информации . arXiv : 2002.05808 . ISBN 1-71382-954-1 . OCLC 1263313383 .
- ^ Диниц, Майкл; Я, Сонджин; Лавастида, Томас; Бенджамин, Бенджамин; Васильвицкий, Сергей (2021). «Более быстрое сопоставление с помощью изученных дуалов». Достижения в области нейронных систем обработки информации (PDF) . Карран Ассошиэйтс, Инк.
- ^ Бансал, Нихил; Костер, Кристиан; Кумар, Рави; Пурохит, Маниш; Ви, Эрик (январь 2022 г.). «Взвешенный пейджинг с расширенным обучением». Материалы ежегодного симпозиума ACM-SIAM по дискретным алгоритмам (SODA) 2022 года . Общество промышленной и прикладной математики. стр. 67–89. дои : 10.1137/1.9781611977073.4 .