Jump to content

Автоматизированное машинное обучение

Автоматизированное машинное обучение ( AutoML ) — это процесс автоматизации задач применения машинного обучения к реальным проблемам. Это сочетание автоматизации и машинного обучения. [1]

AutoML потенциально включает в себя каждый этап: от создания необработанного набора данных до построения модели машинного обучения, готовой к развертыванию. AutoML был предложен как решение на основе искусственного интеллекта для решения растущей проблемы применения машинного обучения. [2] [3] Высокая степень автоматизации AutoML позволяет неспециалистам использовать модели и методы машинного обучения, не требуя от них становиться экспертами в машинном обучении. Комплексная автоматизация процесса применения машинного обучения дополнительно дает преимущества, заключающиеся в создании более простых решений, более быстрого создания этих решений и моделей, которые часто превосходят модели, разработанные вручную. [4]

Общие методы, используемые в AutoML, включают оптимизацию гиперпараметров , метаобучение и поиск нейронной архитектуры .

Сравнение со стандартным подходом

[ редактировать ]

В типичном приложении машинного обучения у специалистов есть набор входных данных, которые можно использовать для обучения. Необработанные данные могут быть не в той форме, к которой можно применить все алгоритмы. Чтобы сделать данные пригодными для машинного обучения, эксперту, возможно, придется применить соответствующие предварительной обработки данных , разработки признаков , извлечения признаков и выбора признаков методы . После этих шагов специалисты-практики должны выполнить выбор алгоритма и оптимизацию гиперпараметров, чтобы максимизировать прогностическую эффективность своей модели. Если используется глубокое обучение, архитектура нейронной сети также должна выбираться вручную экспертом по машинному обучению.

Каждый из этих шагов может быть сложным, что приводит к серьезным препятствиям на пути использования машинного обучения. Цель AutoML — упростить эти шаги для неспециалистов и облегчить им правильное и эффективное использование методов машинного обучения.

AutoML играет важную роль в более широком подходе к автоматизации обработки данных , который также включает в себя сложные задачи, такие как обработка данных, исследование данных, интерпретация и прогнозирование моделей. [5]

Цели автоматизации

[ редактировать ]

Автоматизированное машинное обучение может охватывать различные этапы процесса машинного обучения. [3] Шаги по автоматизации:

Проблемы и ограничения

[ редактировать ]

В сфере автоматизированного машинного обучения решается ряд ключевых проблем. Большая проблема, связанная с этой областью, называется «развитие как надомное производство». [7] Эта фраза относится к проблеме машинного обучения, когда разработка зависит от ручных решений и предвзятости экспертов. Это контрастирует с целью машинного обучения, которая заключается в создании систем, которые могут учиться и совершенствоваться на основе собственного использования и анализа данных. По сути, это борьба между тем, сколько экспертов должно участвовать в изучении систем, и тем, сколько свободы они должны предоставить машинам. Однако эксперты и разработчики должны помогать создавать и направлять эти машины, чтобы подготовить их к собственному обучению. Для создания этой системы требуется трудоемкая работа со знанием алгоритмов машинного обучения и проектирования систем . [8]

Кроме того, некоторые другие проблемы включают проблемы метаобучения. [9] и распределение вычислительных ресурсов.

См. также

[ редактировать ]
  1. ^ Спирс, Тейлор; Бондо Хансен, Кристиан (18 декабря 2023 г.), «Использование и перспективы машинного обучения на финансовых рынках» , Оксфордский справочник по социологии машинного обучения , Oxford University Press, ISBN  978-0-19-765360-9 , получено 10 июня 2024 г.
  2. ^ Торнтон С., Хаттер Ф., Хоос Х.Х., Лейтон-Браун К. (2013). Auto-WEKA: Комбинированный выбор и оптимизация гиперпараметров алгоритмов классификации . KDD '13 Материалы 19-й международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных. стр. 847–855.
  3. ^ Jump up to: а б Хаттер Ф., Каруана Р., Бардене Р., Биленко М., Гийон И., Кегль Б. и Ларошель Х. «AutoML 2014 @ ICML» . Семинар AutoML 2014 @ ICML . Проверено 28 марта 2018 г. [ постоянная мертвая ссылка ]
  4. ^ Олсон, Р.С., Урбанович, Р.Дж., Эндрюс, ПК, Лаванда, Н.А., Кидд, Л.К., Мур, Дж.Х. (2016). Автоматизация обработки биомедицинских данных посредством оптимизации конвейеров на основе деревьев. В: Сквиллеро Г., Бурелли П. (ред.) Применения эволюционных вычислений. EvoApplications 2016. Конспекты лекций по информатике (), том 9597. Springer, Cham. дои : 10.1007/978-3-319-31204-0_9
  5. ^ Пчела, Лайм; Де Рэдт, Люк; Эрнандес-Оралло, Хосе; Хоос, Хольгер Х.; Смит, Падрайк; Уильямс, Кристофер К.И. (март 2022 г.). «Автоматизация науки о данных» . Коммуникации АКМ . 65 (3): 76–87. дои : 10.1145/3495256 . hdl : 10251/199907 .
  6. ^ Эриксон, Ник; Мюллер, Йонас; Ширков, Александр; Чжан, Ханг; Ларрой, Педро; Ли, Му; Смола, Александр (13 марта 2020 г.). «AutoGluon-Tabular: надежный и точный AutoML для структурированных данных». arXiv : 2003.06505 [ stat.ML ].
  7. ^ Хаттер, Фрэнк; Коттофф, Ларс; Ваншорен, Хоакин, ред. (2019). Автоматизированное машинное обучение: методы, системы, проблемы . Серия Springer о проблемах машинного обучения. Спрингер Природа. дои : 10.1007/978-3-030-05318-5 . hdl : 20.500.12657/23012 . ISBN  978-3-030-05317-8 .
  8. ^ Гловер, Эллен (2018). «Машинное обучение с помощью Python: кластеризация» . Встроенный . дои : 10.4135/9781526466426 .
  9. ^ «Проблемы метаобучения» . metalearning.chalearn.org . Проверено 03 декабря 2023 г.

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 9f8a692f6c611716f879e36f9a7f122c__1721778300
URL1:https://arc.ask3.ru/arc/aa/9f/2c/9f8a692f6c611716f879e36f9a7f122c.html
Заголовок, (Title) документа по адресу, URL1:
Automated machine learning - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)