Jump to content

Машинное обучение

(Перенаправлено от обучения ИИ )

Машинное обучение ( ML ) - это область исследования в области искусственного интеллекта , связанного с разработкой и изучением статистических алгоритмов , которые могут учиться на данных и обобщать до невидимых данных и, таким образом, выполнять задачи без явных инструкций . [ 1 ] Недавно искусственные нейронные сети смогли превзойти много предыдущих подходов к производительности. [ 2 ]

ML находит приложение во многих областях, включая обработку естественного языка , компьютерное зрение , распознавание речи , фильтрацию электронной почты , сельское хозяйство и медицину. [ 3 ] [ 4 ] При применении к бизнес -проблемам это известно под именем прогнозирующей аналитики . Хотя не все машинное обучение основано на статистике , вычислительная статистика является важным источником методов поля.

Математические основы ML предоставляются методами математической оптимизации (математического программирования). Распространение данных - это связанная (параллельная) область исследования, сосредоточенная на анализе исследовательского анализа (EDA) посредством неконтролируемого обучения . [ 6 ] [ 7 ]

С теоретической точки зрения, вероятно, приблизительно правильное (PAC) обучение обеспечивает основу для описания машинного обучения.

Термин «машинное обучение» было придумано в 1959 году Артуром Самуэлем , сотрудником IBM и пионером в области компьютерных игр и искусственного интеллекта . [ 8 ] [ 9 ] Синонимические компьютеры самообучения также использовались в этот период времени. [ 10 ] [ 11 ]

Хотя самая ранняя модель машинного обучения была введена в 1950 -х годах, когда Артур Самуэль изобрел программу , которая рассчитала шанс на победу в шашках для каждой стороны, история машинного обучения корни в десятилетиях человеческого желания и усилий по изучению человеческих когнитивных процессов. [ 12 ] В 1949 году канадский психолог Дональд Хебб опубликовал книгу «Организация поведения» , в которой он ввел теоретическую нейронную структуру , сформированную определенными взаимодействиями между нервными клетками . [ 13 ] Модель нейронов HEBB , взаимодействующих друг с другом, создает основу для того, как работают AIS и алгоритмы машинного обучения под узлами, или искусственные нейроны, используемые компьютерами для передачи данных. [ 12 ] Другие исследователи, которые изучали человеческие когнитивные системы, также внесли свой вклад в современные технологии машинного обучения, в том числе логик Уолтер Питтс и Уоррен МакКаллох , которые предложили ранние математические модели нейронных сетей, чтобы придумать алгоритмы, которые отражают человеческие мыслительные процессы. [ 12 ]

экспериментальную «учебную машину» с перфорированной ленточной разработала К началу 1960 -х годов Raytheon Company памятью, называемой Cybertron для анализа сигналов , электрокардиограмм и речевых моделей с использованием элементарного обучения подкреплению . Это было повторяется «обученным» человеком -оператором/учителем распознавать закономерности и оснащен кнопкой « дурака », чтобы заставить его переоценить неправильные решения. [ 14 ] Представительной книгой по исследованиям машинного обучения в 1960 -х годах была книга Нильссона по обучению, в основном с помощью машинного обучения для классификации шаблонов. [ 15 ] Интерес, связанный с распознаванием закономерности, продолжался в 1970 -х годах, как описано Дуда и Харт в 1973 году. [ 16 ] В 1981 году был дан отчет об использовании стратегий обучения, чтобы искусственная нейронная сеть училась распознавать 40 символов (26 букв, 10 цифр и 4 специальных символов) из компьютерного терминала. [ 17 ]

Том М. Митчелл предоставил широко цитируемое, более формальное определение алгоритмов, изученных в области машинного обучения: «Говорят, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности p, если ее производительность в задачах в задачах в задача В T , как измеряется P , улучшается с опытом e . " [ 18 ] Это определение задач, в которых происходит машинное обучение, предлагает принципиально оперативное определение, а не определение поля в когнитивных терминах. Это следует за Алана Тьюринга предложением в его статье « Компьютерная техника и интеллект », в котором вопрос «могут думать машины?» Заменяется ли вопрос: «Могут ли машины делать то, что мы (как мыслительные сущности) можем делать?». [ 19 ]

Современное машинное обучение имеет две цели. Одним из них является классификация данных на основе моделей, которые были разработаны; Другая цель - сделать прогнозы для будущих результатов на основе этих моделей. Гипотетический алгоритм, специфичный для классификации данных, может использовать компьютерное зрение родинок в сочетании с контролируемым обучением, чтобы обучить его классификации раковых молей. Алгоритм машинного обучения для торговли акциями может информировать трейдера о будущих потенциальных прогнозах. [ 20 ]

Отношения с другими областями

[ редактировать ]

Искусственный интеллект

[ редактировать ]
Машинное обучение как подполя искусственного интеллекта [ 21 ]

Как научное усилие, машинное обучение выросло из поиска искусственного интеллекта (ИИ). В первые дни ИИ как академической дисциплины некоторые исследователи были заинтересованы в том, чтобы машины учились на данных. Они попытались подойти к проблеме с различными символическими методами, а также то, что затем называлось « нейронными сетями »; В основном это были персептроны и другие модели , которые позже были обнаружены изобретательными излучениями обобщенных линейных моделей статистики. [ 22 ] Вероятностные рассуждения также использовались, особенно в автоматической медицинской диагностике . [ 23 ] : 488 

Тем не менее, растущий акцент на логическом, основанном на знаниях подход вызвал разрыв между ИИ и машинным обучением. Вероятностные системы страдали теоретическими и практическими проблемами сбора данных и представления. [ 23 ] : 488  К 1980 году экспертные системы стали доминировать в ИИ, а статистика была не в пользу. [ 24 ] Работа над символическим/основанным на знаниях обучалась в области искусственного интеллекта, что привело к индуктивному логическому программированию (ILP), но более статистическая линия исследований теперь была за пределами области самого ИИ, в распознавании и поиске информации . [ 23 ] : 708–710, 755  Исследование нейронных сетей было заброшено ИИ и компьютерными науками примерно в то же время. Эта линия также была продолжена за пределами области AI/CS, как « консинизм », исследователями из других дисциплин, включая Хопфилд , Рамельхарт и Хинтон . Их главный успех достиг середины 1980-х годов с переосмыслением обратного распространения . [ 23 ] : 25 

Машинное обучение (ML), реорганизованное и признанное в качестве собственной области, начало процветать в 1990 -х годах. Поле изменило свою цель с достижения искусственного интеллекта на решение решения о практическом характере. Он сместил фокус от символических подходов, которые он унаследовал от ИИ, и к методам и моделям, заимствованным из статистики, нечеткой логики и теории вероятностей . [ 24 ]

Сжатие данных

[ редактировать ]

Существует тесная связь между машинным обучением и сжатием. Система, которая предсказывает заднюю вероятность последовательности, учитывая всю ее историю, может использоваться для оптимального сжатия данных (с использованием арифметического кодирования при выходном распределении). И наоборот, оптимальный компрессор может быть использован для прогнозирования (обнаружив символ, который сжимается лучше всего, учитывая предыдущую историю). Эта эквивалентность использовалась в качестве оправдания для использования сжатия данных в качестве эталона для «общей интеллекта». [ 25 ] [ 26 ] [ 27 ]

Альтернативный представление может показать алгоритмы сжатия неявно отображать строки в неявные объекты пространства векторов , а также измерения сходства на основе сжатия вычисления сходства в этих пространствах признаков. Для каждого компрессора C (.) Мы определяем связанное векторное пространство ℵ, так что C (.) Отображает входную строку x, соответствующую векторной норме || ~ x ||. Исчерпывающее исследование пространств функций, лежащих в основе всех алгоритмов сжатия, предоставляется пространством; Вместо этого Vectors предпочитают изучить три репрезентативных метода сжатия без потерь, LZW, LZ77 и PPM. [ 28 ]

Согласно теории Aixi , соединение, более непосредственно объясняемое в Hutter Prize , наилучшим возможным сжатием X является наименьшее возможное программное обеспечение, которое генерирует x. Например, в этой модели сжатый размер zip -файла включает в себя как zip -файл, так и программное обеспечение для охраны, так как вы не можете разкапливаться без зрелищного его без обоих, но может быть еще меньшая комбинированная форма.

Примеры программного обеспечения для аудио/видео сжатия AI включают NVIDIA Maxine , AIVC. [ 29 ] Примеры программного обеспечения, которые могут выполнить сжатие изображений с AI, включают OpenCV , TensorFlow , инструментальный кадр обработки изображений MATLAB (IPT) и сжатие генеративного изображения с высокой точностью. [ 30 ]

В неконтролируемом машинном обучении кластеризация K-средних может быть использована для сжатия данных путем группировки аналогичных точек данных в кластеры. Этот метод упрощает обработку обширных наборов данных, в которых отсутствуют предопределенные этикетки и находит широкое использование в таких полях, как сжатие изображений . [ 31 ]

Сжатие данных направлено на сокращение размера файлов данных, повышение эффективности хранения и ускорение передачи данных. Clustering K-Means, неконтролируемый алгоритм машинного обучения, используется для разделения набора данных на указанное количество кластеров, K, каждая из которых представлен центроидом его точек. Этот процесс конфигурирует обширные наборы данных в более компактный набор репрезентативных точек. Особенно полезные в изображений и обработке сигналов , кластеризации K-средних помогают в снижении данных, заменив группы точек данных на их центроиды, тем самым сохраняя основную информацию о исходных данных, в то же время значительно уменьшая необходимое пространство для хранения. [ 32 ]

Большие языковые модели (LLMS) также способны к сжатию данных без потерь, как продемонстрировано исследованием DeepMind с моделью Chinchilla 70B. Разработанный DeepMind, Chinchilla 70b эффективно сжатые данные, превосходящие традиционные методы, такие как портативная сетевая графика (PNG) для изображений и свободный аудиокодек без потерь (FLAC) для аудио. Он достиг сжатия изображений и аудиодатчиков до 43,4% и 16,4% их первоначальных размеров соответственно. [ 33 ]

Добыча данных

[ редактировать ]

Машинное обучение и интеллектуальный анализ данных часто используют одни и те же методы и существенно перекрываются, но хотя машинное обучение фокусируется на прогнозировании, основываясь на известных свойствах, полученных из учебных данных, интеллектуальный анализ данных фокусируется на обнаружении (ранее) неизвестных свойствах в данных (это Шаг анализа обнаружения знаний в базах данных). Рабочие данные используют много методов машинного обучения, но с разными целями; С другой стороны, в машинном обучении также используются методы интеллектуального анализа данных в качестве « неконтролируемого обучения » или в качестве шага предварительной обработки для повышения точности учащегося. Большая часть путаницы между этими двумя исследовательскими сообществами (которые часто имеют отдельные конференции и отдельные журналы, ECML PKDD является основным исключением) происходит из основных допущений, с которыми они работают: в машинном обучении производительность обычно оценивается в отношении способности Воспроизведите известные знания, в то время как в обнаружении знаний и интеллектуальном анализе данных (KDD) ключевой задачей является обнаружение ранее неизвестных знаний. Оцениваемый в отношении известных знаний, неосведомленный (неконтролируемый) метод будет легко опережать другими контролируемыми методами, в то время как в типичной задаче KDD методы контролируемых не могут использоваться из -за недоступности учебных данных.

Машинное обучение также имеет интимные связи с оптимизацией : многие проблемы обучения сформулированы как минимизация некоторой функции потерь в учебном наборе примеров. Функции потерь выражают расхождение между прогнозами подготовленной модели, и фактическими экземплярами задачи (например, в классификации, кто хочет назначить этикетку на экземпляры, а модели обучаются правильно предсказать предусмотренные этикетки множества примеров) Полем [ 34 ]

Обобщение

[ редактировать ]

Характеристика обобщения различных алгоритмов обучения является активной темой текущих исследований, особенно для алгоритмов глубокого обучения .

Статистика

[ редактировать ]

Машинное обучение и статистика являются тесно связанными областями с точки зрения методов, но отличаются по своей основной цели: статистика делает выводы населения из выборки , в то время как машинное обучение находит обобщенные прогнозирующие закономерности. [ 35 ] По словам Майкла И. Джордана , идеи машинного обучения, от методологических принципов до теоретических инструментов, имели долгую предварительную историю в статистике. [ 36 ] Он также предложил термин «Наука данных» в качестве заполнителя, чтобы назвать общую область. [ 36 ]

Обычные статистические анализы требуют априорного выбора модели, наиболее подходящей для набора данных исследования. Кроме того, для анализа включены только значительные или теоретически релевантные переменные, основанные на предыдущем опыте. Напротив, машинное обучение не построено на предварительно структурированной модели; Скорее, данные формируют модель, обнаружив основные шаблоны. Чем больше переменных (вход) используется для обучения модели, тем точнее будет конечная модель. [ 37 ]

Лео Брейман отличил две парадигмы статистического моделирования: модель данных и алгоритмическая модель, [ 38 ] где «алгоритмическая модель» означает более или менее алгоритмы машинного обучения, такие как случайный лес .

Некоторые статистики приняли методы из машинного обучения, что привело к комбинированной области, которую они называют статистическим обучением . [ 39 ]

Статистическая физика

[ редактировать ]

Аналитические и вычислительные методы, полученные из глубоко укоренившейся физики беспорядочных систем, могут быть распространены на крупномасштабные проблемы, включая машинное обучение, например, для анализа весового пространства глубоких нейронных сетей . [ 40 ] Таким образом, статистическая физика находит приложения в области медицинской диагностики . [ 41 ]

Основной целью учащегося является обобщение из его опыта. [ 5 ] [ 42 ] Обобщение в этом контексте - это способность учебной машины точно выполнять новые, невидимые примеры/задачи после того, как испытал набор данных обучения. Примеры обучения поступают из некоторого в целом неизвестного распределения вероятностей (считается репрезентативным для пространства случаев), и учащийся должен построить общую модель об этом пространстве, которая позволяет ему создавать достаточно точные прогнозы в новых случаях.

Вычислительный анализ алгоритмов машинного обучения и их производительность представляют собой отрасль теоретической компьютерной науки, известной как теория вычислительного обучения, через, вероятно, приблизительно правильное обучение (PAC). Поскольку учебные наборы конечны, а будущее неопределенное, теория обучения обычно не дает гарантий производительности алгоритмов. Вместо этого вероятностные границы производительности довольно распространены. Разложение предвзятости - варианта является одним из способов количественной оценки ошибки обобщения .

Для наилучшей производительности в контексте обобщения сложность гипотезы должна соответствовать сложности функции, лежащей в основе данных. Если гипотеза менее сложна, чем функция, то модель подходит к данным. Если сложность модели увеличивается в ответ, то ошибка обучения уменьшается. Но если гипотеза слишком сложна, то модель подвергается переоснащению , а обобщение будет беднее. [ 43 ]

В дополнение к границам производительности, теоретики обучения изучают сложность времени и осуществимость обучения. В теории вычислительного обучения вычисление считается возможным, если это можно сделать во время полинома . Существует два вида результатов сложности времени : положительные результаты показывают, что определенный класс функций может быть изучен в полиномиальное время. Отрицательные результаты показывают, что определенные классы не могут быть изучены в полиномиальное время.

Подходы машинного обучения традиционно разделены на три широкие категории, которые соответствуют парадигмам обучения, в зависимости от природы «сигнала» или «обратной связи», доступной для системы обучения:

  • Наблюдаемое обучение : компьютер представлен с примерами входов и желаемых результатов, данных «учителем», и цель состоит в том, чтобы изучить общее правило, которое отображает входы на выходы.
  • Обучение без присмотра : в алгоритме обучения не дается никаких ярлыков, оставляя его самостоятельно, чтобы найти структуру в его вводе. Неконтролируемое обучение может быть целью сама по себе (обнаружение скрытых закономерностей в данных) или средством к концу ( обучение функции ).
  • Подкрепление обучения : компьютерная программа взаимодействует с динамичной средой, в которой она должна выполнять определенную цель (например, вождение транспортного средства или игра в игру против противника). Поскольку он навигает на свое заданное пространство, программа предоставляется обратная связь, которая аналогична вознаграждениям, которые она пытается максимизировать. [ 5 ]

Хотя каждый алгоритм имеет преимущества и ограничения, ни один алгоритм не работает для всех проблем. [ 44 ] [ 45 ] [ 46 ]

Контролируемое обучение

[ редактировать ]
Машина поддержки-вектора -это контролируемая модель обучения, которая делит данные на области, разделенные линейной границей . Здесь линейная граница отделяет черные круги от белого.

Алгоритмы обучения. Создают математическую модель набора данных, которые содержат как входы, так и желаемые выходы. [ 47 ] Данные, известные как данные обучения , состоит из набора примеров обучения. Каждый пример обучения имеет один или несколько входов и желаемый выход, также известный как наблюдательный сигнал. В математической модели каждый пример обучения представлен массивом или вектором, иногда называемым вектором признаков , а данные обучения представлены матрицей . Благодаря итеративной оптимизации целевой функции контролируемые алгоритмы обучения изучают функцию, которую можно использовать для прогнозирования вывода, связанных с новыми входами. [ 48 ] Оптимальная функция позволяет алгоритму правильно определять выход для входов, которые не были частью учебных данных. Говорят, что алгоритм, который повышает точность его результатов или прогнозов с течением времени, научился выполнять эту задачу. [ 18 ]

Типы алгоритмов контролируемого обучения включают активное обучение , классификацию и регрессию . [ 49 ] Алгоритмы классификации используются, когда выходы ограничены ограниченным набором значений, а алгоритмы регрессии используются, когда выходы могут иметь какое -либо числовое значение в диапазоне. Например, для алгоритма классификации, который фильтрует электронные письма, ввод будет входящим электронным письмом, и вывод будет именем папки, в которую можно подать электронное письмо. Примерами регрессии было бы предсказать высоту человека или будущую температуру. [ 50 ]

Обучение сходства - это область контролируемого машинного обучения, тесно связанная с регрессией и классификацией, но цель состоит в том, чтобы учиться на примерах, используя функцию сходства, которая измеряет, насколько похожи или связаны два объекта. Он имеет приложения в рейтинге , системах рекомендаций , отслеживании визуальных идентификаций, проверке лиц и проверке динамиков.

Неконтролируемое обучение

[ редактировать ]

Неконтролируемые алгоритмы обучения находят структуры в данных, которые не были помечены, классифицированы или классифицированы. Вместо того, чтобы реагировать на обратную связь, неконтролируемые алгоритмы обучения идентифицируют общие черты в данных и реагируют на основе наличия или отсутствия таких общих черт в каждой новой части данных. Центральное применение неконтролируемого машинного обучения включают кластеризацию, сокращение размерности , [ 7 ] и оценка плотности . [ 51 ] Неконтролируемые алгоритмы обучения также оптимизировали процесс идентификации крупных индела на основе гаплотипов , представляющего интерес гена от пан-генома . [ 52 ]

Кластеризация с помощью больших индел -перестановленных склонов, клипов, [ 53 ] превращает изображение выравнивания в проблему с регрессией обучения. Разнообразные оценки наклона ( B ) между каждой парой сегментов ДНК позволяют идентифицировать сегменты, разделяющие один и тот же набор инделей.

Кластерный анализ - это присвоение набора наблюдений в подмножествах (называемых кластерами ), так что наблюдения в одном кластере сходны в соответствии с одним или несколькими предварительно проведенными критериями, в то время как наблюдения, взятые из разных кластеров, являются разнородными. Различные методы кластеризации делают различные предположения о структуре данных, часто определяемых некоторым показателем сходства и оцениваемыми, например, с помощью внутренней компактности или сходства между членами одного и того же кластера и разделением , разницей между кластерами. Другие методы основаны на оценочной плотности и связности графика .

Особый тип неконтролируемого обучения, называемого самоподдерживанным обучением, включает в себя обучение модели путем генерации наблюдательного сигнала из самого данных. [ 54 ] [ 55 ]

Полуопервизированное обучение

[ редактировать ]

Полупроницаемое обучение падает между неконтролируемым обучением (без каких-либо помеченных данных обучения) и контролируемого обучения (с полностью помеченными данными обучения). Некоторые из примеров обучения не хватают учебных меток, однако многие исследователи машинного обучения обнаружили, что немеченые данные, используемые в сочетании с небольшим количеством меченых данных, могут привести к значительному улучшению точности обучения.

В слабо контролируемом обучении учебные этикетки шумные, ограниченные или неточные; Тем не менее, эти этикетки часто дешевле, что приводит к более крупным эффективным учебным наборам. [ 56 ]

Подкрепление обучения

[ редактировать ]

Подкрепляющее обучение - это область машинного обучения, связанная с тем, как программные агенты должны предпринять действия в среде, чтобы максимизировать некоторое представление о совокупном вознаграждении. Благодаря своей общности, поле изучается во многих других дисциплинах, таких как теория игр , теория управления , исследования операций , теория информации , оптимизация на основе моделирования , многоагентные системы , разведка роя , статистика и генетические алгоритмы . В обучении подкрепления окружающая среда обычно представлена ​​в качестве процесса принятия решений Марков (MDP). Многие подкрепления алгоритмов обучения используют методы динамического программирования . [ 57 ] Алгоритмы обучения подкрепления не предполагают знания о точной математической модели MDP и используются, когда точные модели невозможны. Алгоритмы обучения подкрепления используются в автономных транспортных средствах или в обучении игре против противника.

Сокращение размерности

[ редактировать ]

Снижение размерности - это процесс уменьшения количества рассматриваемых случайных величин путем получения набора основных переменных. [ 58 ] Другими словами, это процесс уменьшения измерения набора функций , также называемый «количество функций». Большинство методов уменьшения размерности могут рассматриваться как удаление функций или извлечение . Одним из популярных методов снижения размерности является анализ основных компонентов (PCA). PCA включает в себя изменение более высоких данных (например, 3D) на меньшее пространство (например, 2D). Гипотеза многообразии предполагает, что высокоразмерные наборы данных лежат вдоль низкоразмерных многообразий , и многие методы сокращения размерности делают это предположение, что приводит к области многообразимого обучения и регуляризации многообразий .

Другие типы

[ редактировать ]

Были разработаны другие подходы, которые не вписываются в эту трехкратную категоризацию, а иногда более одного используется одной и той же системой машинного обучения. Например, тематическое моделирование , мета-обучение . [ 59 ]

Самообучение

[ редактировать ]

Самообучение, как парадигма машинного обучения была введена в 1982 году вместе с нейронной сетью, способной к самообучению, названной адаптивной массив Crossbar (CAA). [ 60 ] Он учится без внешних вознаграждений и не рекомендуется внешним учителям. Алгоритм самообучения CAA вычисляет по перекладине как решения о действиях, так и эмоциях (чувствах) о последствиях ситуаций. Система обусловлена ​​взаимодействием между познанием и эмоциями. [ 61 ] Алгоритм самообучения обновляет матрицу памяти w = || w (a, s) || так, чтобы в каждой итерации выполняет следующую процедуру машинного обучения:

  1. В ситуации S выполнять действие
  2. Получите последующую ситуацию S '
  3. Вычислить эмоции быть в последующей ситуации V (S ')
  4. Обновление памяти перекладок W '(a, s) = w (a, s) + v (s')

Это система с одним входом, ситуацией и только одним выводом, действием (или поведением) a. Не существует ни отдельного ввода подкрепления, ни совета по вводу из окружающей среды. Перепапененная ценность (вторичное подкрепление) является эмоцией в отношении ситуации с последующей ситуацией. CAA существует в двух средах, одна из них - это поведенческая среда, в которой она ведет себя, а другая - генетическая среда, от которой она изначально и только один раз получает начальные эмоции о ситуациях, которые возникают в поведенческой среде. После получения вектора генома (видов) из генетической среды CAA изучает поведение, стремящее к целям, в среде, которая содержит как желательные, так и нежелательные ситуации. [ 62 ]

Особенность обучения

[ редактировать ]

Несколько алгоритмов обучения направлены на то, чтобы обнаружить лучшие представления о входных данных, предоставленных во время обучения. [ 63 ] Классические примеры включают анализ основных компонентов и кластерный анализ. Алгоритмы обучения функциями, также называемые алгоритмами обучения представления, часто пытаются сохранить информацию в своем вводе, но также преобразовать ее таким образом, чтобы сделать ее полезным, часто в качестве предварительного обработки перед выполнением классификации или прогнозов. Этот метод позволяет реконструировать входные данные, исходящие из неизвестного распределения, генерирующего данные, и не обязательно верна конфигурациям, которые неправдоподобны в соответствии с этим распределением. Это заменяет ручную проектирование функций и позволяет машине изучать функции и использовать их для выполнения определенной задачи.

Обучение функции может быть либо контролировано, либо неконтролируемой. В контролируемом обучении функций функции изучаются с использованием помеченных входных данных. Примеры включают в себя искусственные нейронные сети , многослойные персептроны и контролируемое обучение словаря . В неконтролируемом обучении функций функции изучаются с немечеными входными данными. Примеры включают в себя обучение словаря, независимый анализ компонентов , автоэкодер , матричная факторизация [ 64 ] и различные формы кластеризации . [ 65 ] [ 66 ] [ 67 ]

Алгоритмы обучения многообразии пытаются сделать это под ограничением того, что ученый представление является низким уровнем. Разреженные алгоритмы кодирования пытаются сделать это при ограничении, что ученый представление является скудным, что означает, что у математической модели есть много нулей. Многолинейные алгоритмы обучения подпространены направлены на изучение низкоразмерных представлений непосредственно из тензора для многомерных данных, не изменяя их в более высоких векторах. [ 68 ] Алгоритмы глубокого обучения обнаруживают несколько уровней представления или иерархию особенностей, с более высокими, более абстрактными функциями, определенными с точки зрения (или генерирования) функций более низкого уровня. Утверждалось, что интеллектуальная машина - это та, которая изучает представление, которое распутывает основные факторы вариации, которые объясняют наблюдаемые данные. [ 69 ]

Обучение функций мотивируется тем фактом, что задачи машинного обучения, такие как классификация, часто требуют ввода, который математически и вычислительно удобен для обработки. Тем не менее, реальные данные, такие как изображения, видео и сенсорные данные, не дали попыток алгоритмически определить конкретные функции. Альтернативой является обнаружение таких функций или представлений посредством изучения, не полагаясь на явные алгоритмы.

Разреженное словарное обучение

[ редактировать ]

Sparse Dictionary Learning - это метод обучения функциями, в котором пример обучения представлен как линейная комбинация базисных функций и предполагается, что является редкой матрицей . Метод решительно NP-Hard и трудно решить приблизительно. [ 70 ] Популярный эвристический метод для редкого словаря обучения -это алгоритм K -SVD . Разрешенное словарное обучение применяется в нескольких контекстах. В классификации проблема состоит в том, чтобы определить класс, к которому принадлежит ранее невидимый пример обучения. Для словаря, где каждый класс уже был построен, новый пример обучения связан с классом, который лучше всего редко представлен соответствующим словарем. Sparse Dictionary Learning также было применено в дефекте изображения . Ключевая идея состоит в том, что чистый патч изображения может быть редко представлен словарем изображений, но шум не может. [ 71 ]

Обнаружение аномалии

[ редактировать ]

В добыче данных обнаружение аномалий, также известное как обнаружение выбросов, является идентификацией редких элементов, событий или наблюдений, которые значительно выявляют подозрения, значительно отличающиеся от большинства данных. [ 72 ] Как правило, аномальные элементы представляют собой проблему, такую ​​как мошенничество с банком , структурный дефект, проблемы со здоровьем или ошибки в тексте. Аномалии называются выбросами , новинками, шумом, отклонениями и исключениями. [ 73 ]

В частности, в контексте злоупотребления и обнаружения вторжения в сеть интересные объекты часто являются не редкими объектами, а неожиданными всплесками бездействия. Этот шаблон не придерживается общего статистического определения выброса как редкого объекта. Многие методы обнаружения выбросов (в частности, неконтролируемые алгоритмы) будут терпеть неудачу по таким данным, если только агрегируются надлежащим образом. Вместо этого алгоритм кластерного анализа может быть способным обнаружить микро-кластеры, образованные этими моделями. [ 74 ]

Существуют три широкие категории методов обнаружения аномалий. [ 75 ] Методы обнаружения аномалий без приспособленности обнаруживают аномалии в немеченном наборе тестовых данных в предположении, что большинство экземпляров в наборе данных являются нормальными, ища экземпляры, которые, по -видимому, соответствуют оставшимся набору данных. Контролируемые методы обнаружения аномалий требуют набора данных, который был помечен как «нормальный» и «ненормальный» и включает в себя обучение классификатора (ключевое отличие от многих других статистических задач классификации - это несбалансированный характер обнаружения выбросов). Полупроницаемые методы обнаружения аномалий создают модель, представляющую нормальное поведение из данного нормального обучающего набора данных, а затем проверьте вероятность создания экземпляра тестирования моделью.

Robot Learning вдохновлено множеством методов машинного обучения, начиная с контролируемого обучения, обучения подкреплению, [ 76 ] [ 77 ] и, наконец, мета-обучение (например, MAML).

Ассоциация Правила

[ редактировать ]

Обучение правилам ассоциации-это метод машинного обучения на основе правил для обнаружения отношений между переменными в крупных базах данных. Он предназначен для определения сильных правил, обнаруженных в базах данных, используя некоторую меру «интересности». [ 78 ]

Машинное обучение на основе правил является общим термином для любого метода машинного обучения, который идентифицирует, изучает или развивает «правила» для хранения, манипулирования или применения знаний. Определяющей характеристикой алгоритма машинного обучения, основанного на правилах, является идентификация и использование набора реляционных правил, которые в совокупности представляют знания, захваченные системой. Это в отличие от других алгоритмов машинного обучения, которые обычно идентифицируют единственную модель, которая может быть повсеместно применена к любому экземпляру, чтобы сделать прогноз. [ 79 ] Подходы машинного обучения на основе правил включают системы обучения классификатора , обучение правилам ассоциации и искусственную иммунную систему .

Основываясь на концепции сильных правил, Rakesh Agrawal , Tomasz Imieliński и Arun Swami представили правила ассоциации для обнаружения закономерности между продуктами в крупномасштабных данных о транзакциях, зарегистрированных в точечных (POS) в супермаркетах. системах [ 80 ] Например, правило Найденные в данных о продажах супермаркета указывают, что если клиент покупает лук и картофель вместе, он, вероятно, также купит мясо гамбургера. Такая информация может использоваться в качестве основы для решений о маркетинговых мероприятиях, таких как рекламные цены или размещение продуктов . В дополнение к анализу рыночной корзины , правила ассоциации используются сегодня в областях применения, включая добычу использования в Интернете , обнаружение вторжений , непрерывное производство и биоинформатику . В отличие от добычи последовательностей , обучение правила ассоциации обычно не учитывает порядок элементов ни в рамках транзакции, ни в разных транзакциях.

Системы обучения классификатора (LCS) представляют собой семейство алгоритмов машинного обучения на основе правил, которые объединяют компонент Discovery, обычно генетический алгоритм , с компонентом обучения, выполняющим либо контролируемое обучение , обучение подкреплению или неконтролируемое обучение . Они стремятся определить набор зависимых от контекста правил, которые в совокупности хранят и применяют знания кусочно , чтобы сделать прогнозы. [ 81 ]

Индуктивное логическое программирование (ILP) - это подход к обучению правилам с использованием логического программирования в качестве равномерного представления для входных примеров, фоновых знаний и гипотез. Учитывая кодирование известных фоновых знаний и набора примеров, представленных в качестве логической базы данных фактов, система ILP выведет гипотетическую логическую программу, которая влечет за собой все положительные и без отрицательных примеров. Индуктивное программирование - это связанная область, которая рассматривает любой вид языка программирования для представления гипотез (и не только логического программирования), таких как функциональные программы .

Индуктивное логическое программирование особенно полезно при биоинформатике и обработке естественного языка . Гордон Плоткин и Эхуд Шапиро заложили начальную теоретическую основу для индуктивного машинного обучения в логической обстановке. [ 82 ] [ 83 ] [ 84 ] Шапиро построил свою первую реализацию (система вывода моделей) в 1981 году: программа Prolog, которая индуктивно выводила логические программы из положительных и отрицательных примеров. [ 85 ] Термин «Индуктивный здесь» относится к философской индукции, предполагая теорию объяснения наблюдаемых фактов, а не математической индукции , доказывая свойство для всех членов хорошо упорядоченного набора.

А Модель машинного обучения - это тип математической модели , которая после «обучения» на данном наборе данных может использоваться для прогнозирования или классификаций по новым данным. Во время обучения алгоритм обучения итеративно корректирует внутренние параметры модели, чтобы минимизировать ошибки в своих прогнозах. [ 86 ] В соответствии с расширением термин «модель» может относиться к нескольким уровням специфичности, от общего класса моделей и связанных с ними алгоритмов обучения до полностью обученной модели со всеми его внутренними параметрами. [ 87 ]

Различные типы моделей были использованы и исследованы для систем машинного обучения, выбор лучшей модели для задачи называется выбором модели .

Искусственные нейронные сети

[ редактировать ]
Искусственная нейронная сеть - это взаимосвязанная группа узлов, сродни обширной сети нейронов в мозге . Здесь каждый круглый узел представляет искусственный нейрон , а стрелка представляет собой соединение от вывода одного искусственного нейрона к вводу другого.

Искусственные нейронные сети (ANNS), или коннекционистские системы, являются вычислительными системами, смутно вдохновленными биологическими нейронными сетями , которые составляют мозг животных . Такие системы «учатся» выполнять задачи, рассматривая примеры, как правило, не запрограммированные с какими-либо конкретными правилами.

ANN - это модель, основанная на коллекции подключенных единиц или узлов, называемых « искусственными нейронами », которые свободно моделируют нейроны в биологическом мозге. Каждое соединение, как и синапсы в биологическом мозге, может передавать информацию, «сигнал», от одного искусственного нейрона в другой. Искусственный нейрон, который получает сигнал, может обрабатывать его, а затем сигнализировать о дополнительных искусственных нейронах, подключенных к нему. В общих реализациях ANN сигнал при связи между искусственными нейронами является реальным числом , и выходной сигнал каждого искусственного нейрона вычисляется некоторой нелинейной функцией суммы его входов. Связи между искусственными нейронами называются «краями». Искусственные нейроны и края обычно имеют вес , который регулируется по мере продолжения обучения. Вес увеличивает или уменьшает прочность сигнала при соединении. Искусственные нейроны могут иметь порог, так что сигнал отправляется только в том случае, если агрегатный сигнал пересекает пороговое значение. Как правило, искусственные нейроны агрегируются в слои. Различные слои могут выполнять различные виды преобразований на своих входах. Сигналы перемещаются от первого слоя (входной слой) к последнему слою (выходной слой), возможно, после нескольких раз пройдя слои.

Первоначальная цель подхода ANN состояла в том, чтобы решить проблемы так же, как человеческий мозг . Однако со временем внимание уделялось выполнению конкретных задач, что привело к отклонению от биологии . Искусственные нейронные сети использовались в различных задачах, включая компьютерное зрение , распознавание речи , машинный перевод , социальной сети фильтрация , игровые доски и видеоигры и медицинский диагноз .

Глубокое обучение состоит из нескольких скрытых слоев в искусственной нейронной сети. Этот подход пытается моделировать способ обрабатывает свет человеческого мозга и звучать в зрение и слух. Некоторые успешные приложения глубокого обучения - это компьютерное зрение и распознавание речи. [ 88 ]

Деревья решений

[ редактировать ]
Дерево решений, показывающее вероятность выживания пассажиров на Титанике

Обучение дерева решений использует дерево решений в качестве прогнозной модели, чтобы перейти от наблюдений об элементе (представленном в ветвях), к выводам о целевом значении элемента (представлено в листьях). Это один из подходов к прогнозирующему моделированию, используемым в статистике, интеллектуальном анализе данных и машинном обучении. Модели деревьев, где целевая переменная может принимать дискретный набор значений, называются классификационными деревьями; В этих структурах деревьев листья представляют этикетки класса, а ветви представляют соединения функций, которые приводят к этим классовым меткам. Деревья решений, где целевая переменная может принимать непрерывные значения (обычно реальные числа ), называются деревьями регрессии. В анализе решений дерево решений может использоваться для визуального и явно представлять решения и принятие решений . При интеллектуальном анализе дерева решений описывается данные, но полученное дерево классификации может быть входным введением для принятия решений.

Машины поддержки-вектора

[ редактировать ]

Машины поддержки-вектора (SVM), также известные как сети поддержки, представляют собой набор связанных контролируемых методов обучения, используемых для классификации и регрессии. Учитывая набор примеров обучения, каждый из которых отмечен как принадлежащий одной из двух категорий, алгоритм обучения SVM создает модель, которая предсказывает, попадает ли новый пример в одну категорию. [ 89 ] Алгоритм обучения SVM представляет собой не вероятностный , бинарный , линейный классификатор , хотя существуют такие методы, как масштабирование Platt для использования SVM в вероятностной классификации. В дополнение к выполнению линейной классификации, SVM могут эффективно выполнять нелинейную классификацию, используя так называемую трюку ядра , неявно отображая их входы в высокомерные пространства признаков.

Регрессионный анализ

[ редактировать ]
Иллюстрация линейной регрессии на наборе данных

Регрессионный анализ включает в себя большое разнообразие статистических методов для оценки взаимосвязи между входными переменными и связанными с ними функциями. Его наиболее распространенной формой является линейная регрессия , когда одна строка используется, чтобы наилучшим образом соответствовать данным данным в соответствии с математическим критерием, таким как обычные наименьшие квадраты . Последнее часто расширяется методами регуляризации для смягчения переосмысления и смещения, как при регрессии хребта . При решении нелинейных задач модели включают полиномиальную регрессию (например, используется для подгонки Trendline в Microsoft Excel [ 90 ] ), логистическая регрессия (часто используемая в статистической классификации ) или даже регрессии ядра , которая вводит нелинейность, используя преимущества трюка ядра , чтобы неявно отобразить входные переменные в более высокое пространство.

Байесовские сети

[ редактировать ]
Простая байесовская сеть. Дождь влияет на то, активируется ли спринклер, и и дождь, и спринклер влияют на влажную траву.

Байесовская сеть, сеть убеждений или направленная ациклическая графическая модель представляет собой вероятностную графическую модель , которая представляет собой набор случайных величин и их условную независимость с направленным ациклическим графом (DAG). Например, байесовская сеть может представлять вероятностные отношения между заболеваниями и симптомами. Учитывая симптомы, сеть может быть использована для вычисления вероятностей наличия различных заболеваний. Существуют эффективные алгоритмы, которые выполняют вывод и обучение. Байесовские сети, которые моделируют последовательности переменных, такие как речевые сигналы или белковые последовательности , называются динамическими байесовскими сетями . Обобщения байесовских сетей, которые могут представлять и решать проблемы принятия решений в рамках неопределенности, называются диаграммами влияния .

Гауссовые процессы

[ редактировать ]
Пример регрессии процесса Гаусса (прогнозирование) по сравнению с другими моделями регрессии [ 91 ]

Гауссовый процесс-это стохастический процесс , в котором каждая конечная коллекция случайных величин в процессе имеет многомерное нормальное распределение и опирается на предварительно определенную ковариационную функцию или ядро, которые моделируют, как пары точек связаны друг с другом в зависимости в их местоположениях.

Учитывая набор наблюдаемых точек или примеров ввода -вывода, распределение (ненаблюдаемого) вывода новой точки как функции его входных данных может быть непосредственно рассчитано, выглядя как наблюдаемые точки и ковариации между этими точками и новыми , ненаблюдаемая точка.

Гауссовые процессы являются популярными суррогатными моделями в байесовской оптимизации, используемой для оптимизации гиперпараметрических .

Генетические алгоритмы

[ редактировать ]

Генетический алгоритм (GA) - это алгоритм поиска и эвристический метод, который имитирует процесс естественного отбора , используя такие методы, как мутация и кроссовер для генерации новых генотипов в надежде найти хорошие решения для данной проблемы. В машинном обучении генетические алгоритмы использовались в 1980 -х и 1990 -х годах. [ 92 ] [ 93 ] И наоборот, методы машинного обучения использовались для повышения производительности генетических и эволюционных алгоритмов . [ 94 ]

Функции веры

[ редактировать ]

Теория функций веры, также называемая теорией доказательств или теории Демпстера -Шафер, является общей основой для рассуждения с неопределенностью, с понятыми связями с другими рамками, такими как вероятность , вероятность и неточные теории вероятности . Эти теоретические рамки можно рассматривать как своего рода ученик и обладать некоторыми аналогичными свойствами того, как комбинируется доказательства (например, правило комбинации Демпстера), как и в PMF, основанном на PMF. байесовском подходе на основе [ нужно разъяснения ] объединит вероятности. Тем не менее, существует много предостережений в этих функциях убеждений по сравнению с байесовскими подходами, чтобы включить количественное определение невежества и неопределенности . Эти подходы функции убеждений, которые реализованы в области машинного обучения, обычно используют подход слияния различных ансамблевых методов учащегося , чтобы лучше справиться с границей решений , низкими выборочными образцами и неоднозначными классовыми проблемами, которые стандартный подход машинного обучения, как правило, испытывают затруднения. [ 4 ] [ 9 ] Тем не менее, вычислительная сложность этих алгоритмов зависит от количества предложений (классов) и может привести к гораздо большему времени вычисления по сравнению с другими подходами машинного обучения.

Тренировочные модели

[ редактировать ]

Как правило, модели машинного обучения требуют большого количества надежных данных для выполнения точных прогнозов. При обучении модели машинного обучения инженеры машинного обучения должны нацелиться и собирать большую и репрезентативную выборку данных. Данные из учебного набора могут быть такими же разнообразными, как и корпус текста , сбор изображений, данных датчиков и данных, собранных от отдельных пользователей службы. Переживание - это то, что следует обратить внимание при обучении модели машинного обучения. Обученные модели, полученные из смещенных или не оцениваемых данных, могут привести к искаженным или нежелательным прогнозам. Предвзятые модели могут привести к вредным результатам, тем самым способствуя негативному воздействию на общество или цели. Алгоритмический смещение является потенциальным результатом того, что данные не будут полностью подготовлены к обучению. Этика машинного обучения становится областью обучения и, в частности, становятся интегрированными в команды машиностроения машиностроения.

Федеративное обучение

[ редактировать ]

Федеративное обучение - это адаптированная форма распределенного искусственного интеллекта для моделей обучающего машинного обучения, которые децентрализуют процесс обучения, что позволяет поддерживать конфиденциальность пользователей, не нуждаясь в отправке своих данных на централизованный сервер. Это также повышает эффективность за счет децентрализации процесса обучения для многих устройств. Например, Gboard использует федеративное машинное обучение для обучения моделей прогнозирования поисковых запросов на мобильных телефонах пользователей без необходимости отправлять отдельные поиски обратно в Google . [ 95 ]

Приложения

[ редактировать ]

Есть много приложений для машинного обучения, в том числе:

В 2006 году поставщик медиа-сервисов Netflix провел первую конкурс « Netflix Prize », чтобы найти программу для лучшего прогнозирования предпочтений пользователей и повышения точности существующего алгоритма рекомендаций фильма Cinematch по меньшей мере на 10%. Совместная команда, состоящая из исследователей из AT & T Labs -Research, в сотрудничестве с большим хаосом и прагматической теорией, создала модель ансамбля , чтобы выиграть главный приз в 2009 году за 1 миллион долларов. [ 98 ] Вскоре после того, как приз был награжден, Netflix понял, что рейтинги зрителей не были лучшими показателями их моделей просмотра («Все - это рекомендация»), и они соответственно изменили свой двигатель рекомендаций. [ 99 ] В 2010 году The Wall Street Journal написал о исследованиях Firm Rebellion и их использовании машинного обучения для прогнозирования финансового кризиса. [ 100 ] В 2012 году соучредитель Sun Microsystems , Vinod Khosla , предсказал, что 80% рабочих мест врачей будут потеряны в ближайшие два десятилетия для автоматизированного программного обеспечения для медицинского диагностики машинного обучения. [ 101 ] В 2014 году было сообщено, что алгоритм машинного обучения было применено в области истории искусства для изучения картин изобразительного искусства и что он, возможно, выявил ранее непризнанные влияния среди художников. [ 102 ] В 2019 году Springer Nature опубликовала первую исследовательскую книгу, созданную с использованием машинного обучения. [ 103 ] В 2020 году была использована технология машинного обучения, чтобы помочь поставить диагнозы и помочь исследователям в разработке лекарства от Covid-19. [ 104 ] Машинное обучение было недавно применено для прогнозирования про-экологического поведения путешественников. [ 105 ] Недавно технология машинного обучения также была применена для оптимизации производительности и теплового поведения смартфона на основе взаимодействия пользователя с телефоном. [ 106 ] [ 107 ] [ 108 ] При правильном применении алгоритмы машинного обучения (MLA) могут использовать широкий спектр характеристик компании для прогнозирования доходности акций без переживания . Используя эффективную инженерную функции и объединяя прогнозы, MLAS может приносить результаты, которые намного превосходят результаты, полученные из основных линейных методов, таких как OLS . [ 109 ]

Недавние достижения в области машинного обучения распространились в области квантовой химии, где новые алгоритмы теперь позволяют прогнозировать эффекты растворителя на химические реакции, тем самым предлагая новые инструменты для химиков для адаптации экспериментальных условий для оптимальных результатов. [ 110 ]

Машинное обучение становится полезным инструментом для исследования и прогнозирования принятия решений о эвакуации в крупномасштабных и мелких катастрофах. Различные решения были проверены, чтобы предсказать, если домовладельцы решат эвакуироваться во время лесных пожаров и ураганов. [ 111 ] [ 112 ] [ 113 ] Другие заявки сосредоточены на решениях перед эвакуацией при строительстве пожаров. [ 114 ] [ 115 ]

Ограничения

[ редактировать ]

Хотя машинное обучение было преобразующим в некоторых областях, программы машинного обучения часто не дают ожидаемых результатов. [ 116 ] [ 117 ] [ 118 ] Причины этого многочисленны: отсутствие (подходящих) данных, отсутствие доступа к данным, смещение данных, проблемы конфиденциальности, плохо выбранные задачи и алгоритмы, неправильные инструменты и люди, отсутствие ресурсов и проблемы оценки. [ 119 ]

« Теория черного ящика » представляет собой еще одну значительную проблему. Черный ящик относится к ситуации, когда алгоритм или процесс производства вывода совершенно непрозрачный, что означает, что даже кодеры алгоритма не могут проверять шаблон, который машина извлекла из данных. [ 120 ] Отбранный комитет Палаты лордов, который утверждал, что такая «разведывательная система», которая может оказать «существенное влияние на жизнь человека», не будет считаться приемлемой, если она не предоставит «полное и удовлетворительное объяснение принятия решений». [ 120 ]

В 2018 году автомобиль с самостоятельным вождением от Uber не смогла обнаружить пешехода, который был убит после столкновения. [ 121 ] Попытки использовать машинное обучение в сфере здравоохранения с системой IBM Watson не смогли доставить даже после многих лет и вложены миллиарды долларов. [ 122 ] [ 123 ] Microsoft Bing Chatbot производит враждебную и оскорбительную реакцию на своих пользователей. Сообщалось, что чат [ 124 ]

Машинное обучение использовалось в качестве стратегии для обновления доказательств, связанных с систематическим обзором, и повышенной нагрузкой рецензента, связанного с ростом биомедицинской литературы. Несмотря на то, что он улучшился с учебными наборами, он еще недостаточно развился, чтобы уменьшить бремя рабочей нагрузки, не ограничивая необходимую чувствительность для самого исследования результатов. [ 125 ]

Предвзятость

[ редактировать ]

Различные подходы машинного обучения могут страдать от разных смещений данных. Система машинного обучения, обученная специально для нынешних клиентов, может не иметь возможности предсказать потребности новых групп клиентов, которые не представлены в данных обучения. При обучении на людях, созданное человеком, машинное обучение, вероятно, приведет к конституционным и бессознательным предубеждениям, уже присутствующим в обществе. [ 126 ]

Было показано, что языковые модели, полученные из данных, содержат похожие на человека смещения. [ 127 ] [ 128 ] В эксперименте, проведенном ProPublica , исследовательской организацией журналистской организации, понимание алгоритма машинного обучения о показателях рецидивизма среди заключенных ложно помечало «чернокожих обвиняемых высокого риска в два раза чаще, чем белые обвиняемые». [ 129 ] В 2015 году фотографии Google часто помечали чернокожих как горилл, [ 129 ] А в 2018 году это все еще не было хорошо решено, но, как сообщается, Google все еще использовал обходной путь для удаления всех горилл из данных обучения, и, таким образом, вообще не смог распознать настоящие гориллы. [ 130 ] Подобные проблемы с признанием небелых людей были найдены во многих других системах. [ 131 ] В 2016 году Microsoft проверила Tay , чат -бот , который узнал из Twitter, и он быстро подобрал расистский и сексистский язык. [ 132 ]

Из -за таких проблем эффективное использование машинного обучения может потребоваться дольше, чтобы быть принятым в других областях. [ 133 ] Забота о справедливости в машинном обучении, то есть уменьшение предвзятости в машинном обучении и продвижение его использования для человеческого блага, все чаще выражается учеными искусственного интеллекта, в том числе Фей-Феи Ли , которые напоминают инженерам, что »[t] нет ничего искусственного в ИИ И. [ 134 ]

Объяснение

[ редактировать ]

Объясняемый ИИ (XAI), или интерпретируемый ИИ, или объяснимое машинное обучение (XML), является искусственным интеллектом (ИИ), в котором люди могут понимать решения или прогнозы, принятые ИИ. [ 135 ] Он контрастирует с концепцией «черного ящика» в машинном обучении, где даже его дизайнеры не могут объяснить, почему ИИ достиг конкретного решения. [ 136 ] Уточнив ментальные модели пользователей систем с AI и демонтируя их неправильные представления, XAI обещает помочь пользователям работать более эффективно. XAI может быть реализацией социального права на объяснение.

Переосмысление

[ редактировать ]
Синяя линия может быть примером пережитки линейной функции из -за случайного шума.

Установка на плохую, чрезмерно сложную теорию сместительна, чтобы соответствовать всем прошлым учебным данным, известно как переосмысление. Многие системы пытаются уменьшить переосмысление, вознаграждая теорию в соответствии с тем, насколько хорошо она соответствует данным, но наказывая теорию в соответствии с тем, насколько сложна теория. [ 137 ]

Другие ограничения и уязвимости

[ редактировать ]

Учащиеся также могут разочаровать, узнав не тот урок ». Игрушечным примером является то, что классификатор изображений, обученный только на фотографиях коричневых лошадей и черных кошек, может сделать вывод, что все коричневые пятна, вероятно, будут лошадьми. [ 138 ] Реальным примером является то, что, в отличие от людей, нынешние классификаторы изображений часто не выносят суждения о пространственных отношениях между компонентами картины, и они изучают отношения между пикселями, которые люди не обращают внимания, но все еще коррелируют с изображениями определенных определенных Типы реальных объектов. Изменение этих шаблонов на законном изображении может привести к «состязательным» изображениям, которые система неправильно классифицирует. [ 139 ] [ 140 ]

Уязвимости состязания также могут привести к нелинейным системам или от не-паттернов. Для некоторых систем можно изменить выход, только изменив один состязанный пиксель. [ 141 ] Модели машинного обучения часто уязвимы к манипуляциям и/или уклонке через состязательное машинное обучение . [ 142 ]

Исследователи продемонстрировали, как бэкдоры могут быть незаметно помещены в классификацию (например, для категорий «спам» и хорошо видно «не спам» постов) модели машинного обучения, которые часто разрабатываются и/или обучаются третьими лицами. тип прозрачности данных/программного обеспечения Стороны могут изменить классификацию любого ввода, в том числе в тех случаях, для которых обеспечивается , возможно, включая доступ к белой коробке . [ 143 ] [ 144 ] [ 145 ]

Оценки моделей

[ редактировать ]

Классификация моделей машинного обучения может быть подтверждена с помощью методов оценки точности, таких как метод удержания , который разрывает данные в обучающем и тестовом наборе (обычный обучающий набор 2/3 и обозначение 1/3 тестового набора) и оценивает производительность учебной модели На тестовом наборе. Для сравнения, метод перекрестной проверки k-солд-перекрестной проверки случайным образом разделяет данные на подгруппы K, а затем k эксперименты выполняются каждый соответственно с учетом 1 подмножества для оценки и оставшихся подмножеств K-1 для обучения модели. В дополнение к методам удержания и перекрестной проверки Bootstrap , который вызывает экземпляры n с заменой из набора данных, может использоваться для оценки точности модели. [ 146 ]

В дополнение к общей точности, исследователи часто сообщают о чувствительности и специфичности , означающей истинную положительную скорость (TPR) и истинную отрицательную скорость (TNR) соответственно. Аналогичным образом, исследователи иногда сообщают о ложном положительном уровне (FPR), а также о ложном отрицательном уровне (FNR). Тем не менее, эти скорости являются соотношениями, которые не выявляют их числителей и знаменателей. Общая операционная характеристика (TOC) является эффективным методом для выражения диагностической способности модели. TOC показывает числители и знаменатели ранее упомянутых скоростей, таким образом, TOC предоставляет больше информации, чем обычно используемой рабочей характеристики приемника (ROC) и связанной области ROC под кривой (AUC). [ 147 ]

Машинное обучение ставит множество этических вопросов . Системы, которые обучаются на наборе данных, собранные с помощью смещений, могут демонстрировать эти смещения при использовании ( алгоритмическое смещение ), таким образом оцифруя культурные предрассудки. [ 148 ] Например, в 1988 году Великобритания Комиссия по расовому равенству обнаружила, что медицинская школа Святого Георгия использовала компьютерную программу, обученную данными предыдущих сотрудников приемной комиссии, и что эта программа отрицала почти 60 кандидатов, которые были обнаружены либо женщинами, либо Невропейские звучащие имена. [ 126 ] Использование данных о найме работы от фирмы с расистской политикой найма может привести к тому, что система машинного обучения дублировала предвзятость, забивая соискателей по сходству с предыдущими успешными кандидатами. [ 149 ] [ 150 ] Другой пример включает в себя прогнозирующий алгоритм прогнозирующей полицейской компании Geolitica , который привел к «непропорционально высоким уровням чрезмерного использования в общинах с низким доходом и меньшинствами» после обучения историческим данным о преступности. [ 129 ]

В то время как ответственный сбор данных и документации алгоритмических правил, используемых системой, считается важной частью машинного обучения, некоторые исследователи обвиняют отсутствие участия и представление населения меньшинств в области ИИ в уязвимости машинного обучения к предубеждениям. [ 151 ] Фактически, согласно исследованию, проведенному Ассоциацией компьютерных исследований (CRA) в 2021 году, «факультет женщин просто составляет 16,1%» всех преподавателей, которые сосредоточены на ИИ среди нескольких университетов мира. [ 152 ] Кроме того, среди группы «Новых выпускников AI -докторов AI -резидентов США» 45%, идентифицированные как белые, 22,4% как азиатские, 3,2%, как латиноамериканцы и 2,4% как афроамериканцы, что еще больше демонстрирует отсутствие разнообразия в области ИИ Полем [ 152 ]

ИИ может быть хорошо подготовлен для принятия решений в технических областях, которые в значительной степени зависят от данных и исторической информации. Эти решения полагаются на объективность и логические рассуждения. [ 153 ] Поскольку человеческие языки содержат предубеждения, машины, обученные языковым корпусам , также обязательно изучат эти предубеждения. [ 154 ] [ 155 ]

Другие формы этических проблем, не связанные с личными предубеждениями, рассматриваются в здравоохранении. У специалистов здравоохранения существуют опасения, что эти системы могут быть спроектированы не в интересах общественности, а в качестве машин, приносящих доход. [ 156 ] Это особенно верно в Соединенных Штатах, где существует давняя этическая дилемма улучшения здравоохранения, а также увеличение прибыли. Например, алгоритмы могут быть разработаны для того, чтобы предоставить пациентам ненужные тесты или лекарства, при которых владельцы алгоритма владеют долями. В области здравоохранения существует потенциал, чтобы предоставить специалистам дополнительный инструмент для диагностики, лечения и планирования пути восстановления для пациентов, но это требует смягчения этих предубеждений. [ 157 ]

Аппаратное обеспечение

[ редактировать ]

С момента 2010 -х годов достижения как в алгоритмах машинного обучения, так и в компьютерном оборудовании привели к более эффективным методам обучения глубоким нейронным сетям (конкретный узкий субдомен машинного обучения), которые содержат много слоев нелинейных скрытых единиц. [ 158 ] К 2019 году графические обработки ( GPU ), часто с AI-специфическими усовершенствованиями, имели смещенные процессоры в качестве доминирующего метода обучения крупномасштабного коммерческого облачного ИИ. [ 159 ] OpenAI оценил аппаратные вычисления, используемые в крупнейших проектах глубокого обучения от Alexnet (2012) до Alphazero (2017), и обнаружил увеличение объема требуемого вычисления в 300 000 раз, с линией тренда удваивания в 3,4 месяца. [ 160 ] [ 161 ]

Нейроморфные/физические нейронные сети

[ редактировать ]

Физическая нейронная сеть или нейроморфный компьютер - это тип искусственной нейронной сети , в которой электрически регулируемый материал используется для эмуляции функции нейронного синапса . «Физическая» нейронная сеть используется, чтобы подчеркнуть зависимость от физического оборудования, используемого для эмуляции нейронов, в отличие от программных подходов. В более общем смысле термин применим к другим искусственным нейронным сетям, в которых мемористор или другой электрически регулируемый материал сопротивления используется для эмуляции нейронного синапса. [ 162 ] [ 163 ]

Встроенное машинное обучение

[ редактировать ]

Встроенное машинное обучение представляет собой подполет машинного обучения, где модель машинного обучения работает на встроенных системах с ограниченными вычислительными ресурсами, такими как носимые компьютеры , устройства с краями и микроконтроллеры . [ 164 ] [ 165 ] [ 166 ] Запуск модели машинного обучения в встроенных устройствах устраняет необходимость передачи и хранения данных на облачных серверах для дальнейшей обработки, а отныне сокращение утечек данных и утечек конфиденциальности происходит из -за передачи данных, а также минимизирует кражу интеллектуальных свойств, персональных данных и бизнес -секретов. Встроенное машинное обучение может быть применено через несколько методов, включая аппаратное ускорение , [ 167 ] [ 168 ] используя приблизительные вычисления , [ 169 ] Оптимизация моделей машинного обучения и многое другое. [ 170 ] [ 171 ] Обрезка , квантование , дистилляция знаний , факторизация с низким уровнем ранга, поиск сетевой архитектуры (NAS) и обмен параметрами-это лишь немногие из методов, используемых для оптимизации моделей машинного обучения.

Программное обеспечение

[ редактировать ]

Программные наборы , содержащие различные алгоритмы машинного обучения, включают следующее:

БЕСПЛАТНОЕ программное обеспечение с открытым исходным кодом

[ редактировать ]

Запатентованное программное обеспечение с бесплатными и открытыми изданиями

[ редактировать ]

Запатентованное программное обеспечение

[ редактировать ]

Конференции

[ редактировать ]

Смотрите также

[ редактировать ]
  1. ^ Определение «без явного запрограммирования» часто приписывается Артуру Самуилу , который вводил термин «машинное обучение» в 1959 году, но фраза не найдена дословно в этой публикации и может быть перефразией, которая появилась позже. Согласно «Перефразируя Артура Самуэля (1959), вопрос в том, как компьютеры могут научиться решать проблемы, не будучи явно запрограммированными?» в Коза, Джон Р.; Беннетт, Форрест Х.; Андре, Дэвид; Кин, Мартин А. (1996). «Автоматизированный дизайн топологии и размеров аналоговых электрических цепей с использованием генетического программирования». Искусственный интеллект в дизайне '96 . Искусственный интеллект в дизайне '96. Спрингер, Дордрехт. С. 151–170. doi : 10.1007/978-94-009-0279-4_9 . ISBN  978-94-010-6610-5 .
  2. ^ "Что такое машинное обучение?" Полем IBM . 22 сентября 2021 года. Архивировано с оригинала 2023-12-27 . Получено 2023-06-27 .
  3. ^ Ху, Джуньян; Ниу, Хэнлин; Карраско, Хоакин; Леннокс, Барри; Арвин, Фаршад (2020). «Автономная разведка на основе вороноя в неизвестных средах посредством глубокого обучения подкреплению» . IEEE транзакции на транспортных технологиях . 69 (12): 14413–14423. doi : 10.1109/tvt.2020.3034800 . ISSN   0018-9545 . S2CID   228989788 .
  4. ^ Подпрыгнуть до: а беременный YOOSEFZADEH-NAJAFABADI, MOHSEN; Хью, граф; Тулпан, Дэн; Сулик, Джон; Эскандари, Милад (2021). «Применение алгоритмов машинного обучения в селекции растений: прогнозирование урожайности от гиперспектральной отражательной способности у сои?» Полем Передний. Plant Sci . 11 : 624273. DOI : 10.3389/fpls.2020.624273 . PMC   7835636 . PMID   33510761 .
  5. ^ Подпрыгнуть до: а беременный в Бишоп, CM (2006), распознавание образцов и машинное обучение , Springer, ISBN  978-0-387-31073-2
  6. ^ Машинное обучение и распознавание шаблонов «можно рассматривать как две аспекты того же поля». [ 5 ] : vii
  7. ^ Подпрыгнуть до: а беременный Фридман, Джером Х. (1998). «Рабочие данные и статистика данных: что такое соединение?». Компьютерная наука и статистика . 29 (1): 3–9.
  8. ^ Самуил, Артур (1959). «Некоторые исследования в области машинного обучения с использованием игры в шашки». IBM Журнал исследований и разработок . 3 (3): 210–229. Citeseerx   10.1.1.368.2254 . doi : 10.1147/rd.33.0210 . S2CID   2126705 .
  9. ^ Подпрыгнуть до: а беременный Р. Кохави и Ф. Провост, «Глоссарий терминов», Matcher Learning, Vol. 30, нет. 2–3, с. 271–274, 1998.
  10. ^ Герович, Слава (9 апреля 2015 г.). «Как компьютер отомстил Советский Союз» . Наутилус . Архивировано из оригинала 22 сентября 2021 года . Получено 19 сентября 2021 года .
  11. ^ Линдсей, Ричард П. (1 сентября 1964 г.). «Влияние автоматизации на государственное управление» . Западный политический квартал . 17 (3): 78–81. doi : 10.1177/106591296401700364 . ISSN   0043-4078 . S2CID   154021253 . Архивировано из оригинала 6 октября 2021 года . Получено 6 октября 2021 года .
  12. ^ Подпрыгнуть до: а беременный в «История и эволюция машинного обучения: временная шкала» . Что . Архивировано из оригинала в 2023-12-08 . Получено 2023-12-08 .
  13. ^ Милнер, Питер М. (1993). «Разум и Дональд О. Хебб» . Scientific American . 268 (1): 124–129. Bibcode : 1993sciam.268a.124m . doi : 10.1038/Scientificamerican0193-124 . ISSN   0036-8733 . JSTOR   24941344 . PMID   8418480 . Архивировано из оригинала 2023-12-20 . Получено 2023-12-09 .
  14. ^ «Наука: кнопка Goof», Time (Magazine) , 18 августа 1961.
  15. ^ Нильссон Н. Учебные машины, McGraw Hill, 1965.
  16. ^ Дуда Р., Харт П. Распознавание и анализ сцены, Wiley Interscience, 1973
  17. ^ S. Bozinovski «Учебное пространство: концепция представления для классификации адаптивной шаблона» Технический отчет № 81-28, Департамент компьютерных и информационных наук, Университет Массачусетса в Амхерст, Массачусетс, 1981. https: //web.cs. .edu/publication/docs/1981/um-cs-1981-028.pdf Архивировал 2021-02-25 на машине Wayback
  18. ^ Подпрыгнуть до: а беременный Митчелл Т. (1997). Машинное обучение . МакГроу Хилл. п. 2. ISBN  978-0-07-042807-2 .
  19. ^ Harnad, Stevan (2008), «Аннотация игра: О Тьюрингу (1950) о вычислениях, технике и интеллекте» , в Эпштейне, Роберт; Peters, Grace (Eds.), Turing Train Test Sourcebook: философские и методологические проблемы в поисках мыслительного компьютера , Kluwer, с. 23–66, ISBN  9781402067082 , архивировано из оригинала 2012-03-09 , извлечен 2012-12-11
  20. ^ «Введение в ИИ часть 1» . Эдзион . 2020-12-08. Архивировано из оригинала 2021-02-18 . Получено 2020-12-09 .
  21. ^ Синдху В., Ниведха С., Пракаш М (февраль 2020 г.). «Эмпирические научные исследования по биоинформатике в машинном обучении» . Журнал механики континуи и математических наук (7). doi : 10.26782/jmcms.spl.7/2020.02.00006 .
  22. ^ Сарл, Уоррен С. (1994). «Нейронные сети и статистические модели». Sugi 19: Материалы девятнадцатой ежегодной международной конференции SAS -пользователей . SAS Institute. С. 1538–50. ISBN  9781555446116 Полем OCLC   35546178 .
  23. ^ Подпрыгнуть до: а беременный в дюймовый Рассел, Стюарт ; Норвиг, Питер (2003) [1995]. Искусственный интеллект: современный подход (2 -е изд.). Прентис Холл. ISBN  978-0137903955 .
  24. ^ Подпрыгнуть до: а беременный Лэнгли, Пэт (2011). «Изменяющаяся наука о машинном обучении» . Машинное обучение . 82 (3): 275–9. doi : 10.1007/s10994-011-5242-y .
  25. ^ Махони, Мэтт. «Обоснование большого теста сжатия текста» . Флоридский технологический институт . Получено 5 марта 2013 года .
  26. ^ Shmilovici A.; Кахири Y.; Бен-Гал I.; Хаузер С. (2009). «Измерение эффективности внутридневного рынка форекс с помощью универсального алгоритма сжатия данных» (PDF) . Вычислительная экономика . 33 (2): 131–154. Citeseerx   10.1.1.627.3751 . doi : 10.1007/s10614-008-9153-3 . S2CID   17234503 . Архивировано (PDF) из оригинала на 2009-07-09.
  27. ^ И. Бен-Гал (2008). «Об использовании мер сжатия данных для анализа надежных конструкций» (PDF) . IEEE транзакции по надежности . 54 (3): 381–388. doi : 10.1109/tr.2005.853280 . S2CID   9376086 .
  28. ^ Д. Скалли; Карла Э. Бродли (2006). «Сжатие и машинное обучение: новая перспектива на пространственные векторы функций». Конференция сжатия данных (DCC'06) . п. 332. doi : 10.1109/dcc.2006.13 . ISBN  0-7695-2545-8 Полем S2CID   12311412 .
  29. ^ Гэри Адкок (5 января 2023 г.). "Что такое сжатие видео ИИ?" Полем Massive.io . Получено 6 апреля 2023 года .
  30. ^ Менцер, Фабиан; Тодеричи, Джордж; Цханнен, Майкл; Агустссон, Эйрикур (2020). «Сжатие генеративного изображения с высокой точностью». arxiv : 2006.09965 [ eess.iv ].
  31. ^ «Что такое неконтролируемое обучение ? www.ibm.com . 23 сентября 2021 года . Получено 2024-02-05 .
  32. ^ «Дифференциальная частная кластеризация для крупномасштабных наборов данных» . blog.research.google . 2023-05-25 . Получено 2024-03-16 .
  33. ^ Эдвардс, Бендж (2023-09-28). «Языковые модели ИИ могут превышать PNG и FLAC в сжатии без потерь», - говорит исследование » . Ars Technica . Получено 2024-03-07 .
  34. ^ Ле Ру, Николас; Бенгио, Йошуа; Фицгиббон, Эндрю (2012). «Улучшение методов первого и второго порядка путем моделирования неопределенности» . В SRA, внедорожник; Новес, Себастьян; Райт, Стивен Дж. (Ред.). Оптимизация для машинного обучения . MIT Press. п. 404. ISBN  9780262016469 Полем Архивировано из оригинала 2023-01-17 . Получено 2020-11-12 .
  35. ^ Бздок, Данило; Альтман, Наоми ; Кшивински, Мартин (2018). «Статистика против машинного обучения» . Природные методы . 15 (4): 233–234. doi : 10.1038/nmeth.4642 . PMC   6082636 . PMID   30100822 .
  36. ^ Подпрыгнуть до: а беременный Майкл И. Джордан (2014-09-10). «Статистика и машинное обучение» . Reddit. Архивировано из оригинала 2017-10-18 . Получено 2014-10-01 .
  37. ^ Hung et al. Алгоритмы для измерения эффективности хирурга и предвидеть клинические результаты в роботизированной хирургии. Джама Сург. 2018
  38. ^ Библиотека Корнелльского университета (август 2001 г.). «Брейман: статистическое моделирование: две культуры (с комментариями и возражением автора)» . Статистическая наука . 16 (3). doi : 10.1214/ss/1009213726 . S2CID   62729017 . Архивировано с оригинала 26 июня 2017 года . Получено 8 августа 2015 года .
  39. ^ Гарет Джеймс; Даниэла Виттен; Тревор Хасти; Роберт Тибширани (2013). Введение в статистическое обучение . Спрингер. п. VII. Архивировано из оригинала 2019-06-23 . Получено 2014-10-25 .
  40. ^ Ramezanpour, A.; Луч, Ал; Чен, Дж. Х; Машаги А. (17 ноября 2020 г.). «Статистическая физика для медицинской диагностики: алгоритмы обучения, вывода и оптимизации» . Диагностика . 10 (11): 972. DOI : 10.3390/Diagnostics10110972 . PMC   7699346 . PMID   33228143 .
  41. ^ Mashaghi, A.; Ramezanpour, A. (16 марта 2018 г.). «Статистическая физика медицинской диагностики: изучение вероятностной модели». Физический обзор e . 97 (3–1): 032118. Arxiv : 1803.10019 . BIBCODE : 2018FRVE..97C2118M . doi : 10.1103/physreve.97.032118 . PMID   29776109 . S2CID   4955393 .
  42. ^ Мохри, Мехриар ; Ростамизаде, Афшин; Talwalkar, Ameet (2012). Основы машинного обучения . США, Массачусетс: MIT Press. ISBN  9780262018258 .
  43. ^ Alpaydin, Ethem (2010). Введение в машинное обучение . Лондон: MIT Press. ISBN  978-0-262-01243-0 Полем Получено 4 февраля 2017 года .
  44. ^ Джордан, Мичиган; Митчелл, ТМ (17 июля 2015 г.). «Машинное обучение: тенденции, перспективы и перспективы». Наука . 349 (6245): 255–260. Bibcode : 2015sci ... 349..255J . doi : 10.1126/science.aaa8415 . PMID   26185243 . S2CID   677218 .
  45. ^ Эль Нака, Иссам; Мерфи, Мартин Дж. (2015). "Что такое машинное обучение?". Машинное обучение в радиационной онкологии . С. 3–11. doi : 10.1007/978-3-319-18305-3_1 . ISBN  978-3-319-18304-6 Полем S2CID   178586107 .
  46. ^ Околи, Джуд А.; Сэвидж, Шона; Ogbaga, Chukwuma c.; Gunes, Burcu (июнь 2022 г.). «Оценка потенциала методов машинного обучения для изучения удаления фармацевтических препаратов из сточных вод с использованием биочара или активированного углерода» . Общие темы исследования окружающей среды . 1–2 : 100001. Bibcode : 2022Tert .... 100001o . doi : 10.1016/j.totert.2022.100001 . S2CID   249022386 .
  47. ^ Рассел, Стюарт Дж.; Норвиг, Питер (2010). Искусственный интеллект: современный подход (третье изд.). Прентис Холл. ISBN  9780136042594 .
  48. ^ Мохри, Мехриар; Ростамизаде, Афшин; Talwalkar, Ameet (2012). Основы машинного обучения . MIT Press. ISBN  9780262018258 .
  49. ^ Alpaydin, Ethem (2010). Введение в машинное обучение . MIT Press. п. 9. ISBN  978-0-262-01243-0 Полем Архивировано из оригинала 2023-01-17 . Получено 2018-11-25 .
  50. ^ «Лекция 2 Примечания: контролируемое обучение» . www.cs.cornell.edu . Получено 2024-07-01 .
  51. ^ Джордан, Майкл I.; Епископ, Кристофер М. (2004). «Нейронные сети». В Аллене Б. Такер (ред.). Справочник по информатике, второе издание (Раздел VII: Интеллектуальные системы) . Бока Ратон, Флорида: Chapman & Hall/Crc Press LLC. ISBN  978-1-58488-360-9 .
  52. ^ Чжан, Безен; Хуан, Хайян; Tibbs-Cortes, Laura E.; Ванус, Адам; Чжан, Чживу; Sanguinet, Карен; Garland-Campbell, Kimberly A.; Ю, Цзянминг; Ли, Сянран (2023). «Упрощенное неконтролируемое машинное обучение для обследования и графиков гаплотипов на основе индела из пан-геномов» . Молекулярное растение . 16 (6): 975–978. doi : 10.1016/j.molp.2023.05.005 . PMID   37202927 .
  53. ^ Чжан, Безен; Хуан, Хайян; Tibbs-Cortes, Laura E.; Ванус, Адам; Чжан, Чживу; Sanguinet, Карен; Garland-Campbell, Kimberly A.; Ю, Цзянминг; Ли, Сянран (2023-02-13). Упросное неконтролируемое машинное обучение для обследования и графиков гаплотипов на основе индела из пан-геномов (отчет). doi : 10.1101/2023.02.11.527743 .
  54. ^ Мисра, Ишан; Maaten, Laurens Van Der (2020). Самоподобное изучение предложений-инвариантных представлений . 2020 IEEE/CVF Conference по компьютерному зрению и распознаванию шаблонов (CVPR). Сиэтл, Вашингтон, США: IEEE . С. 6707–6717. Arxiv : 1912.01991 . doi : 10.1109/cvpr42600.2020.00674 .
  55. ^ Jaiswal, Ashish; Бабу, Эшвин Рамеш; Заде, Мохаммад Заки; Банерджи, Дебаприя; Макондон, Филлия (март 2021 г.). «Опрос о контрастном самоотверженном обучении» . Технологии . 9 (1): 2. Arxiv : 2011.00362 . doi : 10.3390/Technologies9010002 . ISSN   2227-7080 .
  56. ^ Алекс Ратнер; Стивен Бах; Paroma Varma; Крис. «Слабый надзор: новая парадигма программирования для машинного обучения» . hazyresearch.github.io . Ссылка на работу многих других членов туманных исследований. Архивировано с оригинала 2019-06-06 . Получено 2019-06-06 .
  57. ^ Ван Оттерло, М.; Wiering, M. (2012). «Подкрепление обучения и процессы принятия решений Маркова». Подкрепление обучения . Адаптация, обучение и оптимизация. Тол. 12. С. 3–42. doi : 10.1007/978-3-642-27645-3_1 . ISBN  978-3-642-27644-6 .
  58. ^ Roweis, Sam T.; Саул, Лоуренс К. (22 декабря 2000 г.). «Снижение нелинейной размерности за счет локально линейного встраивания» . Наука . 290 (5500): 2323–2326. Bibcode : 2000sci ... 290.2323r . doi : 10.1126/science.290.5500.2323 . PMID   11125150 . S2CID   5987139 . Архивировано из оригинала 15 августа 2021 года . Получено 17 июля 2023 года .
  59. ^ Павел Бразил; Кристоф Жиро -оператор; Карлос Соарс; Рикардо Вилальта (2009). Металлическое обучение: приложения к интеллектуальному анализу данных (четвертое изд.). Springer Science+Business Media . С. 10–14, пассим . ISBN  978-3540732624 .
  60. ^ Bozinovski, S. (1982). «Система самообучения с использованием вторичного подкрепления». В Траппл, Роберт (ред.). Кибернетика и системы исследований: Материалы шестой Европейской встречи по кибернетике и системам исследований. Северная Голландия. С. 397–402. ISBN   978-0-444-86488-8 .
  61. ^ Bozinovski, Stevo (2014) «Механизмы моделирования взаимодействия познания-эмоализации в искусственных нейронных сетях, с 1981 года». Процедуя компьютерная наука с. 255-263
  62. ^ Bozinovski, S. (2001) «Агенты самообучения: теория эмоций коннекциониста, основанная на суждении по перекладины». Кибернетика и системы 32 (6) 637–667.
  63. ^ Ю. Бенгио; А. Курвиль; П. Винсент (2013). «Обучение представительства: обзор и новые перспективы». IEEE транзакции по анализу шаблонов и интеллектую машины . 35 (8): 1798–1828. Arxiv : 1206.5538 . doi : 10.1109/tpami.2013.50 . PMID   23787338 . S2CID   393948 .
  64. ^ Натан Сребро; Джейсон Д.М. Ренни; Томми С. Джаккола (2004). Максимальная матричная факторизация . Пожирать .
  65. ^ Коутс, Адам; Ли, Хонглак; Нг, Эндрю Й. (2011). Анализ однослойных сетей в неконтролируемом обучении функций (PDF) . Int'l Conf. по ИИ и статистике (Эйстаты). Архивировано из оригинала (PDF) 2017-08-13 . Получено 2018-11-25 .
  66. ^ Csurka, Габриэлла; Танец, Кристофер С.; Фанат, Ликсин; Willamowski, Jutta; Bray, Cédric (2004). Визуальная категоризация с мешками с клавиатуры (PDF) . Семинар ECCV по статистическому обучению в компьютерном видении. Архивировано (PDF) из оригинала 2019-07-13 . Получено 2019-08-29 .
  67. ^ Даниэль Джуруфски; Джеймс Х. Мартин (2009). Речевая и языковая обработка . Pearson Education International. С. 145–146.
  68. ^ Лу, Хайпинг; Платаниотис, кн; Venetsanopoulos, An (2011). «Обследование многолинейного подпространственного обучения для тензорных данных» (PDF) . Распознавание образца . 44 (7): 1540–1551. BIBCODE : 2011Patre..44.1540L . doi : 10.1016/j.patcog.2011.01.004 . Архивировано (PDF) из оригинала 2019-07-10 . Получено 2015-09-04 .
  69. ^ Йошуа Бенгио (2009). Изучение глубоких архитектур для ИИ . Теперь Publishers Inc. с. 1–3. ISBN  978-1-60198-294-0 Полем Архивировано из оригинала 2023-01-17 . Получено 2016-02-15 .
  70. ^ Tillmann, Am (2015). «О вычислительной непрерывности точного и приблизительного обучения в словаре». IEEE -обработки букв . 22 (1): 45–49. Arxiv : 1405.6664 . Bibcode : 2015ispl ... 22 ... 45t . doi : 10.1109/lsp.2014.2345761 . S2CID   13342762 .
  71. ^ Ахарон, м , м элад и Брукштейн. 2006. « K-SVD: Алгоритм для разработки словарей переполнения для разреженного представления архивировано 2018-11-23 на машине Wayback ». Обработка сигнала, транзакции IEEE на 54 (11): 4311–4322
  72. ^ Zimek, Артур; Schubert, Erich (2017), «Обнаружение выбросов», Энциклопедия систем баз данных , Springer New York, pp. 1–5, doi : 10.1007/978-1-4899-7993-3_80719-1 , ISBN  9781489979933
  73. ^ Ходж, VJ; Остин Дж. (2004). «Обзор методологий обнаружения выбросов» (PDF) . Обзор искусственного интеллекта . 22 (2): 85–126. Citeseerx   10.1.1.318.4023 . doi : 10.1007/s10462-004-4304-y . S2CID   59941878 . Архивировано (PDF) из оригинала 2015-06-22 . Получено 2018-11-25 .
  74. ^ Докас, Пол; Эртоз, Левен; Кумар, Випин; Лазаревич, Александар; Шривастава, Джайдеп; Tan, Pang-Ren (2002). «Распространение данных для обнаружения вторжений в сеть» (PDF) . Материалы . Архивировано (PDF) из оригинала 2015-09-23 . Получено 2023-03-26 .
  75. ^ Чандола, v.; Banerjee, A.; Кумар, В. (2009). «Обнаружение аномалии: опрос». ACM вычислительные исследования . 41 (3): 1–58. doi : 10.1145/1541880.1541882 . S2CID   207172599 .
  76. ^ Fleer, S.; Moringen, A.; Клацки, RL; Риттер, Х. (2020). «Эффективное изучение тактичному исследованию формы с жестким тактильным датчиком, С. Флиер, А. Моринген, Р. Клацки, Х. Риттер» . Plos один . 15 (1): E0226880. Arxiv : 1902.07501 . doi : 10.1371/journal.pone.0226880 . PMC   6940144 . PMID   31896135 .
  77. ^ Моринген, Александра; Флиер, Саша; Уолк, Гийом; Риттер, Хельдж (2020), Ниски, Илана; Хартчер-О'Брайен, Джесс; Wiertlewski, Michaël; SMEETS, Jeroen (Eds.), «Изучение робота, основанное на внимании, об взаимодействии тактично», Haptics: Science, Technology, Applications , лекционные заметки в компьютерных науках, Vol. 12272, CHAM: Springer International Publishing, стр. 462–470, doi : 10.1007/978-3-030-58147-3_51 , ISBN  978-3-030-58146-6 , S2CID   220069113
  78. ^ Piatetsky-Shapiro, Gregory (1991), открытие, анализ и представление сильных правил , в Piatetsky-Shapiro, Григори; и Фроули, Уильям Дж.; Eds., Обнаружение знаний в базах данных , AAAI/MIT Press, Кембридж, Массачусетс.
  79. ^ Бассель, Джордж В.; Глааб, Энрико; Маркес, Джульетта; Холдсворт, Майкл Дж.; Bacardit, Jaume (2011-09-01). «Функциональная конструкция сети в Arabidopsis с использованием машинного обучения на основе правил на крупномасштабных наборах данных» . Растительная ячейка . 23 (9): 3101–3116. doi : 10.1105/tpc.111.088153 . ISSN   1532-298X . PMC   3203449 . PMID   21896882 .
  80. ^ Agrawal, R.; Imieliński, T.; Свами А. (1993). «Правила горнодобывающей ассоциации между наборами элементов в крупных базах данных». Материалы ACM Sigmod International Conference по управлению данными - Sigmod '93 . п. 207. Citeseerx   10.1.1.40.6984 . doi : 10.1145/170035.170072 . ISBN  978-0897915922 Полем S2CID   490415 .
  81. ^ Urbanowicz, Ryan J.; Мур, Джейсон Х. (2009-09-22). «Системы обучения классификатора: полное введение, обзор и дорожная карта» . Журнал искусственной эволюции и применений . 2009 : 1–25. doi : 10.1155/2009/736398 . ISSN   1687-6229 .
  82. ^ Планкин GD Автоматические методы индуктивного вывода Архивированы 2017-12-22 на машине Wayback , докторская диссертация, Эдинбургский университет, 1970.
  83. ^ Шапиро, Эхуд Ю. Индуктивный вывод теорий из фактов , архивных 2021-08-21 на машине Wayback , исследовательский отчет 192, Йельский университет, Департамент компьютерных наук, 1981. Перепечатано в J.-L. Lassez, G. Plotkin (Eds.), Computational Logic, MIT Press, Cambridge, MA, 1991, с. 199–254.
  84. ^ Шапиро, Эхуд Ю. (1983). Алгоритмическая отладка программы . Кембридж, масса: MIT Press. ISBN   0-262-19218-7
  85. ^ Шапиро, Эхуд Ю. « Система вывода модели, архивировав 2023-04-06 на машине Wayback ». Материалы 7-й Международной совместной конференции по искусственному интеллекту-объему 2. Morgan Kaufmann Publishers Inc., 1981.
  86. ^ Бурков, Андрий (2019). Книга машинного обучения в стостранице . Полен: Андрий Бурков. ISBN  978-1-9995795-0-0 .
  87. ^ Рассел, Стюарт Дж.; Норвиг, Петр (2021). Искусственный интеллект: современный подход . Серия Пирсона в искусственном интеллекте (четвертое изд.). Хобокен: Пирсон. ISBN  978-0-13-461099-3 .
  88. ^ Honglak Lee, Roger Grosse, Rajesh Ranganath, Andrew Y. Ng. « Развернутые сети глубоких убеждений для масштабируемого неконтролируемого изучения иерархических представлений архивировали 2017-10-18 на The Wayback Machine » Материалы 26-й ежегодной Международной конференции по машинному обучению, 2009 год.
  89. ^ Кортес, Коринна ; Vapnik, Vladimir N. (1995). «Сетовые сети поддержки» . Машинное обучение . 20 (3): 273–297. doi : 10.1007/bf00994018 .
  90. ^ Стивенсон, Кристофер. «Учебное пособие: полиномиальная регрессия в Excel» . Facultystaff.richmond.edu . Архивировано из оригинала 2 июня 2013 года . Получено 22 января 2017 года .
  91. ^ Документация для Scikit-Learn также имеет аналогичные примеры , архивные 2022-11-02 на машине Wayback .
  92. ^ Голдберг, Дэвид Э.; Голландия, Джон Х. (1988). «Генетические алгоритмы и машинное обучение» (PDF) . Машинное обучение . 3 (2): 95–99. doi : 10.1007/bf00113892 . S2CID   35506513 . Архивировано (PDF) из оригинала 2011-05-16 . Получено 2019-09-03 .
  93. ^ Мичи, Д.; Spiegelhalter, DJ; Тейлор, CC (1994). «Машинное обучение, нейронная и статистическая классификация». Серия Эллис Хорвуд в искусственном интеллекте . Bibcode : 1994mlns.book ..... m .
  94. ^ Zhang, Zhan; Обзор ». Журнал Computational Intelligence . 6 (4): 68–75. DOI : 10.1109/MCI.2011.942584 . S2CID   6760276 .
  95. ^ «Федеративное обучение: совместное машинное обучение без централизованных данных обучения» . Google AI Блог . 6 апреля 2017 года. Архивировано с оригинала 2019-06-07 . Получено 2019-06-08 .
  96. ^ Машинное обучение включено в учебную программу CFA (обсуждение сверху вниз); См.: Кэтлин ДеРоуз и Кристоф Ле Ланно (2020). «Машинное обучение» архив 2020-01-13 на машине Wayback .
  97. ^ Иванко, Михаил; Smolik, Waldemar T.; Что, Дамиан; Мидура, Матеуш; Wróblewski, Przemyslaw; Хоу, Сяохан; Ян, Сяохенг (2023). «Реконструкция изображения с использованием контролируемого обучения в носимой электрической томографии грудной клетки » Датчики 23 (18): Bibcode : 2023senso..23.7774i 7774. Doi : 10.3390/ s23187774  10538128PMC  37765831PMID
  98. ^ "Belkor Home Page" Research.att.com
  99. ^ «Технологический блог Netflix: Netflix Рекомендации: за пределами 5 звезд (часть 1)» . 2012-04-06. Архивировано из оригинала 31 мая 2016 года . Получено 8 августа 2015 года .
  100. ^ Скотт Паттерсон (13 июля 2010 г.). «Пусть машины решают» . Wall Street Journal . Архивировано с оригинала 24 июня 2018 года . Получено 24 июня 2018 года .
  101. ^ Винод Хосла (10 января 2012 г.). "Нужны ли нам врачи или алгоритмы?" Полем Технологический хруст. Архивировано из оригинала 18 июня 2018 года . Получено 20 октября 2016 года .
  102. ^ Когда алгоритм машинного обучения изучало картины изобразительного искусства, он видел, как вещи искусства никогда не замечали архив 2016-06-04 в The Wayback Machine , Physics at arxiv в блоге
  103. ^ Винсент, Джеймс (2019-04-10). «Первый учебник, сгенерированный AI, показывает, в чем на самом деле хороши писатели-роботы» . Грава . Архивировано с оригинала 2019-05-05 . Получено 2019-05-05 .
  104. ^ Вайшья, Раджу; Джаваид, Мохд; Хан, Ибрагим Хейлим; Хейлим, Абид (1 июля 2020 г.). «Приложения искусственного интеллекта (AI) для пандемии Covid-19» . Диабет и метаболический синдром: клинические исследования и обзоры . 14 (4): 337–339. doi : 10.1016/j.dsx.2020.04.012 . PMC   7195043 . PMID   32305024 .
  105. ^ Резапурагдам, Хамед; Ахшик, Араш; Рамкиссун, Хейванти (10 марта 2021 г.). «Применение машинного обучения для прогнозирования зеленого поведения посетителей в морских охраняемых районах: доказательства Кипра» . Журнал устойчивого туризма . 31 (11): 2479–2505. doi : 10.1080/09669582.2021.1887878 . HDL : 10037/24073 .
  106. ^ Дей, Сомдип; Сингх, Амит Кумар; Ван, Сяоханг; Макдональд-Майер, Клаус (2020-06-15). «Пользовательское взаимодействие, осведомленное о подкреплении, для мощности и тепловой эффективности мобильных MPSOC ЦП-GPU» . 2020 Дизайн, автоматизация и тест в Европе конференция и выставка (дата) (PDF) . С. 1728–1733. doi : 10.23919/date48585.2020.9116294 . ISBN  978-3-9819263-4-7 Полем S2CID   219858480 . Архивировано из оригинала 2021-12-13 . Получено 2022-01-20 .
  107. ^ Квест, Тони. «Смартфоны становятся умнее с Essex Innovation» . Бизнес еженедельно . Архивировано из оригинала 2021-06-24 . Получено 2021-06-17 .
  108. ^ Уильямс, Рианнон (2020-07-21). «Будущие смартфоны» продлит свое время автономной работы, контролируя поведение владельцев » . я Архивировано из оригинала 2021-06-24 . Получено 2021-06-17 .
  109. ^ Расекшаффе, Кейван Кристиан; Джонс, Роберт С. (2019-07-01). «Машинное обучение для выбора запасов» . Журнал финансовых аналитиков . 75 (3): 70–88. doi : 10.1080/0015198x.2019.1596678 . ISSN   0015-198X . S2CID   108312507 . Архивировано из оригинала 2023-11-26 . Получено 2023-11-26 .
  110. ^ Чунг, Юнси; Грин, Уильям Х. (2024). «Машинное обучение от квантовой химии для прогнозирования экспериментального воздействия растворителя на скорости реакции» . Химическая наука . 15 (7): 2410–2424. doi : 10.1039/d3sc05353a . ISSN   2041-6520 . PMC   10866337 . PMID   38362410 . Архивировано из оригинала 2024-05-19 . Получено 2024-04-21 .
  111. ^ Солнце, Юран; Хуан, Ши-Кай; Чжао, Xilei (2024-02-01). «Прогнозирование решений об эвакуации урагана с помощью интерпретируемых методов машинного обучения» . Международный журнал науки о рисках бедствий . 15 (1): 134–148. Arxiv : 2303.06557 . Bibcode : 2024ijdrs..15..134S . doi : 10.1007/s13753-024-00541-1 . ISSN   2192-6395 .
  112. ^ Солнце, Юран; Чжао, Xilei; Lovreglio, Ruggiero; Kuligowski, Erica (2024-01-01), Naser, MZ (Ed.), «8-AI для крупномасштабного моделирования эвакуации: обещания и проблемы» , интерпретируемое машинное обучение для анализа, проектирования, оценки и информированных решений. Для гражданской инфраструктуры , издательская серия Вудхеда в области гражданской и структурной инженерии, Woodhead Publishing, с. 185–204, ISBN  978-0-12-824073-1 , архивировано из оригинала в 2024-05-19 , получено 2024-05-19
  113. ^ Сюй, Нинчхе; Lovreglio, Ruggiero; Kuligowski, Erica D.; Кова, Томас Дж.; Нильссон, Даниэль; Чжао, Xilei (2023-03-01). «Прогнозирование и оценка принятия решений об эвакуации по лестникам с использованием машинного обучения: результаты от пожара в Кинкаде 2019 года» . Пожарная технология . 59 (2): 793–825. doi : 10.1007/s10694-023-01363-1 . ISSN   1572-8099 . Архивировано из оригинала 2024-05-19 . Получено 2024-05-19 .
  114. ^ Ван, Ке; Ши, Xiupeng; Го, Альгена Пей Сюань; Qian, Shunzhi (2019-06-01). «Основанное на машинном обучении исследование динамики пешеходного движения при экстренной эвакуации» . Журнал пожарной безопасности . 106 : 163–176. BIBCODE : 2019FIRSJ.106..163W . doi : 10.1016/j.firesaf.2019.04.008 . HDL : 10356/143390 . ISSN   0379-7112 . Архивировано из оригинала 2024-05-19 . Получено 2024-05-19 .
  115. ^ Чжао, Xilei; Lovreglio, Ruggiero; Нильссон, Даниэль (2020-05-01). «Моделирование и интерпретация принятия решений предварительной оценкой с использованием машинного обучения» . Автоматизация в строительстве . 113 : 103140. DOI : 10.1016/j.autcon.2020.103140 . ISSN   0926-5805 . Архивировано из оригинала 2024-05-19 . Получено 2024-05-19 .
  116. ^ «Почему модели машинного обучения часто не в состоянии учиться: QuickTake Q & A» . Bloomberg.com . 2016-11-10. Архивировано с оригинала 2017-03-20 . Получено 2017-04-10 .
  117. ^ «Первая волна корпоративного искусственного интеллекта обречена на провал» . Гарвардский бизнес -обзор . 2017-04-18. Архивировано из оригинала 2018-08-21 . Получено 2018-08-20 .
  118. ^ «Почему ИИ Эйфория обречена на провал» . VentureBeat . 2016-09-18. Архивировано с оригинала 2018-08-19 . Получено 2018-08-20 .
  119. ^ «9 причин, по которым ваш проект машинного обучения потерпит неудачу» . www.kdnuggets.com . Архивировано из оригинала 2018-08-21 . Получено 2018-08-20 .
  120. ^ Подпрыгнуть до: а беременный Бабута, Александр; Освальд, Марион; Риник, Кристина (2018). Прозрачность и понятность (отчет). Королевский институт Объединенных служб (Руси). С. 17–22. Архивировано из оригинала 2023-12-09 . Получено 2023-12-09 .
  121. ^ «Почему автомобиль Uber в самостоятельном вождении убил пешехода» . Экономист . Архивировано из оригинала 2018-08-21 . Получено 2018-08-20 .
  122. ^ «Уотсон из IBM рекомендовал« небезопасное и неправильное »лечение рака - стат» . Статистика ​2018-07-25. Архивировано из оригинала 2018-08-21 . Получено 2018-08-21 .
  123. ^ Эрнандес, Даниэла; Гринвальд, Тед (2018-08-11). «У IBM есть дилемма Уотсона» . Wall Street Journal . ISSN   0099-9660 . Архивировано из оригинала 2018-08-21 . Получено 2018-08-21 .
  124. ^ Аллин, Бобби (27 февраля 2023 г.). «Как эксперимент Microsoft в области искусственного интеллекта имел обратный эффект» . Национальное общественное радио . Архивировано из оригинала 8 декабря 2023 года . Получено 8 декабря 2023 года .
  125. ^ Редди, Шивани М.; Патель, Шейла; Вейрих, Меган; Фентон, Джошуа; Вишванатан, Мира (2020). «Сравнение традиционного подхода к систематическому обзору с обзором рецензий и полуавтоматической стратегии в качестве стратегий обновления доказательств» . Систематические обзоры . 9 (1): 243. DOI : 10.1186/S13643-020-01450-2 . ISSN   2046-4053 . PMC   7574591 . PMID   33076975 .
  126. ^ Подпрыгнуть до: а беременный Гарсия, Меган (2016). «Расист в машине». Журнал мировой политики . 33 (4): 111–117. doi : 10.1215/07402775-3813015 . ISSN   0740-2775 . S2CID   151595343 .
  127. ^ Калискан, Айлин; Брайсон, Джоанна Дж.; Нараянан, Арвинд (2017-04-14). «Семантика, полученная автоматически из языковых корпораций, содержат человеческие предубеждения». Наука . 356 (6334): 183–186. Arxiv : 1608.07187 . Bibcode : 2017sci ... 356..183c . doi : 10.1126/science.aal4230 . ISSN   0036-8075 . PMID   28408601 . S2CID   23163324 .
  128. ^ Ван, Синьан; Dasgupta, Sanjoy (2016), Lee, DD; Sugiyama, M.; Люксбург, ультрафиолетовое; Guyon, I. (Eds.), «Алгоритм для поиска ближайшего соседа L1 с помощью монотонного встраивания» (PDF) , достижения в системах обработки нейронной информации 29 , Curran Associates, Inc., стр. 983–991, архивированный (pdf) из Оригинал на 2017-04-07 , извлечен 2018-08-20
  129. ^ Подпрыгнуть до: а беременный в Сильва, Селена; Кенни, Мартин (2018). «Алгоритмы, платформы и этническая предвзятость: интегративное эссе» (PDF) . Филон . 55 (1 и 2): 9–37. ISSN   0031-8906 . JSTOR   26545017 . Архивировано (PDF) из оригинала 27 января 2024 года.
  130. ^ Винсент, Джеймс (12 января 2018 г.). «Google» исправил »свой расистский алгоритм, удалив гориллы из его технологии, направленной на маркировку изображений» . Грава . Архивировано из оригинала 2018-08-21 . Получено 2018-08-20 .
  131. ^ Кроуфорд, Кейт (25 июня 2016 г.). «Мнение | Проблема белого парня искусственного интеллекта» . Нью -Йорк Таймс . Архивировано из оригинала 2021-01-14 . Получено 2018-08-20 .
  132. ^ Метц, Рэйчел (24 марта 2016 г.). «Почему Microsoft случайно выпустила неонацистскую сексу-бот» . MIT Technology Review . Архивировано из оригинала 2018-11-09 . Получено 2018-08-20 .
  133. ^ Симонит, Том (30 марта 2017 г.). «Microsoft: ИИ еще недостаточно адаптируется, чтобы помочь предприятиям» . MIT Technology Review . Архивировано из оригинала 2018-11-09 . Получено 2018-08-20 .
  134. ^ Хемпель, Джесси (2018-11-13). «Фей-Фей Ли стремится сделать машины лучше для человечества» . Проводной . ISSN   1059-1028 . Архивировано из оригинала 2020-12-14 . Получено 2019-02-17 .
  135. ^ Рудин, Синтия (2019). «Прекратите объяснять модели черного ящика машинного обучения для решений на высоких ставках и вместо этого используйте интерпретируемые модели» . Интеллект природы . 1 (5): 206–215. doi : 10.1038/s42256-019-0048-x . PMC   9122117 . PMID   35603010 .
  136. ^ Ху, Тонгкси; Чжан, Xuesong; Борер, Гил; Лю, Янлан; Чжоу, Юю; Мартин, Джей; Ли, Ян; Чжао, Кайгуан (2023). «Прогноз урожая с помощью объяснимого ИИ и интерпретируемого машинного обучения: опасности моделей черного ящика для оценки воздействия изменения климата на урожайность» . Сельскохозяйственная и лесная метеорология . 336 : 109458. DOI : 10.1016/j.agrformet.2023.109458 . S2CID   258552400 .
  137. ^ Домингос 2015 , глава 6, глава 7.
  138. ^ Домингос 2015 , с. 286
  139. ^ «Одиночные пиксельные изменения в программах искусственного интеллекта» . BBC News . 3 ноября 2017 года. Архивировано с оригинала 22 марта 2018 года . Получено 12 марта 2018 года .
  140. ^ «У ИИ есть проблема галлюцинации, которая оказалась трудно исправить» . Проводной . 2018. Архивировано с оригинала 12 марта 2018 года . Получено 12 марта 2018 года .
  141. ^ Мэдри, А.; Makelov, A.; Schmidt, L.; Ципрас, Д.; Владу А. (4 сентября 2019 г.). «На пути к глубокому обучению модели, устойчивые к состязательным атакам». arxiv : 1706.06083 [ stat.ml ].
  142. ^ «Адверстное машинное обучение-CLTC UC Berkeley Center для долгосрочной кибербезопасности» . CLTC . Архивировано из оригинала 2022-05-17 . Получено 2022-05-25 .
  143. ^ «Модели машинного обучения, уязвимые для не обнаруженных бэкдоров» . Реестр . Архивировано из оригинала 13 мая 2022 года . Получено 13 мая 2022 года .
  144. ^ «Неопределяемая бэкдорсбайта в любом алгоритме машинного обучения» . IEEE Spectrum . 10 мая 2022 года. Архивировано из оригинала 11 мая 2022 года . Получено 13 мая 2022 года .
  145. ^ Goldwasser, Shafi; Ким, Майкл П.; Vaikuntanathan, Vinod; Замир, или (14 апреля 2022 г.). «Посадка незаметных бэкдоров в моделях машинного обучения». Arxiv : 2204.06974 [ Cs.lg ].
  146. ^ Кохави, Рон (1995). «Изучение перекрестной проверки и начальной загрузки для оценки точности и выбора модели» (PDF) . Международная совместная конференция по искусственному интеллекту . Архивировано (PDF) из оригинала 2018-07-12 . Получено 2023-03-26 .
  147. ^ Понтий, Роберт Гилмор; Си, Канпинг (2014). «Общая эксплуатационная характеристика для измерения диагностической способности для нескольких порогов». Международный журнал географической информации . 28 (3): 570–583. Bibcode : 2014ijgis..28..570p . doi : 10.1080/136588816.2013.862623 . S2CID   29204880 .
  148. ^ Bostrom, Nick (2011). «Этика искусственного интеллекта» (PDF) . Архивировано из оригинала (PDF) 4 марта 2016 года . Получено 11 апреля 2016 года .
  149. ^ Эдионв, толулоп. «Борьба с расистскими алгоритмами» . Схема . Архивировано с оригинала 17 ноября 2017 года . Получено 17 ноября 2017 года .
  150. ^ Джеффрис, Адрианн. «Машинное обучение расистское, потому что Интернет расист» . Схема . Архивировано с оригинала 17 ноября 2017 года . Получено 17 ноября 2017 года .
  151. ^ Вонг, Карисса (2023-03-30). Исследование «справедливости», которое, как не хватало разнообразия » . Природа . doi : 10.1038/d41586-023-00935-z . PMID   36997714 . S2CID   257857012 . Архивировано из оригинала 2023-04-12 . Получено 2023-12-09 .
  152. ^ Подпрыгнуть до: а беременный Чжан, Джек Кларк. «Отчет об индексе искусственного интеллекта 2021» (PDF) . Стэнфордский институт искусственного интеллекта, ориентированного на человека . Архивировано (PDF) из оригинала на 2024-05-19 . Получено 2023-12-09 .
  153. ^ Бостром, Ник; Юдковский, Элизер (2011). «Этика искусственного интеллекта» (PDF) . Ник Бостром . Архивировано (PDF) из оригинала 2015-12-20 . Получено 2020-11-18 .
  154. ^ Mor Prates; PHC Avelar; LC Lamb (11 марта 2019 г.). «Оценка гендерного смещения в машинном переводе - тематическое исследование с Google Translate». Arxiv : 1809.02208 [ Cs.cy ].
  155. ^ Нараянан, Арвинд (24 августа 2016 г.). «Язык обязательно содержит человеческие предубеждения, как и машины, обученные языковым корпусам» . Свобода Тинкера . Архивировано из оригинала 25 июня 2018 года . Получено 19 ноября 2016 года .
  156. ^ Чар, Дантон С.; Шах, Нигам Х.; Магнус, Дэвид (2018-03-15). «Реализация машинного обучения в области здравоохранения - решение этических проблем» . Новая Англия Журнал медицины . 378 (11): 981–983. doi : 10.1056/nejmp1714229 . ISSN   0028-4793 . PMC   5962261 . PMID   29539284 .
  157. ^ Чар, DS; Шах, NH; Магнус Д. (2018). «Реализация машинного обучения в здравоохранении - сдача этических проблем» . Новая Англия Журнал медицины . 378 (11): 981–983. doi : 10.1056/nejmp1714229 . PMC   5962261 . PMID   29539284 .
  158. ^ Исследования, ИИ (23 октября 2015 г.). «Глубокие нейронные сети для акустического моделирования при распознавании речи» . Airesearch.com . Архивировано с оригинала 1 февраля 2016 года . Получено 23 октября 2015 года .
  159. ^ «На данный момент графические процессоры продолжают доминировать на рынке акселератора ИИ» . InformationWeek . Декабрь 2019 года. Архивировано с оригинала 10 июня 2020 года . Получено 11 июня 2020 года .
  160. ^ Рэй, Тирнан (2019). «ИИ меняет всю природу вычисления» . Zdnet . Архивировано из оригинала 25 мая 2020 года . Получено 11 июня 2020 года .
  161. ^ «ИИ и вычислить» . Openai . 16 мая 2018 года. Архивировано с оригинала 17 июня 2020 года . Получено 11 июня 2020 года .
  162. ^ «Физические нейронные сети Cornell & NTT:« радикальная альтернатива для внедрения глубоких нейронных сетей », которая позволяет тренировать произвольные физические системы | Сингнируется» . 27 мая 2021 года. Архивировано с оригинала 27 октября 2021 года . Получено 12 октября 2021 года .
  163. ^ «Нано-спагетти для решения потребления мощности нейронной сети» . Архивировано из оригинала 2021-10-06 . Получено 2021-10-12 .
  164. ^ Фафотис, Ксенофонт; Маркегани, Летиция; Elsts, Atis; Папа, Джеймс; Piechocki, Robert; Craddock, Ian (2018-05-07). «Распространение срока службы батареи носимых датчиков с помощью встроенного машинного обучения» . 2018 IEEE 4-й мировой форум по Интернету вещей (WF-IOT) . С. 269–274. doi : 10.1109/wf-iot.2018.8355116 . HDL : 1983/B8FDB58B-7114-45C6-82E4-4AB239C1327F . ISBN  978-1-4673-9944-9 Полем S2CID   19192912 . Архивировано из оригинала 2022-01-18 . Получено 2022-01-17 .
  165. ^ «Руководство для начинающих по машинному обучению для встроенных систем» . Analytics India Magazine . 2021-06-02. Архивировано из оригинала 2022-01-18 . Получено 2022-01-17 .
  166. ^ Синхронизирован (2022-01-12). «Google, Purdue & Harvard U-Framework для Tinyml достигает до 75x ускорений на FPGA | Сингнированный» . SyncedReview.com . Архивировано из оригинала 2022-01-18 . Получено 2022-01-17 .
  167. ^ Гири, Давид; Чиу, Куан-Лин; Ди Гульилмо, Джузеппе; Мантовани, Паоло; Карлони, Лука П. (2020-06-15). «ESP4ML: платформный дизайн систем на шипе для встроенного машинного обучения» . 2020 Дизайн, автоматизация и тест в Европе конференция и выставка (дата) . С. 1049–1054. Arxiv : 2004.03640 . doi : 10.23919/date48585.2020.9116317 . ISBN  978-3-9819263-4-7 Полем S2CID   210928161 . Архивировано из оригинала 2022-01-18 . Получено 2022-01-17 .
  168. ^ Луи, Марсия Сахайя; Азад, Захра; Delshadtehrani, Leila; Гупта, Сьюог; Страж, Пит; Редди, Виджай Джанапа; Джоши, Аджай (2019). «На пути к глубокому обучению с использованием Tensorflow Lite на RISC-V» . Гарвардский университет . Архивировано из оригинала 2022-01-17 . Получено 2022-01-17 .
  169. ^ Ибрагим, Али; Оста, Марио; Аламе, Мохамад; Салех, Мустафа; Чибл, Хусейн; Valle, Maurizio (2019-01-21). «Примерные вычислительные методы для встроенного машинного обучения» . 2018 25 -я Международная конференция IEEE по электронике, схемам и системам (ICECS) . С. 845–848. doi : 10.1109/icecs.2018.8617877 . ISBN  978-1-5386-9562-3 Полем S2CID   58670712 . Архивировано из оригинала 2022-01-17 . Получено 2022-01-17 .
  170. ^ «DBLP: TensorFlow Eager: многоэтапный DSL с питоном для машинного обучения» . dblp.org . Архивировано из оригинала 2022-01-18 . Получено 2022-01-17 .
  171. ^ Белый, Серджио; Феррейра, Андре Г.; Кабрал, Хорхе (2019-11-05). «Машинное обучение в встроенных системах, FPGA и конечных оборотах: опрос » . Электроника . 8 (11): 1289. DOI : 10.3390/Electronics8111289 . HDL : 1822/62521 . ISSN   2079-9292 .

Источники

[ редактировать ]

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5804a63c44667652c7e36851754c8865__1726124400
URL1:https://arc.ask3.ru/arc/aa/58/65/5804a63c44667652c7e36851754c8865.html
Заголовок, (Title) документа по адресу, URL1:
Machine learning - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)