Jump to content

Наверное примерно правильное обучение

В компьютерного обучения теории вероятно приблизительно правильное ( PAC ) обучение является основой для математического анализа машинного обучения . Он был предложен в 1984 году Лесли Валиант . [ 1 ]

В этой структуре учащийся получает образцы и должен выбрать функцию обобщения (называемую гипотезой ) из определенного класса возможных функций. Цель состоит в том, чтобы с высокой вероятностью («вероятно» часть) выбранная функция имела низкую ошибку обобщения («приблизительно правильная» часть). Обучаемый должен быть в состоянии изучить концепцию при любом произвольном коэффициенте аппроксимации, вероятности успеха или распределении выборок .

Позже модель была расширена для обработки шума (неправильно классифицированных выборок).


Важным нововведением структуры PAC является внедрение концепций теории сложности вычислений в машинное обучение. В частности, ожидается, что учащийся найдет эффективные функции (требования времени и пространства, ограниченные полиномом размера примера), а сам учащийся должен реализовать эффективную процедуру (требующую количества примеров, ограниченного полиномом размера концепции, модифицированным по аппроксимации и границам правдоподобия ).

Определения и терминология

[ редактировать ]

Чтобы дать определение чему-то, что можно обучить с помощью PAC, нам сначала нужно ввести некоторую терминологию. [ 2 ]

Для следующих определений будут использоваться два примера. Первая — это проблема распознавания символов по массиву биты, кодирующие двоичное изображение. Другой пример — проблема поиска интервала, который будет правильно классифицировать точки внутри интервала как положительные, а точки за пределами диапазона — как отрицательные.

Позволять быть набором, называемым пространством экземпляров или кодировкой всех выборок. В задаче распознавания символов пространство экземпляров . В интервальной задаче пространство экземпляров , представляет собой набор всех ограниченных интервалов в , где обозначает множество всех действительных чисел .

Понятие это подмножество . Одна из концепций — это набор всех комбинаций битов в которые кодируют картинку буквы «П». Примером концепции из второго примера является набор открытых интервалов, , каждый из которых содержит только положительные моменты. Концептуальный класс представляет собой совокупность понятий, состоящих из . Это может быть набор всех подмножеств массива битов, скелетонизированных 4-связно (ширина шрифта равна 1).

Позволять быть процедурой, которая иллюстрирует пример, , используя распределение вероятностей и дает правильную метку , это 1, если и 0 в противном случае.

Теперь, учитывая , предположим, что существует алгоритм и полином в (и другие соответствующие параметры класса ) такой, что для выборки размером нарисовано согласно , то с вероятностью не менее , выводит гипотезу который имеет среднюю ошибку, меньшую или равную на с тем же распределением . Далее, если приведенное выше утверждение для алгоритма верно для любого понятия и для каждого распределения над , и для всех затем является (эффективно) обучаемым PAC (или обучаемым PAC, не требующим распространения ). Мы также можем сказать, что это алгоритм обучения PAC для .

Эквивалентность

[ редактировать ]

При некоторых условиях регулярности эти условия эквивалентны: [ 3 ]

  1. Концептуальный класс C доступен для изучения с помощью PAC.
  2. Размерность VC языка C конечна.
  3. C — равномерно класс Гливенко-Кантелли . [ нужны разъяснения ]
  4. C сжимаем . в смысле Литтлстоуна и Уормута

См. также

[ редактировать ]
  1. ^ Л. Валиант. Теория обучаемого. Сообщения ACM, 27, 1984.
  2. ^ Кернс и Вазирани, стр. 1-12,
  3. ^ Блюмер, Ансельм; Эренфойхт, Анджей; Дэвид, Хаусслер; Манфред, Вармут (октябрь 1989 г.). «Обучаемость и измерение Вапника-Червоненкиса» . Журнал Ассоциации вычислительной техники . 36 (4): 929–965. дои : 10.1145/76359.76371 . S2CID   1138467 .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f7291d6d9f25af8b3cb3d5c44897712c__1714980360
URL1:https://arc.ask3.ru/arc/aa/f7/2c/f7291d6d9f25af8b3cb3d5c44897712c.html
Заголовок, (Title) документа по адресу, URL1:
Probably approximately correct learning - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)