Jump to content

Детерминированный шум

В (контролируемом) машинном обучении , особенно при обучении на основе данных, возникают ситуации, когда значения данных невозможно смоделировать. Это может возникнуть, если в данных присутствуют случайные флуктуации или ошибки измерений, которые не моделируются, и их можно правильно назвать стохастическим шумом ; или когда моделируемое (или изучаемое) явление слишком сложное, и поэтому данные содержат дополнительную сложность, которая не моделируется. Эта дополнительная сложность данных была названа детерминированным шумом . [1] Хотя эти два типа шума возникают по разным причинам, их негативное влияние на обучение одинаково. Переобучение происходит потому, что модель пытается подогнать (стохастический или детерминированный) шум (ту часть данных, которую она не может моделировать) за счет подгонки той части данных, которую она может моделировать. При наличии любого типа шума обычно рекомендуется регуляризировать алгоритм обучения, чтобы предотвратить переподгонку модели к данным и снижение производительности. Регуляризация обычно приводит к модели с меньшей дисперсией за счет систематической ошибки .

Можно также попытаться смягчить воздействие шума, обнаруживая и удаляя зашумленные обучающие примеры перед обучением алгоритма обучения с учителем. Существует несколько алгоритмов, которые идентифицируют зашумленные примеры обучения, и удаление подозрительных зашумленных примеров обучения перед обучением обычно улучшает производительность. [2] [3]

Ссылки [ править ]

  1. ^ Ясер С.Абу-Мостафа; Малик Магдон-Исмаил; Сюань-Тянь Линь (март 2012 г.). Обучение на данных . амлбук.
  2. ^ CE Brodely и MA Friedl (1999). Выявление и устранение неправильно помеченных примеров обучения, Журнал исследований искусственного интеллекта 11, 131–167. ( http://jair.org/media/606/live-606-1803-jair.pdf. Архивировано 12 мая 2016 г. в Wayback Machine )
  3. ^ г-н Смит; Т. Мартинес (2011). «Повышение точности классификации путем выявления и удаления экземпляров, которые следует неправильно классифицировать». Материалы Международной совместной конференции по нейронным сетям (IJCNN, 2011) . стр. 2690–2697. CiteSeerX   10.1.1.221.1371 . дои : 10.1109/IJCNN.2011.6033571 .


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 79fca56358994ada166af1de5d98a98d__1704944460
URL1:https://arc.ask3.ru/arc/aa/79/8d/79fca56358994ada166af1de5d98a98d.html
Заголовок, (Title) документа по адресу, URL1:
Deterministic noise - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)