Jump to content

Парадокс точности

Парадокс точности — это парадоксальный вывод о том, что точность не является хорошим показателем для прогнозных моделей при классификации в прогнозной аналитике . Это связано с тем, что простая модель может иметь высокий уровень точности, но быть слишком грубой, чтобы быть полезной. Например, если заболеваемость категории А является доминирующей и обнаруживается в 99% случаев, то точность прогнозирования того, что каждый случай относится к категории А, будет равна 99%. точность и полнота . В таких случаях лучшими мерами являются [1] [2] Основная проблема заключается в том, что существует классовый дисбаланс между позитивным классом и негативным классом. Априорные вероятности для этих классов необходимо учитывать при анализе ошибок. Точность и полнота помогают, но точность также может быть искажена из-за очень несбалансированных априорных значений классов в тестовых наборах. [ нужна ссылка ]

Например, в городе с населением в 1 миллион человек есть десять террористов. Система профилирования приводит к следующей матрице путаницы :

Предсказанный
сорт
Фактический класс
Неудача Проходить Сумма
Неудача 10 0 10
Проходить 990 999000 999990
Сумма 1000 999000 1000000

Несмотря на то, что точность 10 + 999000 / 1000000 ≈ 99,9%, 990 из 1000 положительных прогнозов неверны. Точность 10/10 + 990 = 1% показывает его плохую производительность. Поскольку классы настолько несбалансированы, лучшим показателем является оценка F1 = 2 × 0,01 × 1 / 0,01 + 1 ≈ 2% (отзыв составляет 10 + 0 / 10 = 1).

Литература

[ редактировать ]
  • Кубат, М. (2000). Решение проблемы несбалансированных обучающих наборов: односторонний отбор. Четырнадцатая международная конференция по машинному обучению.

См. также

[ редактировать ]
  1. ^ Абма, BJM (10 сентября 2009 г.), Оценка инструментов управления требованиями с поддержкой анализа воздействия изменений на основе прослеживаемости (PDF) , Университет Твенте, стр. 86–87, заархивировано из оригинала (PDF) 25 ноября 2018 г. , получено 24 ноября 2018 г.
  2. ^ Вальверде-Альбасете; Карильо-де-Альборнос; Пелаес-Морено (2013), «Предложение о новых показателях оценки и методе визуализации результатов для задач анализа настроений», Оценка доступа к информации. Многоязычие, мультимодальность и визуализация , Springer, ISBN  9783642408021
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1facda070227d76e7c70b3e8a5f3a0b6__1718027460
URL1:https://arc.ask3.ru/arc/aa/1f/b6/1facda070227d76e7c70b3e8a5f3a0b6.html
Заголовок, (Title) документа по адресу, URL1:
Accuracy paradox - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)