Jump to content

Ошибка базовой ставки

(Перенаправлено из «Ошибки базовой ставки »)
Больница, принимающая больше вакцинированных пациентов с COVID-19 , чем непривитых, может предполагать, что вакцина неэффективна, но такой дисбаланс следует ожидать среди высоковакцинированного населения. [1]

Ошибка базовой ставки , также называемая пренебрежением базовой ставкой. [2] или смещение базовой ставки — это тип заблуждения , при котором люди склонны игнорировать базовую норму (например, общую распространенность ) в пользу индивидуализирующей информации (т. е. информации, относящейся только к конкретному случаю). [3] Например, если кто-то услышит, что его друг очень застенчивый и тихий, он может подумать, что этот друг, скорее, библиотекарь, чем продавец, хотя в целом продавцов гораздо больше, чем библиотекарей, что повышает вероятность того, что его друг на самом деле продавец. Пренебрежение базовой ставкой является специфической формой более общего игнорирования расширения .

Это также называется ошибкой прокурора или ошибкой адвоката применительно к результатам статистических тестов (таких как тесты ДНК) в контексте судебного разбирательства. Эти термины были введены Уильямом К. Томпсоном и Эдвардом Шуманом в 1987 году. [4] [5] хотя утверждалось, что их определение ошибки прокурора распространяется на множество дополнительных недействительных вменений вины или ответственности, которые не поддаются анализу как ошибки в базовых ставках или теореме Байеса . [6]

Ложноположительный парадокс

[ редактировать ]

Примером ошибки базовой ставки является парадокс ложноположительного результата (также известный как парадокс точности ). результатов теста больше, Этот парадокс описывает ситуации, когда ложноположительных чем истинно положительных (это означает, что классификатор имеет низкую точность ). Например, если камера распознавания лиц может идентифицировать разыскиваемых преступников с точностью 99%, но анализирует 10 000 человек в день, высокая точность перевешивается количеством тестов, и в списке преступников программы, скорее всего, будет гораздо больше ложных срабатываний, чем истинных. Вероятность положительного результата теста определяется не только точностью теста, но и характеристиками выборочной совокупности. [7] теста Когда распространенность, то есть доля людей с данным заболеванием, ниже, чем уровень ложноположительных результатов , даже тесты, которые имеют очень низкий риск ложноположительного результата в отдельном случае, дадут больше ложноположительных результатов, чем истинно положительных в целом . [8]

Это особенно противоречит здравому смыслу при интерпретации положительного результата теста на популяции с низкой распространенностью после рассмотрения положительных результатов, полученных в популяции с высокой распространенностью. [8] Если уровень ложноположительных результатов теста выше, чем доля новой популяции с этим заболеванием, то администратор тестирования, чей опыт был основан на тестировании в популяции с высокой распространенностью, может заключить на основе опыта, что положительный результат теста обычно указывает на положительный субъект, хотя на самом деле ложноположительный результат гораздо более вероятен.

Пример 1: Болезнь

[ редактировать ]

Популяция с высокой распространенностью

[ редактировать ]
Число
людей
Зараженный Неинфицированный Общий
Тест
позитивный
400
(истинно положительный)
30
(ложноположительный)
430
Тест
отрицательный
0
(ложноотрицательный)
570
(истинно отрицательный)
570
Общий 400 600 1000

Представьте себе, что вы проводите тест на инфекционные заболевания среди населения А из 1000 человек, из которых 40% инфицированы. Уровень ложноположительных результатов теста составляет 5% (0,05), а уровень ложноотрицательных результатов равен нулю. Ожидаемый результат 1000 тестов в популяции А будет следующим:

Инфицирован и тест указывает на заболевание ( истинно положительный результат )
1000 × 40 / 100 = 400 человек получат настоящий положительный результат
Неинфицирован и тест указывает на заболевание (ложноположительный результат)
1000 × 100 – 40/100 × 0,05 = 30 человек получат ложноположительный результат
Остальные 570 тестов оказались правильно отрицательными.

Таким образом, в популяции А человек, получивший положительный тест, может быть уверен в себе более чем на 93% ( 400 / 30 + 400 ), что правильно указывает на инфекцию.

Популяция с низкой распространенностью

[ редактировать ]
Число
людей
Зараженный Неинфицированный Общий
Тест
позитивный
20
(истинно положительный)
49
(ложноположительный)
69
Тест
отрицательный
0
(ложноотрицательный)
931
(истинно отрицательный)
931
Общий 20 980 1000

Теперь рассмотрим тот же тест, примененный к популяции B , из которой инфицированы только 2%. Ожидаемый результат 1000 тестов в популяции B будет следующим:

Инфицирован, и тест указывает на заболевание (истинно положительный)
1000 × 2/100 = результат 20 человек получат настоящий положительный
Неинфицирован и тест указывает на заболевание (ложноположительный результат)
1000 × 100 – 2/100 × 0,05 = 49 человек получат ложноположительный результат.
Остальные 931 тест оказались правильно отрицательными.

В популяции B только 20 из 69 человек с положительным результатом теста действительно инфицированы. Таким образом, вероятность действительно заразиться после того, как человеку сообщили, что он заражен, составляет всего 29% ( 20 / 20 + 49 ) для теста, который в противном случае кажется «точным на 95%.

Тестировщику с опытом работы в группе А может показаться парадоксом, что в группе Б результат, который обычно правильно указывал на инфекцию, теперь обычно оказывается ложноположительным. Смешение апостериорной вероятности заражения с априорной вероятностью получения ложноположительного результата является естественной ошибкой после получения опасного для здоровья результата теста.

Пример 2: Пьяные водители

[ редактировать ]

Представьте себе, что у группы полицейских есть алкотестеры, показывающие ложное состояние опьянения в 5% случаев, когда водитель трезв. Однако алкотестеры всегда способны обнаружить действительно пьяного человека. Один из тысячи водителей водит машину пьяным. Предположим, что полицейские затем случайным образом останавливают водителя, чтобы провести проверку на алкотестере. Это указывает на то, что водитель пьян. Никакой другой информации о них не известно.

Многие оценили бы вероятность того, что водитель пьян, в 95%, но правильная вероятность составляет около 2%.

Объяснение этому следующее: в среднем на каждую 1000 протестированных водителей

  • 1 водитель пьян, и существует 100% уверенность в том, что у этого водителя действительно положительный результат теста, поэтому есть 1 истинно положительный результат теста.
  • 999 водителей не пьяны, среди них 5% ложноположительных результатов тестов, то есть 49,95 ложноположительных результатов тестов.

Следовательно, вероятность того, что любой водитель из 1 + 49,95 = 50,95 положительных результатов теста действительно пьян, равна .

Однако достоверность этого результата зависит от обоснованности первоначального предположения о том, что полицейский остановил водителя действительно случайно, а не из-за плохого вождения. Если имелась та или иная непроизвольная причина остановки водителя, то в расчете также учитывается вероятность того, что пьяный водитель будет управлять грамотно, а непьяный водитель будет управлять (не)грамотно.

Более формально, ту же вероятность, равную примерно 0,02, можно установить с помощью теоремы Байеса . Цель состоит в том, чтобы найти вероятность того, что водитель пьян, учитывая, что алкотестер показал, что он пьян, что можно представить как

где D означает, что алкотестер показывает, что водитель пьян. Используя теорему Байеса,

В этом сценарии известна следующая информация:

и

Как видно из формулы, для теоремы Байеса требуется p ( D ), который можно вычислить из предыдущих значений, используя закон полной вероятности :

что дает

Подставляя эти числа в теорему Байеса, можно обнаружить, что

что такое точность теста.

Пример 3: Выявление террориста

[ редактировать ]

Пусть в городе с населением в 1 миллион жителей будет 100 террористов и 999 900 нетеррористов. Для упрощения примера предполагается, что все люди, находящиеся в городе, являются его жителями. Таким образом, базовая вероятность того, что случайно выбранный житель города является террористом, равна 0,0001, а базовая вероятность того, что тот же самый житель не является террористом, равна 0,9999. Пытаясь поймать террористов, город устанавливает систему сигнализации с камерой наблюдения и программным обеспечением автоматического распознавания лиц .

Программное обеспечение имеет два уровня отказов по 1%:

  • Уровень ложноотрицательных результатов: если камера сканирует террориста, звонок прозвенит в 99% случаев и не прозвенит в 1% случаев.
  • Уровень ложноположительных результатов: если камера сканирует человека, не являющегося террористом, звонок не будет звонить в 99% случаев, но будет звонить в 1% случаев.

Предположим теперь, что тревогу включает житель. Кто-то, допускающий ошибку базовой ставки, пришел бы к выводу, что существует 99% вероятность того, что обнаруженный человек является террористом. Хотя этот вывод кажется разумным, на самом деле это плохое рассуждение, и приведенный ниже расчет покажет, что вероятность террориста на самом деле составляет около 1%, а не около 99%.

Заблуждение возникает из-за путаницы природы двух разных показателей отказов. «Количество нетеррористов на 100 террористов» (P(¬B | T), или вероятность того, что звонок не прозвенит, если житель является террористом) и «число нетеррористов на 100 звонков» (P (¬T | B), или вероятность того, что житель не является террористом, учитывая звон колокола) являются несвязанными величинами; одно не обязательно равно другому или даже близко к нему. Чтобы продемонстрировать это, рассмотрим, что произойдет, если идентичную систему сигнализации установить во втором городе, где вообще нет террористов. Как и в первом городе, сигнал тревоги звучит для 1 из каждых 100 обнаруженных жителей-нетеррористов, но в отличие от первого города, сигнал тревоги никогда не звучит для террориста. Таким образом, 100% всех случаев срабатывания тревоги приходится на нетеррористов, но процент ложноотрицательных результатов даже подсчитать невозможно. «Число нетеррористов на 100 колоколов» в этом городе равно 100, но P(T | B) = 0%. Судя по звонку в колокол, вероятность того, что террорист будет обнаружен, равна нулю.

Представьте себе, что перед камерой проходит все население первого города в миллион человек. Около 99 из 100 террористов поднимут тревогу, как и около 9 999 из 999 900 нетеррористов. Таким образом, тревогу поднимут около 10 098 человек, среди которых около 99 будут террористами. Вероятность того, что человек, включивший сигнализацию, на самом деле является террористом, составляет всего около 99 из 10 098, что составляет менее 1% и очень, очень намного ниже первоначальной оценки в 99%.

Ошибка базовой ставки настолько вводит в заблуждение в этом примере, потому что нетеррористов гораздо больше, чем террористов, а количество ложноположительных результатов (нетеррористов сканируется как террористы) намного больше, чем истинных положительных результатов (террористов сканируют как террористов).

Многие практики утверждают, что, поскольку базовый уровень терроризма чрезвычайно низок, использование интеллектуального анализа данных и алгоритмов прогнозирования для идентификации террористов не может быть эффективным из-за парадокса ложноположительного результата. [9] [10] [11] [12] Оценки количества ложноположительных результатов для каждого точного результата варьируются от более десяти тысяч. [12] до одного миллиарда; [10] следовательно, расследование каждой версии будет непомерно затратным по затратам и времени. [9] [11] Уровень точности, необходимый для того, чтобы сделать эти модели жизнеспособными, вероятно, недостижим. Прежде всего, низкий базовый уровень терроризма также означает отсутствие данных для создания точного алгоритма. [11] Кроме того, в контексте выявления терроризма ложноотрицательные результаты крайне нежелательны и поэтому должны быть сведены к минимуму, насколько это возможно; однако это требует повышения чувствительности за счет специфичности , что приводит к увеличению количества ложноположительных результатов. [12] Также сомнительно, сможет ли использование таких моделей правоохранительными органами выполнить необходимое бремя доказывания, учитывая, что более 99% результатов будут ложноположительными. [12]

Пример 4: биологическое тестирование подозреваемого

[ редактировать ]

Совершено преступление. Судебно-медицинская экспертиза установила, что у преступника определенная группа крови, которую разделяют 10% населения. Подозреваемый арестован, и у него та же группа крови.

Прокурор может предъявить подозреваемому обвинение в совершении преступления только на этом основании и заявить на суде, что вероятность того, что обвиняемый виновен, составляет 90%.

Однако этот вывод будет близок к правильному только в том случае, если обвиняемый был выбран в качестве главного подозреваемого на основании убедительных доказательств, обнаруженных до анализа крови и не связанных с ним. В противном случае представленное рассуждение ошибочно, поскольку оно упускает из виду высокую априорную вероятность (то есть до анализа крови) того, что он является случайным невиновным человеком. Предположим, например, что в городе, где произошло преступление, проживает 1000 человек. Это означает, что там живут 100 человек, имеющих группу крови преступника, из которых только один является истинным преступником; следовательно, истинная вероятность того, что обвиняемый виновен – основываясь только на том факте, что его группа крови совпадает с группой крови убийцы – составляет всего 1%, что намного меньше 90%, как утверждает прокурор.

Ошибка прокурора заключается в предположении, что априорная вероятность случайного совпадения равна вероятности невиновности обвиняемого. При его использовании прокурор, допрашивающий свидетеля-эксперта, может спросить: «Шансы найти эти доказательства у невиновного человека настолько малы, что присяжные могут спокойно игнорировать возможность того, что этот обвиняемый невиновен, верно?» [13] В заявлении предполагается, что вероятность того, что улики будут найдены у невиновного человека, такая же, как вероятность того, что человек невиновен, учитывая, что у него были найдены улики, что неверно. В то время как первое обычно невелико (10% в предыдущем примере) из-за хороших процедур судебно-медицинской экспертизы , второе (99% в этом примере) не имеет к нему прямого отношения и часто будет намного выше, поскольку, по сути, оно зависит от на вероятных довольно высоких априорных шансах на то, что обвиняемый окажется случайным невиновным человеком.

Примеры в законе

[ редактировать ]

Суд над О Джей Симпсоном

[ редактировать ]

О. Дж. Симпсона судили и оправдали в 1995 году за убийства его бывшей жены Николь Браун Симпсон и ее друга Рональда Голдмана.

Кровь на месте преступления соответствовала крови Симпсона по характеристикам, присущим 1 из 400 человек. Однако защита утверждала, что количество людей из Лос-Анджелеса, соответствующих выборке, могло бы заполнить футбольный стадион и что цифра 1 на 400 бесполезна. [14] [15] Было бы неправильно и было бы примером ошибки прокурора полагаться исключительно на цифру «1 из 400» для вывода о том, что конкретное лицо, соответствующее выборке, скорее всего, будет виновником.

Дерево частот 100 000 избитых американок, показывающее ошибку прокурора в судебном процессе по делу об убийстве О. Дж. Симпсона

На том же судебном процессе обвинение представило доказательства того, что Симпсон применял насилие по отношению к своей жене. Защита утверждала, что на каждые 2500 женщин, подвергшихся супружескому насилию, была убита только одна женщина, и что любая история жестокого обращения Симпсона по отношению к своей жене не имеет значения для суда. Однако обоснование расчетов защиты было ошибочным. По мнению автора Герда Гигеренцера , правильная вероятность требует дополнительного контекста: жена Симпсона не только подверглась домашнему насилию, но, скорее, подверглась домашнему насилию (со стороны Симпсона) и была убита (кем-то). Гигеренцер пишет: «Шансы на то, что насильник действительно убил свою партнершу, учитывая, что она была убита, составляют примерно 8 из 9, или примерно 90%». [16] Хотя большинство случаев супружеского насилия не заканчиваются убийством, большинство случаев убийств, в которых имеется история супружеского насилия, были совершены супругом.

Дело Салли Кларк

[ редактировать ]

Салли Кларк , британку, в 1998 году обвинили в убийстве своего первого ребенка в возрасте 11 недель, а затем второго ребенка в возрасте 8 недель. У обвинения был свидетель-эксперт сэр Рой Медоу , профессор и педиатр-консультант. [17] свидетельствуют, что вероятность смерти двух детей в одной семье от СВДС составляет примерно 1 на 73 миллиона. Это было гораздо реже, чем фактический показатель, измеренный в исторических данных – Медоу оценил его на основе данных о смертности от одиночной СВДС и предположения, что вероятность таких смертей не должна быть коррелированной между младенцами. [18]

Медоу признал, что 1 из 73 миллионов не является чем-то невозможным, но утверждал, что такие несчастные случаи будут происходить «раз в сто лет» и что в стране с 15 миллионами семей с двумя детьми гораздо более вероятно, что двойное смерти вызваны синдромом Мюнхгаузена, а не столь редким несчастным случаем. Однако есть веские основания предполагать, что вероятность смерти от СВДС в семье значительно выше, если предыдущий ребенок уже умер при таких обстоятельствах ( генетическая предрасположенность к СВДС, вероятно, лишит законной силы предполагаемую статистическую независимость [19] ) делает некоторые семьи более восприимчивыми к СВДС, а ошибка является результатом экологического заблуждения . [20] Вероятность двух смертей от СВДС в одной семье не может быть достоверно оценена путем возведения в квадрат вероятности одной такой смерти во всех других схожих семьях. [21]

Цифра 1 на 73 миллиона сильно недооценивает вероятность двух несчастных случаев подряд, но даже если бы эта оценка была точной, суд, похоже, упустил тот факт, что цифра 1 на 73 миллиона сама по себе ничего не значила. Как априорную вероятность ее следует сопоставить с априорными вероятностями альтернатив. Учитывая, что произошли две смерти, одно из следующих объяснений должно быть верным, и все они априори крайне маловероятны:

  1. Две последовательные смерти в одной семье, обе в результате СВДС
  2. Двойное убийство (версия обвинения)
  3. Другие возможности (включая одно убийство и один случай СВДС)

Неясно, предлагалась ли когда-либо оценка вероятности второй возможности в ходе судебного разбирательства, или же сравнение первых двух вероятностей считалось ключевой оценкой, которую необходимо было сделать в статистическом анализе, сравнивающем версию обвинения с версией обвинения. невиновность.

опубликовало пресс-релиз, Кларк был осужден в 1999 году, в результате чего Королевское статистическое общество в котором указали на ошибки. [22]

В 2002 году Рэй Хилл (профессор математики из Солфорда ) попытался точно сравнить шансы этих двух возможных объяснений; он пришел к выводу, что последовательные несчастные случаи в 4,5–9 раз более вероятны, чем последовательные убийства, так что априорные шансы виновности Кларка составляли от 4,5 к 1 и 9 к 1 против. [23]

После того, как суд установил, что судебно-медицинский патологоанатом, осматривавший обоих младенцев, скрыл оправдательные доказательства , 29 января 2003 года суд более высокой инстанции отменил приговор Кларку. [24]

Результаты в психологии

[ редактировать ]

В ходе экспериментов было обнаружено, что люди предпочитают индивидуальную информацию общей информации, когда первая доступна. [25] [26] [27]

В некоторых экспериментах студентов просили оценить средние баллы (GPA) гипотетических студентов. Получив соответствующую статистику о распределении среднего балла, учащиеся, как правило, игнорировали ее, если ей давали описательную информацию о конкретном учащемся, даже если новая описательная информация, очевидно, имела мало или вообще не имела отношения к школьной успеваемости. [26] Этот вывод использовался, чтобы доказать, что собеседования являются ненужной частью процесса поступления в колледж , поскольку интервьюеры не могут выбрать успешных кандидатов лучше, чем базовая статистика.

Психологи Дэниел Канеман и Амос Тверски попытались объяснить это открытие с помощью простого правила или «эвристики», называемого репрезентативностью . Они утверждали, что многие суждения, касающиеся вероятности или причины и следствия, основаны на том, насколько одна вещь репрезентативна для другой или категории. [26] Канеман считает, что игнорирование базовой ставки является особой формой игнорирования расширения . [28] Ричард Нисбетт утверждал, что некоторые атрибутивные предубеждения , такие как фундаментальная ошибка атрибуции, являются примерами ошибки базовой ставки: люди не используют «консенсусную информацию» («базовую ставку») о том, как другие вели себя в аналогичных ситуациях, и вместо этого предпочитают более простые диспозиционные атрибуции. . [29]

В психологии ведутся серьезные споры об условиях, при которых люди ценят или не ценят базовую информацию. [30] [31] Исследователи программы эвристики и предвзятости подчеркнули эмпирические данные, показывающие, что люди склонны игнорировать базовые ставки и делать выводы, которые нарушают определенные нормы вероятностного рассуждения, такие как теорема Байеса . Вывод, сделанный в результате этого направления исследований, заключался в том, что человеческое вероятностное мышление фундаментально ошибочно и подвержено ошибкам. [32] Другие исследователи подчеркивали связь между когнитивными процессами и информационными форматами, утверждая, что такие выводы в целом необоснованны. [33] [34]

Рассмотрим еще раз пример 2 сверху. Требуемый вывод состоит в том, чтобы оценить (апостериорную) вероятность того, что (случайно выбранный) водитель пьян, при условии, что тест на алкотестер положителен. Формально эту вероятность можно вычислить с помощью теоремы Байеса, как показано выше. Однако существуют разные способы представления соответствующей информации. Рассмотрим следующий формально эквивалентный вариант задачи:

1 из 1000 водителей водит машину в нетрезвом виде. Алкотестеры всегда распознают действительно пьяного человека. У 50 из 999 водителей, которые не пьяны, алкотестер ложно показывает состояние опьянения. Предположим, что полицейские случайно останавливают водителя и заставляют его пройти тест на алкотестер. Это указывает на то, что они пьяны. Никакой другой информации о них не известно. Оцените вероятность того, что водитель действительно пьян.

В этом случае соответствующая числовая информация — p (пьяный), p ( D | пьяный), p ( D | трезвый) — представлена ​​в терминах собственных частот относительно определенного эталонного класса (см. задачу эталонного класса ). Эмпирические исследования показывают, что выводы людей более точно соответствуют правилу Байеса, когда информация представлена ​​таким образом, что помогает преодолеть базовую пренебрежение среди непрофессионалов. [34] и эксперты. [35] Как следствие, такие организации, как Cochrane Collaboration, рекомендуют использовать этот формат для передачи статистики здравоохранения. [36] Научить людей переводить подобные байесовские задачи рассуждения в форматы собственных частот более эффективно, чем просто учить их подставлять вероятности (или проценты) в теорему Байеса. [37] Также было показано, что графическое представление собственных частот (например, массивы значков, графики гипотетических результатов) помогают людям делать более точные выводы. [37] [38] [39] [40]

Одна из важных причин, почему форматы собственных частот полезны, заключается в том, что этот информационный формат облегчает необходимые выводы, поскольку упрощает необходимые вычисления. В этом можно убедиться при использовании альтернативного способа вычисления требуемой вероятности p (пьяный| D ):

где N (drunk ∩ D ) обозначает количество водителей, находящихся в нетрезвом состоянии и получивших положительный результат алкотестера, а N ( D ) обозначает общее количество случаев с положительным результатом алкотестера. Эквивалентность этого уравнения приведенному выше следует из аксиом теории вероятностей, согласно которым N (пьяный ∩ D ) = N × p ( D | пьяный) × p (пьяный). Важно отметить, что хотя это уравнение формально эквивалентно правилу Байеса, оно не эквивалентно психологически. Использование собственных частот упрощает вывод, поскольку требуемую математическую операцию можно выполнить над натуральными числами вместо нормализованных дробей (т. е. вероятностей), поскольку это делает большое количество ложных срабатываний более прозрачным, а также потому, что собственные частоты представляют собой «вложенный набор» структура». [41] [42]

Не каждый частотный формат облегчает байесовские рассуждения. [42] [43] Собственные частоты относятся к частотной информации, полученной в результате естественной выборки . [44] который сохраняет информацию о базовой ставке (например, количество пьяных водителей при случайном отборе водителей). Это отличается от систематической выборки , при которой базовые ставки фиксируются априори (например, в научных экспериментах). В последнем случае невозможно вывести апостериорную вероятность p (пьяный | положительный тест) путем сравнения количества водителей, которые находятся в нетрезвом состоянии и имеют положительный результат теста, по сравнению с общим числом людей, которые получили положительный результат алкотестера, поскольку информация о базовой ставке не сохраняется и должен быть явно повторно введен с помощью теоремы Байеса.

См. также

[ редактировать ]
  1. ^ «Случаи, госпитализации и смерти от COVID-19 в зависимости от статуса вакцинации» (PDF) . Департамент здравоохранения штата Вашингтон. 18 января 2023 г. Архивировано (PDF) из оригинала 26 января 2023 г. Проверено 14 февраля 2023 г. Если подверженность Covid-19 останется прежней, то по мере того, как все больше людей будет вакцинировано, больше случаев, госпитализаций и смертей будет наблюдаться у вакцинированных людей, поскольку они будут продолжать составлять все большую и большую часть населения. Например, если бы 100% населения было вакцинировано, 100% случаев были бы среди привитых людей.
  2. ^ Уэлш, Мэтью Б.; Наварро, Дэниел Дж. (2012). «Увидеть — значит поверить: приоритеты, доверие и пренебрежение базовой ставкой» . Организационное поведение и процессы принятия человеческих решений . 119 (1): 1–14. дои : 10.1016/j.obhdp.2012.04.001 . hdl : 2440/41190 . ISSN   0749-5978 .
  3. ^ «Логическая ошибка: ошибка базовой ставки» . Fallacyfiles.org . Проверено 15 июня 2013 г.
  4. ^ Томпсон, Вашингтон; Шуман, Э.Л. (1987). «Интерпретация статистических доказательств в уголовных процессах: ошибка прокурора и ошибка адвоката». Закон и поведение человека . 2 (3): 167. дои : 10.1007/BF01044641 . JSTOR   1393631 . S2CID   147472915 .
  5. ^ Фонтан, Джон; Ганби, Филип (февраль 2010 г.). «Неоднозначность, иллюзия уверенности и подход Гигеренцера на основе естественной частоты к рассуждениям с обратными вероятностями» (PDF) . Университет Кентербери . п. 6. [ постоянная мертвая ссылка ]
  6. ^ Сасс, Ричард А. (4 октября 2023 г.). «Заблуждение прокурора, оформленное как образец подмены пространства». Препринты OSF . дои : 10.31219/osf.io/cs248 .
  7. ^ Райнфурт, Миннесота; Хауэлл, LW (март 1998 г.). Вероятность и статистика в аэрокосмической технике . НАСА . п. 16. СООБЩЕНИЕ: Ложноположительные тесты более вероятны, чем истинно положительные тесты, когда в общей популяции распространенность заболевания низкая. Это называется ложноположительным парадоксом.
  8. ^ Jump up to: а б Вашер, Х.Л. (май 2003 г.). «Количественная грамотность – тестирование на наркотики, скрининг рака и выявление магматических пород» . Журнал Geoscience Education : 2. На первый взгляд это кажется извращенным: чем меньше студенты в целом употребляют стероиды , тем больше вероятность того, что студент, идентифицированный как пользователь, окажется непотребителем. Это назвали парадоксом ложного срабатывания . Цитируем: Гоник, Л.; Смит, В. (1993). Мультяшный справочник по статистике . Нью-Йорк: Харпер Коллинз. п. 49.
  9. ^ Jump up to: а б Мунк, Тимме Бисгор (1 сентября 2017 г.). «100 000 ложных срабатываний на каждого настоящего террориста: Почему антитеррористические алгоритмы не работают» . Первый понедельник . 22 (9). дои : 10.5210/fm.v22i9.7126 .
  10. ^ Jump up to: а б Шнайер, Брюс . «Почему интеллектуальный анализ данных не остановит террор» . Проводной . ISSN   1059-1028 . Проверено 30 августа 2022 г.
  11. ^ Jump up to: а б с Джонас, Джефф; Харпер, Джим (11 декабря 2006 г.). «Эффективная борьба с терроризмом и ограниченная роль прогнозного анализа данных» . Институт КАТО . Проверено 30 августа 2022 г.
  12. ^ Jump up to: а б с д Сейджман, Марк (17 февраля 2021 г.). «Последствия чрезвычайно низкой базовой ставки терроризма» . Терроризм и политическое насилие . 33 (2): 302–311. дои : 10.1080/09546553.2021.1880226 . ISSN   0954-6553 . S2CID   232341781 .
  13. ^ Фентон, Норман; Нил, Мартин; Бергер, Дэниел (июнь 2016 г.). «Байес и закон» . Ежегодный обзор статистики и ее применения . 3 (1): 51–77. Бибкод : 2016AnRSA...3...51F . doi : 10.1146/annurev-statistics-041715-033428 . ПМЦ   4934658 . ПМИД   27398389 .
  14. ^ Робертсон, Б., и Виньо, Джорджия (1995). Интерпретация доказательств: оценка судебно-медицинских доказательств в зале суда. Чичестер: Джон Уайли и сыновья.
  15. ^ Россмо, Д. Ким (2009). Неудачи в расследовании уголовных дел. CRC Press Тейлор и Фрэнсис Груп.
  16. ^ Гигеренцер, Г., Расплата с риском: учимся жить в условиях неопределенности, Penguin, (2003).
  17. ^ «Резолюция, принятая Сенатом (21 октября 1998 г.) об отставке профессора сэра Роя Медоу» . Репортер . № 428. Университет Лидса . 30 ноября 1998 г. Архивировано из оригинала 16 апреля 2016 г. Проверено 17 октября 2015 г.
  18. ^ Вероятность летального исхода от СВДС среди населения составляла примерно 1 из 1303; Медоу получил оценку «1 из 73 миллионов», исходя из меньшей вероятности смерти от СВДС в семье Кларков, в которой были более низкие факторы риска (например, некурение). В этой подгруппе населения он оценил вероятность одной смерти в 1 на 8500. Видеть: Джойс, Х. (сентябрь 2002 г.). «Вне разумного сомнения» (pdf) . plus.maths.org . Проверено 12 июня 2010 г. . Профессор Рэй Хилл поставил под сомнение даже этот первый шаг (1/8500 против 1/1300) по двум причинам: во-первых, на том основании, что он был предвзятым , исключая те факторы, которые повышали риск (особенно то, что оба ребенка были мальчиками) и (что более важно) потому что снижение факторов риска СВДС пропорционально уменьшит факторы риска убийств, так что относительная частота синдрома Мюнхгаузена по доверенности и СВДС останется в том же соотношении, что и среди населения в целом: Хилл, Рэй (2002). «Детская смерть или убийство? – Взвешивая вероятности» . Совершенно несправедливо использовать характеристики, которые, по сути, делают ее хорошей, чистоплотной матерью, как факторы, которые играют против нее. Да, мы можем согласиться с тем, что такие факторы делают естественную смерть менее вероятной, но те же самые характеристики также делают менее вероятным убийство.
  19. ^ Суини, Джон; Ло, Билл (15 июля 2001 г.). «Находка гена ставит под сомнение двойное убийство в детской кроватке» . Наблюдатель . Архивировано из оригинала 11 июля 2012 г.
  20. ^ Винсент Шерер. «Осужден по статистике?» . Проверено 21 мая 2010 г.
  21. ^ Хилл, Р. (2004). «Множественные внезапные детские смерти – совпадение или не совпадение?» (PDF) . Детская и перинатальная эпидемиология . 18 (5): 321. doi : 10.1111/j.1365-3016.2004.00560.x . ПМИД   15367318 . Архивировано из оригинала (PDF) 30 августа 2012 г. Проверено 13 июня 2010 г.
  22. ^ «Королевское статистическое общество обеспокоено проблемами, поднятыми по делу Салли Кларк» (PDF) . 23 октября 2001 г. Архивировано из оригинала (PDF) 24 августа 2011 г. Общество не терпит, чтобы врачи совершали серьезные клинические ошибки, поскольку широко распространено понимание того, что такие ошибки могут означать разницу между жизнью и смертью. Дело Р. против Салли Кларк является одним из примеров того, как свидетель-медик-эксперт допустил серьезную статистическую ошибку, которая могла оказать глубокое влияние на исход дела.
  23. ^ Неопределенность в этом диапазоне в основном обусловлена ​​неуверенностью в вероятности убийства второго ребенка после убийства первого, см.: Хилл, Р. (2004). «Множественные внезапные детские смерти – совпадение или не совпадение?» (PDF) . Детская и перинатальная эпидемиология . 18 (5): 322–323. дои : 10.1111/j.1365-3016.2004.00560.x . ПМИД   15367318 . Архивировано из оригинала (PDF) 30 августа 2012 г. Проверено 13 июня 2010 г.
  24. ^ «Р против Кларка. [2003] EWCA Crim 1020 (11 апреля 2003 г.)» . www.bailii.org .
  25. ^ Бар-Гилель, Майя (1980). «Ошибка базовой ставки в вероятностных суждениях» (PDF) . Акта Психологика . 44 (3): 211–233. дои : 10.1016/0001-6918(80)90046-3 .
  26. ^ Jump up to: а б с Канеман, Дэниел; Амос Тверски (1973). «О психологии прогнозирования». Психологический обзор . 80 (4): 237–251. дои : 10.1037/h0034747 . S2CID   17786757 .
  27. ^ Тверски, Амос; Канеман, Дэниел (27 сентября 1974 г.). «Суждение в условиях неопределенности: эвристика и предвзятость». Наука . 185 (4157): 1124–1131. Бибкод : 1974Sci...185.1124T . дои : 10.1126/science.185.4157.1124 . ПМИД   17835457 . S2CID   143452957 .
  28. ^ Канеман, Дэниел (2000). «Оценка по моментам, прошлому и будущему». В Дэниеле Канемане и Амосе Тверски (ред.). Выбор, ценности и рамки . ISBN  0-521-62749-4 .
  29. ^ Нисбетт, Ричард Э.; Э. Борджида; Р. Крэндалл; Х. Рид (1976). «Популярная индукция: информация не всегда информативна». В Дж. С. Кэрролле и Дж. У. Пейне (ред.). Познание и социальное поведение . Том. 2. Джон Уайли и сыновья, Инкорпорейтед. стр. 227–236. ISBN  0-470-99007-4 .
  30. ^ Келер, Джей Джей (2010). «Переосмысление ошибки базовой ставки: описательные, нормативные и методологические проблемы». Поведенческие и мозговые науки . 19 : 1–17. дои : 10.1017/S0140525X00041157 . S2CID   53343238 .
  31. ^ Барби, АК; Сломан, С.А. (2007). «Базовое уважение: от экологической рациональности к двойным процессам». Поведенческие и мозговые науки . 30 (3): 241–254, обсуждение 255–297. дои : 10.1017/S0140525X07001653 . ПМИД   17963533 . S2CID   31741077 .
  32. ^ Тверский, А.; Канеман, Д. (1974). «Суждение в условиях неопределенности: эвристика и предубеждения». Наука . 185 (4157): 1124–1131. Бибкод : 1974Sci...185.1124T . дои : 10.1126/science.185.4157.1124 . ПМИД   17835457 . S2CID   143452957 .
  33. ^ Космидес, Леда; Джон Туби (1996). «Являются ли люди хорошими интуитивными статистиками? Переосмысление некоторых выводов литературы о суждениях в условиях неопределенности». Познание . 58 : 1–73. CiteSeerX   10.1.1.131.8290 . дои : 10.1016/0010-0277(95)00664-8 . S2CID   18631755 .
  34. ^ Jump up to: а б Гигеренцер, Г.; Хоффраж, У. (1995). «Как улучшить байесовские рассуждения без инструкций: частотные форматы». Психологический обзор . 102 (4): 684. CiteSeerX   10.1.1.128.3201 . дои : 10.1037/0033-295X.102.4.684 . S2CID   16281385 .
  35. ^ Хоффраж, У.; Линдси, С.; Хертвиг, Р.; Гигеренцер, Г. (2000). «Медицина: передача статистической информации». Наука . 290 (5500): 2261–2262. дои : 10.1126/science.290.5500.2261 . hdl : 11858/00-001M-0000-0025-9B18-3 . ПМИД   11188724 . S2CID   33050943 .
  36. ^ Акл, Е.А.; Оксман, AD; Херрин, Дж.; Вист, GE; Терренато, И.; Сперати, Ф.; Костюнюк, К.; Бланк, Д.; Шунеманн, Х. (2011). Шунеманн, Хольгер (ред.). «Использование альтернативных статистических форматов для представления рисков и снижения рисков» . Кокрановская база данных систематических обзоров . 2011 (3): CD006776. дои : 10.1002/14651858.CD006776.pub2 . ПМК   6464912 . ПМИД   21412897 .
  37. ^ Jump up to: а б Седльмайер, П.; Гигеренцер, Г. (2001). «Обучение байесовскому мышлению менее чем за два часа» . Журнал экспериментальной психологии: Общие сведения . 130 (3): 380–400. дои : 10.1037/0096-3445.130.3.380 . hdl : 11858/00-001M-0000-0025-9504-E . ПМИД   11561916 . S2CID   11147078 .
  38. ^ Брейс, Г.Л. (2009). «Изобразительные изображения в статистических рассуждениях». Прикладная когнитивная психология . 23 (3): 369–381. дои : 10.1002/acp.1460 . S2CID   18817707 .
  39. ^ Эдвардс, А.; Элвин, Г.; Малли, А. (2002). «Объяснение рисков: Превращение числовых данных в значимые картины» . БМЖ . 324 (7341): 827–830. дои : 10.1136/bmj.324.7341.827 . ПМЦ   1122766 . ПМИД   11934777 .
  40. ^ Ким, Йа-Сыль; Уоллс, Логан А.; Крафт, Питер; Халлман, Джессика (2 мая 2019 г.). «Байесовский подход к познанию для улучшения визуализации данных» . Материалы конференции CHI 2019 года по человеческому фактору в вычислительных системах . стр. 1–14. arXiv : 1901.02949 . дои : 10.1145/3290605.3300912 . ISBN  9781450359702 . S2CID   57761146 .
  41. ^ Джиротто, В.; Гонсалес, М. (2001). «Решение вероятностных и статистических задач: вопрос структуры информации и формы вопросов». Познание . 78 (3): 247–276. дои : 10.1016/S0010-0277(00)00133-5 . ПМИД   11124351 . S2CID   8588451 .
  42. ^ Jump up to: а б Хоффраж, У.; Гигеренцер, Г.; Краусс, С.; Мартинньон, Л. (2002). «Представление облегчает рассуждения: что такое собственные частоты, а что нет». Познание . 84 (3): 343–352. дои : 10.1016/S0010-0277(02)00050-1 . ПМИД   12044739 . S2CID   9595672 .
  43. ^ Гигеренцер, Г.; Хоффраж, У. (1999). «Преодоление трудностей в байесовском рассуждении: ответ Льюису и Керен (1999) и Меллерсу и МакГроу (1999)» . Психологический обзор . 106 (2): 425. дои : 10.1037/0033-295X.106.2.425 . hdl : 11858/00-001M-0000-0025-9CB4-8 .
  44. ^ Кляйтер, Г.Д. (1994). «Естественная выборка: рациональность без базовых ставок». Вклад в математическую психологию, психометрику и методологию . Последние исследования в области психологии. стр. 375–388. дои : 10.1007/978-1-4612-4308-3_27 . ISBN  978-0-387-94169-1 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 58dba348c7cb08e9d2146bf36aefe50d__1717550280
URL1:https://arc.ask3.ru/arc/aa/58/0d/58dba348c7cb08e9d2146bf36aefe50d.html
Заголовок, (Title) документа по адресу, URL1:
Base rate fallacy - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)