Ошибки I и II рода.

При проверке статистических гипотез ошибка типа I или ложноположительный результат — это отклонение нулевой гипотезы, когда она на самом деле верна. Например, невиновный человек может быть осужден.

Ошибка второго рода , или ложноотрицательный результат , — это неспособность отвергнуть нулевую гипотезу, которая на самом деле ложна. Например: виновный может быть не осужден. ^[1]

Большая часть статистической теории вращается вокруг минимизации одной или обеих этих ошибок, хотя полное устранение любой из них невозможно, если результат не определяется известным, наблюдаемым причинным процессом. Выбрав низкое пороговое (пороговое) значение и изменив уровень альфа (α), можно повысить качество проверки гипотезы. ^{[ нужна ссылка ]} Знания об ошибках I и II рода широко используются в медицине , биометрии и информатике . ^{[ нужны разъяснения ]}

Интуитивно ошибки типа I можно рассматривать как ошибки совершенные (т. е. исследователь, к несчастью, приходит к выводу, что что-то является фактом). Например, рассмотрим исследование, в котором исследователи сравнивают лекарство с плацебо. Если состояние пациентов, получающих препарат, улучшается больше, чем пациентов, случайно принимавших плацебо, может показаться, что препарат эффективен, но на самом деле все наоборот.

Напротив, ошибки второго рода — это ошибки упущения . В приведенном выше примере, если пациенты, принимавшие препарат, не поправлялись быстрее, чем те, кто получал плацебо, и это была случайная случайность, это было бы ошибкой второго рода.

Определение

Статистическая информация

В теории статистических тестов понятие статистической ошибки является неотъемлемой частью проверки гипотез . Тест заключается в выборе двух конкурирующих утверждений, называемых нулевой гипотезой , обозначаемой H0 _, и альтернативной гипотезой , обозначаемой _H1 . Концептуально это похоже на решение суда. Нулевая гипотеза соответствует положению обвиняемого: точно так же, как он предполагается невиновным, пока его вина не будет доказана, так и нулевая гипотеза считается истинной до тех пор, пока данные не предоставят убедительные доказательства против нее. Альтернативная гипотеза соответствует позиции против ответчика. В частности, нулевая гипотеза также предполагает отсутствие различий или отсутствие ассоциации. Таким образом, нулевая гипотеза никогда не может заключаться в том, что существует различие или ассоциация.

Если результат теста соответствует действительности, то решение принято правильно. Однако если результат теста не соответствует действительности, значит, произошла ошибка. Есть две ситуации, в которых решение неверно. Нулевая гипотеза может быть верной, тогда как мы отвергаем H ₀ . С другой стороны, альтернативная гипотеза H ₁ может быть верной, тогда как H ₀ отвергается. Различают два типа ошибок: ошибка I рода и ошибка II рода. ^[2]

Ошибка I типа

Первый вид ошибок — это ошибочное отклонение нулевой гипотезы в результате процедуры тестирования. Ошибки такого рода называются ошибками I рода (ложноположительными) и иногда называются ошибками первого рода. Что касается примера с залом суда, ошибка I рода соответствует осуждению невиновного обвиняемого.

Ошибка второго рода

Второй вид ошибок — это ошибочная неспособность отвергнуть нулевую гипотезу в результате процедуры тестирования. Ошибки такого рода называются ошибками второго рода (ложноотрицательными), а также ошибками второго рода. На примере зала суда ошибка второго рода соответствует оправданию преступника. ^[2]

Частота ошибок кроссовера

Коэффициент перекрестных ошибок (CER) — это точка, в которой ошибки типа I и ошибки типа II равны. Система с более низким значением CER обеспечивает большую точность, чем система с более высоким значением CER.

Ложноположительный и ложноотрицательный

Что касается ложноположительных и ложноотрицательных результатов, положительный результат соответствует отклонению нулевой гипотезы, а отрицательный результат соответствует неспособности отвергнуть нулевую гипотезу; «ложь» означает, что сделанный вывод неверен. Таким образом, ошибка типа I эквивалентна ложноположительному результату, а ошибка типа II эквивалентна ложноотрицательному результату.

Таблица типов ошибок

Табличные отношения между истинностью/ложностью нулевой гипотезы и результатами теста: ^[3]


Таблица типов ошибок		Нулевая гипотеза ( H ₀ )
Таблица типов ошибок		Истинный	ЛОЖЬ
Решение около нуля гипотеза ( Ч ₀ )	Не удалось отклонить	Правильный вывод (истинно отрицательный) (вероятность = 1− α )	Ошибка второго рода (ложноотрицательный) (вероятность = β )
Решение около нуля гипотеза ( Ч ₀ )	Отклонять	Ошибка I типа (ложноположительный) (вероятность = α )	Правильный вывод (истинно положительный) (вероятность = 1− β )

Частота ошибок

Идеальный тест должен иметь ноль ложноположительных и ноль ложноотрицательных результатов. Однако статистические методы носят вероятностный характер, и нельзя с уверенностью знать, верны ли статистические выводы. Всякий раз, когда есть неопределенность, есть вероятность допустить ошибку. Учитывая это, все проверки статистических гипотез имеют вероятность допустить ошибки типа I и типа II. ^[4]

Частота ошибок типа I — это вероятность отклонения нулевой гипотезы при условии, что она верна. Тест предназначен для того, чтобы поддерживать частоту ошибок типа I ниже заранее заданной границы, называемой уровнем значимости, обычно обозначаемым греческой буквой α (альфа) и также называемым уровнем альфа. Обычно уровень значимости устанавливается равным 0,05 (5%), что означает, что допустима вероятность ошибочного отклонения истинной нулевой гипотезы в 5%. ^[5]
Частота ошибки II рода обозначается греческой буквой β (бета) и связана с мощностью теста , равной 1−β. ^{[ нужна ссылка ]}

Эти два типа коэффициентов ошибок сопоставляются друг с другом: для любого данного набора выборок усилия по уменьшению одного типа ошибок обычно приводят к увеличению другого типа ошибок. ^{[ нужна ссылка ]}

Качество проверки гипотез

Та же идея может быть выражена в терминах вероятности получения правильных результатов и, следовательно, использована для минимизации частоты ошибок и повышения качества проверки гипотез. Чтобы снизить вероятность совершения ошибки типа I, можно просто и эффективно сделать значение альфа более строгим. Чтобы уменьшить вероятность совершения ошибки второго рода, которая тесно связана с мощностью анализа, увеличение размера выборки теста или снижение альфа-уровня могут повысить мощность анализа. ^{[ нужна ссылка ]} Тестовая статистика является устойчивой, если контролируется частота ошибок типа I.

Варьируя различные пороговые (пороговые) значения, можно также использовать, чтобы сделать тест более специфичным или более чувствительным, что, в свою очередь, повышает качество теста. Например, представьте себе медицинский тест, в ходе которого экспериментатор может измерить концентрацию определенного белка в образце крови. Экспериментатор мог отрегулировать порог (черная вертикальная линия на рисунке), и у людей будет диагностировано заболевание, если какое-либо число будет обнаружено выше этого определенного порога. Судя по изображению, изменение порога приведет к изменению количества ложноположительных и ложноотрицательных результатов, что соответствует движению кривой. ^{[ нужна ссылка ]}

Пример

Поскольку в реальном эксперименте невозможно избежать всех ошибок типа I и II, важно учитывать величину риска, на который человек готов пойти, чтобы ошибочно отвергнуть H ₀ или принять H ₀ . Решением этого вопроса было бы сообщить значение p или уровень значимости α статистики. Например, если значение p результата статистики теста оценивается в 0,0596, то существует вероятность 5,96%, что мы ошибочно отвергнем H ₀ . Или, если мы скажем, что статистика выполняется на уровне α, например 0,05, тогда мы позволяем ошибочно отклонить H ₀ на уровне 5%. Уровень значимости α, равный 0,05, является относительно распространенным, но не существует общего правила, подходящего для всех сценариев.

Измерение скорости автомобиля

Ограничение скорости на автостраде в США составляет 120 километров в час (75 миль в час). Установлено устройство для измерения скорости проезжающих транспортных средств. Предположим, что устройство проведет три измерения скорости проезжающего автомобиля, записывая в виде случайной выборки X ₁ , X ₂ , X ₃ . ГИБДД будет штрафовать или не штрафовать водителей в зависимости от средней скорости ${\bar {X}}$ . То есть тестовая статистика

$T={\frac {X_{1}+X_{2}+X_{3}}{3}}={\bar {X}}$

Кроме того, мы предполагаем, что измерения X ₁ , X ₂ , X ₃ моделируются как нормальное распределение N(μ,2). Тогда T должно следовать за N(μ,2/ ${\sqrt {3}}$ ), а параметр μ представляет истинную скорость проезжающего автомобиля. В этом эксперименте нулевая гипотеза H ₀ и альтернативная гипотеза H ₁ должны быть проверены.

H ₀ : µ=120 против H ₁ : µ>120.

Если мы выполним статистический уровень при α = 0,05, то критическое значение для решения необходимо вычислить c.

$P\left(Z\geqslant {\frac {c-120}{\frac {2}{\sqrt {3}}}}\right)=0.05$

Согласно правилу замены единиц для нормального распределения. Обращаясь к Z-таблице , мы можем получить

${\frac {c-120}{\frac {2}{\sqrt {3}}}}=1.645\Rightarrow c=121.9$

Вот критическая область. То есть, если зафиксированная скорость автомобиля превысит критическое значение 121,9, водителя оштрафуют. Тем не менее, 5% водителей по-прежнему оштрафованы ошибочно, поскольку зарегистрированная средняя скорость превышает 121,9, а реальная скорость не превышает 120, что, как мы говорим, является ошибкой I рода.

Ошибка II рода соответствует случаю, когда истинная скорость транспортного средства превышает 120 километров в час, но водитель не оштрафован. Например, если истинная скорость транспортного средства µ=125, вероятность того, что водителя не оштрафуют, можно рассчитать как

$P=(T<121.9|\mu =125)=P\left({\frac {T-125}{\frac {2}{\sqrt {3}}}}<{\frac {121.9-125}{\frac {2}{\sqrt {3}}}}\right)=\phi (-2.68)=0.0036$

то есть, если истинная скорость транспортного средства равна 125, то водитель имеет вероятность 0,36% избежать штрафа при выполнении статистики на уровне α=0,05, поскольку зафиксированная средняя скорость ниже 121,9. Если истинная скорость будет ближе к 121,9, чем к 125, то вероятность избежать штрафа также будет выше.

Следует также учитывать компромисс между ошибками типа I и ошибками типа II. То есть в этом случае, если сотрудники ГИБДД не хотят ложно штрафовать невиновных водителей, уровень α можно установить на меньшее значение, например 0,01. Однако в этом случае больше водителей, чья истинная скорость превышает 120 километров в час, например 125, с большей вероятностью избегут штрафа.

Этимология

В 1928 году Ежи Нейман (1894–1981) и Эгон Пирсон (1895–1980), оба выдающиеся статистики, обсудили проблемы, связанные с «решением о том, можно ли считать конкретную выборку случайно выбранной из определенной популяции». ": ^[6] и, как заметила Флоренс Найтингейл Дэвид , «необходимо помнить, что прилагательное «случайный» [в термине «случайная выборка»] должно применяться к методу составления выборки, а не к самой выборке». ^[7]

Они выявили «два источника ошибок», а именно:

ошибка отклонения гипотезы, которую не следовало отвергать, и
ошибка неспособности отвергнуть гипотезу, которая должна была быть отвергнута.

В 1930 году они подробно остановились на этих двух источниках ошибок, отметив, что

при проверке гипотез необходимо учитывать два соображения: мы должны быть в состоянии снизить вероятность отклонения истинной гипотезы до желаемого значения; тест должен быть разработан таким образом, чтобы он отвергал проверяемую гипотезу, когда она, вероятно, окажется ложной.

В 1933 году они заметили, что эти «проблемы редко представляются в такой форме, чтобы мы могли с уверенностью отличить истинную гипотезу от ложной». Они также отметили, что, принимая решение о том, стоит ли не отвергать или отклонять конкретную гипотезу среди «набора альтернативных гипотез», H ₁ , H ₂ ..., легко допустить ошибку,

[и] эти ошибки будут двух видов:
мы отвергаем H ₀ [т. е. гипотезу, которую необходимо проверить], когда она верна, ^[8]
мы не можем отвергнуть H0, _когда некоторая альтернативная гипотеза HA _или H1 _. верна (Для альтернативы существуют различные обозначения).

Во всех статьях, написанных в соавторстве Нейманом и Пирсоном, выражение H ₀ всегда означает «гипотезу, подлежащую проверке».

В той же статье они называют эти два источника ошибок ошибками типа I и ошибками типа II соответственно. ^[9]

Связанные термины

Нулевая гипотеза

Стандартной практикой для статистиков является проведение тестов с целью определить, может ли быть подтверждена «спекулятивная гипотеза », касающаяся наблюдаемых явлений мира (или его обитателей). Результаты такого тестирования определяют, согласуется ли конкретный набор результатов разумно (или не согласуется) с предполагаемой гипотезой.

На основании того, что согласно статистическому соглашению всегда предполагается, что предполагаемая гипотеза неверна, и так называемая «нулевая гипотеза», что наблюдаемые явления просто происходят случайно (и что, как следствие, предполагаемый агент не имеет эффект) – тест определит, верна или неверна эта гипотеза. Вот почему проверяемую гипотезу часто называют нулевой гипотезой (вероятнее всего, придуманной Фишером (1935, стр. 19)), поскольку именно эта гипотеза должна быть либо аннулирована, либо не аннулирована тестом. Когда нулевая гипотеза аннулируется, можно сделать вывод, что данные подтверждают «альтернативную гипотезу» (которая является исходной предполагаемой).

Последовательное применение статистиками соглашения Неймана и Пирсона о представлении «гипотезы, подлежащей проверке» (или «гипотезы, подлежащей аннулированию») с помощью выражения H _0, привело к обстоятельствам, когда многие понимают термин «нулевая гипотеза» как означающий «нулевая гипотеза» – утверждение, что рассматриваемые результаты возникли случайно. Это не обязательно так – ключевым ограничением, согласно Фишеру (1966), является то, что «нулевая гипотеза должна быть точной, то есть свободной от неопределенности и двусмысленности, поскольку она должна служить основой «проблемы распределения». решением которого является критерий значимости». ^[10] Как следствие этого, в экспериментальной науке нулевая гипотеза обычно представляет собой утверждение о том, что конкретное лечение не имеет эффекта; в науке наблюдений это то, что нет разницы между значением конкретной измеряемой переменной и значением экспериментального предсказания. ^{[ нужна ссылка ]}

Статистическая значимость

Если вероятность получения столь же экстремального результата, как и полученный, при условии, что нулевая гипотеза верна, ниже заранее заданной вероятности отсечения (например, 5%), то результат считается статистически значимым. и нулевая гипотеза отвергается.

Британский статистик сэр Рональд Эйлмер Фишер (1890–1962) подчеркивал, что нулевая гипотеза

никогда не доказывается и не устанавливается, но, возможно, опровергается в ходе экспериментов. Можно сказать, что каждый эксперимент существует только для того, чтобы дать фактам шанс опровергнуть нулевую гипотезу.
- Фишер, 1935, стр.19.

Домены приложений

Лекарство

В медицинской практике различия между применением скрининга и тестирования значительны.

Медицинский осмотр

Скрининг включает относительно дешевые тесты, которые проводятся среди больших групп населения, ни у одного из которых нет клинических признаков заболевания (например, мазки Папаниколау ).

Тестирование включает в себя гораздо более дорогие, часто инвазивные процедуры, которые проводятся только тем, у кого проявляются некоторые клинические признаки заболевания, и чаще всего применяются для подтверждения предполагаемого диагноза.

Например, большинство штатов США требуют, чтобы новорожденные проходили обследование на наличие фенилкетонурии и гипотиреоза , а также других врожденных заболеваний .

Гипотеза: «У новорожденных наблюдаются фенилкетонурия и гипотиреоз».
Нулевая гипотеза (Н ₀ ): «У новорожденных нет фенилкетонурии и гипотиреоза».
Ошибка I рода (ложноположительный): Действительно, у новорожденных нет фенилкетонурии и гипотиреоза, но мы считаем, что у них есть нарушения по данным.
Ошибка II типа (ложноотрицательный): Действительно, у новорожденных есть фенилкетонурия и гипотиреоз, но мы считаем, что по данным у них нет нарушений.

Несмотря на высокий уровень ложноположительных результатов, скрининговые тесты считаются ценными, поскольку они значительно повышают вероятность обнаружения этих расстройств на гораздо более ранней стадии.

Простые анализы крови, используемые для проверки возможных доноров крови на ВИЧ и гепатит, имеют значительный процент ложноположительных результатов; однако врачи используют гораздо более дорогие и гораздо более точные тесты, чтобы определить, действительно ли человек заражен каким-либо из этих вирусов.

Вероятно, наиболее широко обсуждаемые ложноположительные результаты при медицинском скрининге происходят при маммографии для скрининга рака молочной железы . Уровень ложноположительных результатов маммографии в США составляет до 15%, это самый высокий показатель в мире. Одним из последствий высокого уровня ложноположительных результатов в США является то, что в течение любого 10-летнего периода половина американских женщин, прошедших скрининг, получают ложноположительные результаты маммограммы. Ложноположительные маммограммы обходятся дорого: в США ежегодно тратится более 100 миллионов долларов на последующее тестирование и лечение. Они также вызывают у женщин ненужное беспокойство. В результате высокого уровня ложноположительных результатов в США около 90–95% женщин, получивших положительный результат маммограммы, не страдают этим заболеванием. Самая низкая ставка в мире – в Нидерландах – 1%. Самые низкие показатели обычно наблюдаются в Северной Европе, где маммографические пленки считываются дважды и установлен высокий порог для дополнительного тестирования (высокий порог снижает эффективность теста).

Идеальный популяционный скрининговый тест должен быть дешевым, простым в проведении и, если возможно, не давать ложноотрицательных результатов. Такие тесты обычно дают больше ложноположительных результатов, которые впоследствии можно устранить с помощью более сложного (и дорогостоящего) тестирования.

Медицинское тестирование

Ложноотрицательные и ложноположительные результаты являются серьезными проблемами в медицинском тестировании .

Гипотеза: «У пациентов имеется специфическое заболевание».
Нулевая гипотеза (H ₀ ): «У пациентов нет конкретного заболевания».
Ошибка типа I (ложноположительный результат): на самом деле у пациентов нет конкретного заболевания, но врач считает, что пациент болен, согласно отчетам об испытаниях.
Ошибка II типа (ложноотрицательный результат): на самом деле болезнь действительно присутствует, но отчеты об испытаниях дают ложно обнадеживающее сообщение пациентам и врачам об отсутствии болезни.

Ложноположительные результаты также могут привести к серьезным и парадоксальным проблемам, когда искомое заболевание встречается редко, как, например, при скрининге. Если тест имеет уровень ложноположительных результатов один на десять тысяч, но только один из миллиона образцов (или людей) является истинно положительным, большинство положительных результатов, обнаруженных этим тестом, будут ложными. Вероятность того, что наблюдаемый положительный результат является ложноположительным, можно рассчитать с помощью теоремы Байеса .

Ложноотрицательные результаты создают серьезные и парадоксальные проблемы, особенно если искомое состояние является распространенным. Если тест с уровнем ложноотрицательных результатов всего 10% используется для тестирования популяции с истинной частотой встречаемости 70%, многие из отрицательных результатов, обнаруженных с помощью теста, будут ложными.

Иногда это приводит к неправильному или неадекватному лечению как самого пациента, так и его заболевания. Типичным примером является использование сердечных нагрузочных тестов для выявления коронарного атеросклероза, хотя известно, что сердечные нагрузочные тесты выявляют только ограничения в коронарной артерии кровотока из-за выраженного стеноза .

Биометрия

Биометрическое сопоставление, например, для распознавания отпечатков пальцев , распознавания лиц или распознавания радужной оболочки глаза , подвержено ошибкам типа I и типа II.

Гипотеза: «Введенные данные не идентифицируют кого-либо из искомого списка людей».
Нулевая гипотеза: «Введенные данные действительно идентифицируют кого-то в списке людей, которые были найдены».
Ошибка типа I (коэффициент ложных отклонений): на самом деле это человек из списка поиска, но система приходит к выводу, что этот человек не соответствует данным.
Ошибка типа II (коэффициент ложного совпадения): на самом деле этот человек не входит в список поиска, но система приходит к выводу, что это тот человек, которого мы ищем в соответствии с данными.

Вероятность ошибок типа I называется «коэффициентом ложного отклонения» (FRR) или коэффициентом ложного несоответствия (FNMR), а вероятность ошибок типа II называется «коэффициентом ложного принятия» (FAR) или коэффициентом ложного совпадения ( ФМР).

Если система спроектирована таким образом, чтобы редко выявлять подозреваемых, то вероятность ошибок типа II можно назвать « коэффициентом ложных тревог ». С другой стороны, если система используется для проверки (а приемка является нормой), то FAR является мерой безопасности системы, а FRR измеряет уровень неудобства для пользователя.

Проверка безопасности

Ложные срабатывания регулярно обнаруживаются каждый день при досмотре служб безопасности в аэропортах , который в конечном итоге представляет собой системы визуального досмотра . Установленная охранная сигнализация предназначена для предотвращения проноса оружия на самолеты; тем не менее, они часто настроены на такую высокую чувствительность, что по несколько раз в день сигнализируют о мелких предметах, таких как ключи, пряжки ремней, мелочь, мобильные телефоны и кнопки в обуви.

Гипотеза: «Предмет является оружием».
Нулевая гипотеза: «Предмет не является оружием».
Ошибка типа I (ложное срабатывание): На самом деле предмет не является оружием, но система все равно подает сигнал тревоги.
Ошибка II рода (ложноотрицательный результат). На самом деле предмет является оружием, но система в это время хранит молчание.

Таким образом, соотношение ложных срабатываний (идентификация невиновного путешественника как террориста) к истинным срабатываниям (обнаружение потенциального террориста) очень велико; и поскольку почти каждый сигнал тревоги является ложноположительным, прогностическая ценность положительного результата этих скрининговых тестов очень низка.

Относительная цена ложных результатов определяет вероятность того, что создатели тестов допустят возникновение этих событий. Поскольку стоимость ложноотрицательного результата в этом сценарии чрезвычайно высока (необнаружение бомбы, принесенной в самолет, может привести к сотням смертей), в то время как стоимость ложноположительного результата относительно низка (достаточно простая дальнейшая проверка), наиболее подходящим вариантом является тест с низкой статистической специфичностью, но высокой статистической чувствительностью (который допускает высокий уровень ложноположительных результатов в обмен на минимальный ложноотрицательный результат).

Компьютеры

Понятия ложноположительных и ложноотрицательных результатов широко распространены в сфере компьютеров и компьютерных приложений, включая компьютерную безопасность , фильтрацию спама , вредоносное ПО , оптическое распознавание символов и многие другие.

Например, в случае фильтрации спама:

Гипотеза: «Сообщение является спамом».
Нулевая гипотеза: «Сообщение не является спамом».
Ошибка типа I (ложное срабатывание): методы фильтрации или блокировки спама ошибочно классифицируют законное сообщение электронной почты как спам и, как следствие, препятствуют его доставке.
Ошибка типа II (ложноотрицательный результат): спам-сообщение не определяется как спам, но классифицируется как не-спам.

Хотя большинство тактик защиты от спама позволяют блокировать или фильтровать большой процент нежелательных писем, сделать это без значительных ложноположительных результатов — гораздо более сложная задача. Низкое количество ложных срабатываний является показателем эффективности фильтрации спама.

См. также

Ссылки

^ «Ошибка I рода и ошибка II рода» . Explorable.com . Проверено 14 декабря 2019 г.
^ Jump up to: ^а ^б Современное введение в вероятность и статистику: понимание почему и как . Деккинг, Мишель (1946 г.р.). Лондон: Спрингер. 2005. ISBN 978-1-85233-896-1 . OCLC 262680588 . {{cite book}}: CS1 maint: другие ( ссылка )
^ Шескин, Дэвид (2004). Справочник по параметрическим и непараметрическим статистическим процедурам . ЦРК Пресс. п. 54 . ISBN 1584884401 .
^ Рохатги, ВК; Салех, АК Мд Эхсанес (2015). Введение в теорию вероятностей и математическую статистику . Ряд Уайли по вероятности и статистике (3-е изд.). John Wiley & Sons, Inc. Хобокен, Нью-Джерси: ISBN 978-1-118-79963-5 .
^ Линденмайер, Дэвид. (2005). Практическая биология сохранения . Бургман, Марк А. Коллингвуд, Виктория: CSIRO Pub. ISBN 0-643-09310-9 . OCLC 65216357 .
^ Нейман, Дж.; Пирсон, ES (1928). «Об использовании и интерпретации некоторых критериев тестирования для целей статистических выводов, часть I». Биометрика . 20А (1–2): 175–240. дои : 10.1093/biomet/20a.1-2.175 . ISSN 0006-3444 .
^ CIKF (июль 1951 г.). «Теория вероятностей для статистических методов. Ф. Н. Дэвид. [Стр. ix + 230. Издательство Кембриджского университета. 1949. Цена 155.]». Журнал актуарного общества Staple Inn . 10 (3): 243–244. дои : 10.1017/s0020269x00004564 . ISSN 0020-269X .
^ Нижний индекс в выражении H ₀ равен нулю (указывает на ноль ), а не является «O» (указывает на исходное значение ).
^ Нейман, Дж.; Пирсон, ES (30 октября 1933 г.). «Проверка статистических гипотез в отношении априорных вероятностей». Математические труды Кембриджского философского общества . 29 (4): 492–510. Бибкод : 1933PCPS...29..492N . дои : 10.1017/s030500410001152x . ISSN 0305-0041 . S2CID 119855116 .
^ Фишер, Р.А. (1966). Планирование экспериментов (8-е изд.). Эдинбург: Хафнер.

Библиография

Бетц, М.А. и Габриэль, К.Р. , «Ошибки типа IV и анализ простых эффектов», Журнал образовательной статистики , том 3, № 2 (лето 1978 г.), стр. 121–144.
Дэвид, Ф.Н., «Степенная функция для проверки случайности в последовательности альтернатив», Biometrika , Vol.34, Nos.3/4, (декабрь 1947 г.), стр. 335–339.
Фишер, Р.А., План экспериментов , Оливер и Бойд (Эдинбург), 1935.
Гэмбрилл, В., «Ложноположительные результаты тестов на заболевания новорожденных беспокоят родителей», День здоровья (5 июня 2006 г.). [1] Архивировано 17 мая 2018 г. в Wayback Machine.
Кайзер, Х.Ф., «Направленные статистические решения», Psychoological Review , Vol.67, No.3, (май 1960 г.), стр. 160–167.
Кимбалл, А.В., «Ошибки третьего рода в статистическом консультировании», Журнал Американской статистической ассоциации , том 52, № 278 (июнь 1957 г.), стр. 133–142.
Любин А., «Интерпретация значимого взаимодействия», Образовательные и психологические измерения , Том 21, № 4 (зима 1961 г.), стр. 807–817.
Мараскуило Л.А. и Левин Дж.Р., «Соответствующие апостериорные сравнения взаимодействия и вложенных гипотез в анализе дисперсионных планов: устранение ошибок типа IV», American Educational Research Journal , Vol.7., No.3, (май 1970 г.) ), стр. 397–421.
Митрофф И.И. и Физерингем Т.Р., «О решении системных проблем и ошибках третьего рода», Поведенческая наука , Том 19, № 6 (ноябрь 1974 г.), стр. 383–393.
Мостеллер, Ф., « Тест проскальзывания k -выборки для экстремальной популяции», Анналы математической статистики , том 19, № 1 (март 1948 г.), стр. 58–65.
Моултон, RT, «Сетевая безопасность», Datamation , Том 29, № 7 (июль 1983 г.), стр. 121–127.
Райффа, Х., Анализ решений: вводные лекции по выбору в условиях неопределенности , Аддисон-Уэсли, (Рединг), 1968.

Внешние ссылки

Предвзятость и путаница – презентация Найджела Панета, Высшая школа общественного здравоохранения, Питтсбургский университет

[1] «Ошибка I рода и ошибка II рода» . Explorable.com . Проверено 14 декабря 2019 г.

[modern_intro-2] Jump up to: ^а ^б Современное введение в вероятность и статистику: понимание почему и как . Деккинг, Мишель (1946 г.р.). Лондон: Спрингер. 2005. ISBN 978-1-85233-896-1 . OCLC 262680588 . {{cite book}}: CS1 maint: другие ( ссылка )

[Sheskin-3] Шескин, Дэвид (2004). Справочник по параметрическим и непараметрическим статистическим процедурам . ЦРК Пресс. п. 54 . ISBN 1584884401 .

[4] Рохатги, ВК; Салех, АК Мд Эхсанес (2015). Введение в теорию вероятностей и математическую статистику . Ряд Уайли по вероятности и статистике (3-е изд.). John Wiley & Sons, Inc. Хобокен, Нью-Джерси: ISBN 978-1-118-79963-5 .

[5] Линденмайер, Дэвид. (2005). Практическая биология сохранения . Бургман, Марк А. Коллингвуд, Виктория: CSIRO Pub. ISBN 0-643-09310-9 . OCLC 65216357 .

[6] Нейман, Дж.; Пирсон, ES (1928). «Об использовании и интерпретации некоторых критериев тестирования для целей статистических выводов, часть I». Биометрика . 20А (1–2): 175–240. дои : 10.1093/biomet/20a.1-2.175 . ISSN 0006-3444 .

[7] CIKF (июль 1951 г.). «Теория вероятностей для статистических методов. Ф. Н. Дэвид. [Стр. ix + 230. Издательство Кембриджского университета. 1949. Цена 155.]». Журнал актуарного общества Staple Inn . 10 (3): 243–244. дои : 10.1017/s0020269x00004564 . ISSN 0020-269X .

[8] Нижний индекс в выражении H ₀ равен нулю (указывает на ноль ), а не является «O» (указывает на исходное значение ).

[9] Нейман, Дж.; Пирсон, ES (30 октября 1933 г.). «Проверка статистических гипотез в отношении априорных вероятностей». Математические труды Кембриджского философского общества . 29 (4): 492–510. Бибкод : 1933PCPS...29..492N . дои : 10.1017/s030500410001152x . ISSN 0305-0041 . S2CID 119855116 .

[10] Фишер, Р.А. (1966). Планирование экспериментов (8-е изд.). Эдинбург: Хафнер.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]