Jump to content

Статистика тестирования

(Перенаправлено из общей статистики тестов )
На изображении выше показана таблица с некоторыми наиболее распространенными статистическими данными тестов и соответствующими статистическими тестами или моделями.

Тестовая статистика — это величина, полученная из выборки для проверки статистических гипотез . [1] Проверка гипотезы обычно определяется с точки зрения статистики теста, рассматриваемой как числовая сводка набора данных, которая сводит данные к одному значению, которое можно использовать для проверки гипотезы. В общем, тестовая статистика выбирается или определяется таким образом, чтобы количественно оценить в пределах наблюдаемых данных поведение, которое отличало бы нулевую гипотезу от альтернативной гипотезы , если такая альтернатива предписана, или которое характеризовало бы нулевую гипотезу, если она существует. нет явно сформулированной альтернативной гипотезы.

Важным свойством тестовой статистики является то, что ее выборочное распределение при нулевой гипотезе должно быть вычислено точно или приблизительно, что позволяет p -значения вычислить . Тестовая статистика имеет некоторые из тех же качеств, что и описательная статистика , и многие статистические данные могут использоваться как в качестве тестовой статистики, так и в качестве описательной статистики. Однако тестовая статистика специально предназначена для использования в статистическом тестировании, тогда как основное качество описательной статистики состоит в том, что ее легко интерпретировать. Некоторые информативные описательные статистические данные, такие как диапазон выборки , не являются хорошей тестовой статистикой, поскольку трудно определить распределение их выборки.

Две широко используемые тестовые статистики — это t-статистика и F-статистика .

Предположим, что задача состоит в том, чтобы проверить, является ли монета честной (т.е. имеет ли равная вероятность выпадения орла или решки). Если монету подбросить 100 раз и результаты записать, необработанные данные можно представить в виде последовательности из 100 орлов и решек. Если вас интересует предельная вероятность получения хвоста, только число T необходимо записать из 100 бросков, в результате которых образовался хвост. Но T также можно использовать в качестве тестовой статистики одним из двух способов:

Используя одно из этих выборочных распределений, можно вычислить одностороннее или двустороннее значение p для нулевой гипотезы о том, что монета честная. Статистика теста в этом случае сводит набор из 100 чисел к одной числовой сводке, которую можно использовать для тестирования.

Общая статистика испытаний

[ редактировать ]

Одновыборочные тесты подходят, когда выборку сравнивают с генеральной совокупностью на основе гипотезы. Характеристики популяции известны из теории или рассчитываются на основе численности населения.

Тесты с двумя выборками подходят для сравнения двух образцов, обычно экспериментальных и контрольных образцов из научно контролируемого эксперимента.

Парные тесты подходят для сравнения двух выборок, когда невозможно контролировать важные переменные. Вместо сравнения двух наборов элементы объединяются в пары между выборками, поэтому разница между членами становится выборкой. Обычно среднее значение разностей затем сравнивается с нулем. Типичный пример сценария, когда подходит тест парных различий, — это когда к одной группе испытуемых применяется что-то, и тест предназначен для проверки эффекта.

Z-тесты подходят для сравнения средних значений в строгих условиях относительно нормальности и известного стандартного отклонения.

t - критерий подходит для сравнения средних значений в смягченных условиях (предполагается меньшее значение).

Тесты пропорций аналогичны тестам средних значений (доля 50%).

Тесты хи-квадрат используют одни и те же вычисления и одно и то же распределение вероятностей для разных приложений:

  • Критерии хи-квадрат для дисперсии используются, чтобы определить, имеет ли нормальная популяция указанную дисперсию. Нулевая гипотеза заключается в том, что это так.
  • Критерии независимости хи-квадрат используются для определения того, связаны ли две переменные или являются независимыми. Переменные являются категориальными, а не числовыми. Его можно использовать, чтобы решить, ли леворукость коррелирует с ростом (или нет). Нулевая гипотеза заключается в том, что переменные независимы. Числа, использованные в расчетах, представляют собой наблюдаемую и ожидаемую частоту возникновения (из таблиц непредвиденных обстоятельств ).
  • Критерии соответствия хи-квадрат используются для определения адекватности кривых, соответствующих данным. Нулевая гипотеза заключается в том, что аппроксимация кривой адекватна. Обычно определяют форму кривой, чтобы минимизировать среднеквадратическую ошибку, поэтому целесообразно, чтобы при расчете согласия суммировались квадраты ошибок.

F-тесты (дисперсионный анализ, ANOVA) обычно используются при принятии решения о том, имеет ли смысл группировка данных по категориям. Если дисперсия результатов тестов левшей в классе намного меньше, чем дисперсия всего класса, то может быть полезно изучать левшей как группу. Нулевая гипотеза заключается в том, что две дисперсии одинаковы, поэтому предлагаемая группировка не имеет смысла.

В таблице ниже используемые символы определены в нижней части таблицы. Многие другие тесты можно найти в других статьях . Существуют доказательства того, что статистика испытаний соответствует действительности. [2]

Имя Формула Предположения или примечания
Однообразный -тест (Нормальная популяция или n большое) и σ известны.

( z — расстояние от среднего значения по отношению к стандартному отклонению среднего значения ). Для ненормальных распределений можно вычислить минимальную долю населения, которая попадает в пределы k стандартных отклонений для любого k (см.: неравенство Чебышева ).

Двухвыборочный z-тест Нормальная популяция и независимые наблюдения и σ 1 и σ 2 известны, где это ценность при нулевой гипотезе
Одновыборочный t -критерий
(Нормальное население или n большое) и неизвестный
Парный t -тест

(Нормальная совокупность различий или n большое) и неизвестный
для двух выборок Объединенный t -критерий , равные дисперсии


[3]

(Нормальные популяции или n 1 + n 2 > 40) и независимые наблюдения и σ 1 = σ 2 неизвестны.
-критерий для двух выборок Необъединенный t , неравные дисперсии ( Уэлча t -критерий )

[3]

(Нормальные популяции или n 1 + n 2 > 40) и независимые наблюдения и σ 1 ≠ σ 2 неизвестны.
Однопропорциональный z-тест н . p 0 > 10 и n (1 − p 0 ) > 10 , и это SRS (простая случайная выборка), см. примечания .
Двухпропорциональный z-критерий, объединенный для

n 1 p 1 > 5 и n 1 (1 − p 1 ) > 5 и n 2 p 2 > 5 и n 2 (1 − p 2 ) > 5 и независимые наблюдения, см . примечания .
Двухпропорциональный z-критерий, не объединенный для n 1 p 1 > 5 и n 1 (1 − p 1 ) > 5 и n 2 p 2 > 5 и n 2 (1 − p 2 ) > 5 и независимые наблюдения, см . примечания .
Критерий хи-квадрат на дисперсию df = n-1

• Нормальное население

Критерий хи-квадрат на соответствие df = k − 1 − # оцененных параметров , и один из них должен выполняться.

• Все ожидаемые значения не менее 5. [4]

• Все ожидаемые значения > 1 и не более 20 % ожидаемых значений меньше 5. [5]

Двухвыборочный F-критерий на равенство дисперсий Нормальные популяции
Организуйте так и отклонить H 0 для [6]
Регрессионный t -критерий Отклонить H 0 для [7]
*Вычтите 1 для перехвата; k термов содержат независимые переменные.
В общем, индекс 0 указывает на значение, взятое из нулевой гипотезы H 0 , которое следует использовать как можно чаще при построении ее тестовой статистики. ... Определения других символов:
  • = выборочная дисперсия
  • = стандартное отклонение выборки 1
  • = стандартное отклонение выборки 2
  • = t статистика
  • = степени свободы
  • = выборочное среднее разностей
  • = предполагаемая средняя разница в популяции
  • = стандартное отклонение разностей
  • = Статистика хи-квадрат
  • = доля выборки , если не указано иное
  • = предполагаемая доля населения
  • = пропорция 1
  • = пропорция 2
  • = предполагаемая разница в пропорциях
  • = минимум и
  • = F-статистика

См. также

[ редактировать ]
  1. ^ Бергер, РЛ; Казелла, Г. (2001). Статистический вывод , Duxbury Press, второе издание (стр. 374)
  2. ^ Лавленд, Дженнифер Л. (2011). Математическое обоснование проверки вводных гипотез и разработка справочных материалов (магистр (математика)). Университет штата Юта . Проверено 30 апреля 2013 г. Аннотация: «Основное внимание было уделено подходу Неймана-Пирсона к проверке гипотез. За кратким историческим развитием подхода Неймана-Пирсона следуют математические доказательства каждого из тестов гипотез, описанных в справочном материале». Доказательства не ссылаются на концепции, введенные Нейманом и Пирсоном, вместо этого они показывают, что традиционные тестовые статистики имеют приписываемые им распределения вероятностей, так что расчеты значимости предполагают, что эти распределения верны. Информация о диссертации также размещена на сайте mahnstats.com по состоянию на апрель 2013 года.
  3. ^ Jump up to: а б Справочник NIST: Двухвыборочный t -критерий для равных средних
  4. ^ Стил, РГД, и Торри, Дж. Х., Принципы и процедуры статистики с особым упором на биологические науки. , МакГроу Хилл , 1960, стр. 350.
  5. ^ Вайс, Нил А. (1999). Вводная статистика (5-е изд.). стр. 802 . ISBN  0-201-59877-9 .
  6. ^ Справочник NIST: F-тест на равенство двух стандартных отклонений (тестирование стандартных отклонений аналогично тестированию дисперсий)
  7. ^ Стил, РГД, и Торри, Дж. Х., Принципы и процедуры статистики с особым упором на биологические науки. , МакГроу Хилл , 1960, стр. 288.)
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a39591c2b1df30b985dd707dae70ca56__1721587440
URL1:https://arc.ask3.ru/arc/aa/a3/56/a39591c2b1df30b985dd707dae70ca56.html
Заголовок, (Title) документа по адресу, URL1:
Test statistic - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)