~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ F824AA362A2F6D04DDC1B6B132FF7C26__1707729540 ✰
Заголовок документа оригинал.:
✰ Test statistic - Wikipedia ✰
Заголовок документа перевод.:
✰ Статистика испытаний — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Test_statistic ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/f8/26/f824aa362a2f6d04ddc1b6b132ff7c26.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/f8/26/f824aa362a2f6d04ddc1b6b132ff7c26__translat.html ✰
Дата и время сохранения документа:
✰ 19.06.2024 11:56:23 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 12 February 2024, at 12:19 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Статистика испытаний — Википедия Jump to content

Статистика тестирования

Из Википедии, бесплатной энциклопедии
На изображении выше показана таблица с некоторыми наиболее распространенными статистическими данными тестов и соответствующими статистическими тестами или моделями.

Тестовая статистика — это величина, полученная из выборки для проверки статистических гипотез . [1] Проверка гипотезы обычно определяется с точки зрения статистики теста, рассматриваемой как числовая сводка набора данных, которая сводит данные к одному значению, которое можно использовать для проверки гипотезы. В общем, тестовая статистика выбирается или определяется таким образом, чтобы количественно оценить в пределах наблюдаемых данных поведение, которое отличало бы нулевую гипотезу от альтернативной гипотезы , если такая альтернатива предписана, или которое характеризовало бы нулевую гипотезу, если она существует. нет явно сформулированной альтернативной гипотезы.

Важным свойством тестовой статистики является то, что ее выборочное распределение при нулевой гипотезе должно быть вычислено точно или приблизительно, что позволяет p -значения вычислить . Тестовая статистика имеет некоторые из тех же качеств, что и описательная статистика , и многие статистические данные могут использоваться как в качестве тестовой статистики, так и в качестве описательной статистики. Однако тестовая статистика специально предназначена для использования в статистическом тестировании, тогда как основное качество описательной статистики заключается в ее легкости интерпретации. Некоторые информативные описательные статистические данные, такие как диапазон выборки , не являются хорошей тестовой статистикой, поскольку трудно определить распределение их выборки.

Две широко используемые тестовые статистики — это t-статистика и F-тест .

Пример [ править ]

Предположим, что задача состоит в том, чтобы проверить, является ли монета честной (т.е. имеет ли равная вероятность выпадения орла или решки). Если монету подбросить 100 раз и результаты записать, необработанные данные можно представить в виде последовательности из 100 орлов и решек. Если есть интерес к предельной только число T вероятности получения хвоста, необходимо записать из 100 бросков, в результате которых образовался хвост. Но T также можно использовать в качестве тестовой статистики одним из двух способов:

  • точное выборочное распределение T биномиальное при нулевой гипотезе представляет собой распределение с параметрами 0,5 и 100.
  • значение T можно сравнить с его ожидаемым значением при нулевой гипотезе 50, а поскольку размер выборки велик, нормальное распределение можно использовать в качестве приближения к распределению выборки либо для T , либо для пересмотренной тестовой статистики T — 50.

Используя одно из этих выборочных распределений, можно вычислить одностороннее или двустороннее значение p для нулевой гипотезы о том, что монета честная. Статистика теста в этом случае сводит набор из 100 чисел к одной числовой сводке, которую можно использовать для тестирования.

Общая статистика тестов [ править ]

Одновыборочные тесты подходят, когда выборку сравнивают с генеральной совокупностью на основе гипотезы. Характеристики популяции известны из теории или рассчитываются на основе численности населения.

Тесты с двумя выборками подходят для сравнения двух образцов, обычно экспериментальных и контрольных образцов из научно контролируемого эксперимента.

Парные тесты подходят для сравнения двух выборок, когда невозможно контролировать важные переменные. Вместо сравнения двух наборов элементы объединяются в пары между выборками, поэтому разница между членами становится выборкой. Обычно среднее значение разностей затем сравнивается с нулем. Типичный пример сценария, когда подходит тест парных различий, — это когда к одной группе испытуемых применяется что-то, и тест предназначен для проверки эффекта.

Z-тесты подходят для сравнения средних значений в строгих условиях относительно нормальности и известного стандартного отклонения.

подходит t -критерий для сравнения средних значений в смягченных условиях (предполагается меньшее значение).

Тесты пропорций аналогичны тестам средних значений (доля 50%).

Тесты хи-квадрат используют одни и те же вычисления и одно и то же распределение вероятностей для разных приложений:

  • Критерии хи-квадрат для дисперсии используются, чтобы определить, имеет ли нормальная популяция указанную дисперсию. Нулевая гипотеза заключается в том, что это так.
  • Критерии независимости хи-квадрат используются для определения того, связаны ли две переменные или являются независимыми. Переменные являются категориальными, а не числовыми. Его можно использовать, чтобы решить, ли леворукость коррелирует с ростом (или нет). Нулевая гипотеза заключается в том, что переменные независимы. Числа, использованные в расчетах, представляют собой наблюдаемую и ожидаемую частоту возникновения (из таблиц непредвиденных обстоятельств ).
  • Критерии соответствия хи-квадрат используются для определения адекватности кривых, соответствующих данным. Нулевая гипотеза заключается в том, что аппроксимация кривой адекватна. Обычно определяют форму кривой, чтобы минимизировать среднеквадратическую ошибку, поэтому целесообразно, чтобы при расчете согласия суммировались квадраты ошибок.

F-тесты (дисперсионный анализ, ANOVA) обычно используются при принятии решения о том, имеет ли смысл группировка данных по категориям. Если дисперсия результатов тестов левшей в классе намного меньше, чем дисперсия всего класса, то может быть полезно изучать левшей как группу. Нулевая гипотеза заключается в том, что две дисперсии одинаковы, поэтому предлагаемая группировка не имеет смысла.

В таблице ниже используемые символы определены в нижней части таблицы. Многие другие тесты можно найти в других статьях . Существуют доказательства того, что статистика испытаний соответствует действительности. [2]

Имя Формула Предположения или примечания
Однообразный -тест (Нормальная популяция или n большое) и σ известны.

( z — расстояние от среднего значения по отношению к стандартному отклонению среднего значения ). Для ненормальных распределений можно вычислить минимальную долю населения, которая попадает в пределы k стандартных отклонений для любого k (см.: неравенство Чебышева ).

Двухвыборочный z-тест Нормальная популяция и независимые наблюдения и σ 1 и σ 2 известны, где это ценность при нулевой гипотезе
Одновыборочный t -критерий
(Нормальное население или n большое) и неизвестный
Парный t -тест

(Нормальная совокупность различий или n большое) и неизвестный
для двух выборок Объединенный t- критерий , равные дисперсии


[3]

(Нормальные популяции или n 1 + n 2 > 40) и независимые наблюдения и σ 1 = σ 2 неизвестны.
-критерий для двух выборок Необъединенный t , неравные дисперсии ( Уэлча t -критерий )

[3]

(Нормальные популяции или n 1 + n 2 > 40) и независимые наблюдения и σ 1 ≠ σ 2 оба неизвестны.
Однопропорциональный z-тест н . p 0 > 10 и n (1 − p 0 ) > 10 , и это SRS (простая случайная выборка), см. примечания .
Двухпропорциональный z-критерий, объединенный для

n 1 p 1 > 5 и n 1 (1 − p 1 ) > 5 и n 2 p 2 > 5 и n 2 (1 − p 2 ) > 5 и независимые наблюдения, см. примечания .
Двухпропорциональный z-критерий, не объединенный для n 1 p 1 > 5 и n 1 (1 − p 1 ) > 5 и n 2 p 2 > 5 и n 2 (1 − p 2 ) > 5 и независимые наблюдения, см. примечания .
Критерий хи-квадрат на дисперсию df = n-1

• Нормальное население

Критерий хи-квадрат на соответствие df = k − 1 − # оцененных параметров , и один из них должен выполняться.

• Все ожидаемые значения не менее 5. [4]

• Все ожидаемые значения > 1 и не более 20 % ожидаемых значений меньше 5. [5]

Двухвыборочный F-критерий на равенство дисперсий Нормальные популяции
Организуйте так и отклонить H 0 для [6]
Регрессионный t -критерий Отклонить H 0 для [7]
*Вычтите 1 для перехвата; k термов содержат независимые переменные.
В общем, индекс 0 указывает на значение, взятое из нулевой гипотезы H 0 , которое следует использовать как можно чаще при построении ее тестовой статистики. ... Определения других символов:
  • = выборочная дисперсия
  • = стандартное отклонение выборки 1
  • = стандартное отклонение выборки 2
  • = t статистика
  • = степени свободы
  • = выборочное среднее разностей
  • = предполагаемая средняя разница в популяции
  • = стандартное отклонение разностей
  • = Статистика хи-квадрат
  • = доля выборки , если не указано иное
  • = предполагаемая доля населения
  • = пропорция 1
  • = пропорция 2
  • = предполагаемая разница в пропорциях
  • = минимум и
  • = F-статистика

См. также [ править ]

Ссылки [ править ]

  1. ^ Бергер, РЛ; Казелла, Г. (2001). Статистический вывод , Duxbury Press, второе издание (стр. 374)
  2. ^ Лавленд, Дженнифер Л. (2011). Математическое обоснование проверки вводных гипотез и разработка справочных материалов (магистр математических наук). Университет штата Юта . Проверено 30 апреля 2013 г. Аннотация: «Основное внимание было уделено подходу Неймана-Пирсона к проверке гипотез. За кратким историческим развитием подхода Неймана-Пирсона следуют математические доказательства каждого из тестов гипотез, описанных в справочных материалах». Доказательства не ссылаются на концепции, введенные Нейманом и Пирсоном, вместо этого они показывают, что традиционные тестовые статистики имеют приписываемые им распределения вероятностей, так что расчеты значимости предполагают, что эти распределения верны. Информация о диссертации также размещена на сайте mahnstats.com по состоянию на апрель 2013 года.
  3. ^ Перейти обратно: а б Справочник NIST: Двухвыборочный t - критерий для равных средних
  4. ^ Стил, RGD, и Торри, JH, Принципы и процедуры статистики с особым упором на биологические науки. , МакГроу Хилл , 1960, стр. 350.
  5. ^ Вайс, Нил А. (1999). Вводная статистика (5-е изд.). стр. 802 . ISBN  0-201-59877-9 .
  6. ^ Справочник NIST: F-тест на равенство двух стандартных отклонений (тестирование стандартных отклонений аналогично тестированию дисперсий)
  7. ^ Стил, RGD, и Торри, JH, Принципы и процедуры статистики с особым упором на биологические науки. , МакГроу Хилл , 1960, стр. 288.)
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: F824AA362A2F6D04DDC1B6B132FF7C26__1707729540
URL1:https://en.wikipedia.org/wiki/Test_statistic
Заголовок, (Title) документа по адресу, URL1:
Test statistic - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)