т -статистика
Эта статья нуждается в дополнительных цитатах для проверки . ( апрель 2020 г. ) |
В статистике t — -статистика это отношение разницы оценочного значения числа от его предполагаемого значения к его стандартной ошибке . Он используется при проверке гипотез с помощью Стьюдента t -критерия . T - статистика используется в t -тесте, чтобы определить, следует ли поддержать или отвергнуть нулевую гипотезу. Он очень похож на z-показатель , но с той разницей, что t -статистика используется, когда размер выборки небольшой или стандартное отклонение генеральной совокупности неизвестно. Например, t -статистика используется при оценке среднего значения генеральной совокупности на основе распределения выборочного выборочных средних, если стандартное отклонение генеральной совокупности неизвестно. Оно также используется вместе со значением p при проверке гипотез, где значение p говорит нам, каковы шансы на то, что результаты будут получены.
Определение и особенности
[ редактировать ]Позволять быть оценкой параметра β в некоторой статистической модели . Тогда t -статистикой для этого параметра является любая величина вида
где β 0 — неслучайная известная константа, которая может совпадать или не совпадать с фактическим значением неизвестного параметра β , и стандартная ошибка оценщика для б .
По умолчанию статистические пакеты сообщают t -статистику с β 0 = 0 (эта t -статистика используется для проверки значимости соответствующего регрессора). Однако, когда t -статистика необходима для проверки гипотезы вида H 0 : β = β 0 ненулевое β 0 , тогда можно использовать .
Если является обычной оценкой методом наименьших квадратов в классической модели линейной регрессии (то есть с нормально распределенными и гомоскедастическими членами ошибок), и если истинное значение параметра β равно β 0 , то выборочное распределение t - статистики равно Стьюдента — t -распределение с ( n − k ) степенями свободы, где n — количество наблюдений, а k количество регрессоров (включая точку пересечения) [ нужна ссылка ] .
В большинстве моделей оценщик согласована и для β распределяется асимптотически нормально . Если истинное значение параметра β равно β 0 , а величина правильно оценивает асимптотическую дисперсию этой оценки, то t -статистика будет асимптотически иметь стандартное нормальное распределение.
В некоторых моделях распределение t -статистики отличается от нормального распределения даже асимптотически. Например, когда временной ряд с единичным корнем регрессируется в расширенном тесте Дики-Фуллера -статистика теста , t будет асимптотически иметь одно из распределений Дики-Фуллера (в зависимости от настроек теста).
Использовать
[ редактировать ]Чаще всего t- статистика используется в Стьюдента t -тестах , форме проверки статистических гипотез , а также при вычислении определенных доверительных интервалов .
Ключевым свойством t- статистики является то, что она является ключевой величиной : хотя она и определяется в терминах выборочного среднего, ее выборочное распределение не зависит от параметров совокупности, и поэтому ее можно использовать независимо от того, какими они могут быть.
также можно разделить Остаток выборки на стандартное отклонение :
Чтобы вычислить оценку количества стандартных отклонений, данная выборка берется из среднего значения, как выборочная версия z -показателя , z-показателя, требующего параметров совокупности.
Прогноз
[ редактировать ]Учитывая нормальное распределение с неизвестным средним значением и дисперсией, t -статистика будущего наблюдения после того, как было сделано n наблюдений, является вспомогательной статистикой – основной величиной (не зависит от значений µ и σ 2 ), то есть статистика (рассчитанная на основе наблюдений). Это позволяет вычислить частотный интервал прогнозирования (доверительный интервал прогнозирования ) с помощью следующего t-распределения:
Решение для дает прогнозируемое распределение
из которых можно вычислить доверительные интервалы прогнозирования – учитывая вероятность p , можно вычислить такие интервалы, что в 100 p % случаев следующее наблюдение попадет в этот интервал.
История
[ редактировать ]Термин « t -статистика» является сокращением от «статистика проверки гипотез». [1] [ нужна ссылка ] В статистике t-распределение было впервые получено как апостериорное распределение в 1876 году Гельмертом. [2] [3] [4] и Люрот . [5] [6] [7] T-распределение также появилось в более общей форме как распределение Пирсона типа IV в статье Карла Пирсона 1895 года. [8] Однако Т-распределение, также известное как Т-распределение Стьюдента, получило свое название от Уильяма Сили Госсета , который первым опубликовал результат на английском языке в своей статье 1908 года под названием «Вероятная ошибка среднего значения» (в журнале «Биометрика »), используя свой псевдоним». Студент" [9] [10] потому что его работодатель предпочитал, чтобы их сотрудники использовали псевдонимы при публикации научных статей вместо своего настоящего имени, поэтому он использовал имя «Студент», чтобы скрыть свою личность. [11] Госсет работал на пивоварне Guinness Brewery в Дублине , Ирландия , и интересовался проблемами небольших образцов – например, химическими свойствами ячменя, где размеры выборок могли составлять всего 3. Отсюда и вторая версия этимологии термина «Студент». заключается в том, что компания Guinness не хотела, чтобы ее конкуренты знали, что они используют t-тест для определения качества сырья. Хотя термин «Студент» был написан в честь Уильяма Госсета, на самом деле именно благодаря работе Рональда Фишера это распределение стало широко известно как «распределение Стьюдента». [12] [13] и « Т-критерий Стьюдента »
Связанные понятия
[ редактировать ]- z -показатель (стандартизация) : если параметры совокупности известны, то вместо вычисления t-статистики можно вычислить z-показатель; аналогично, вместо использования t -теста используется z -тест . Это редкость за пределами стандартизированного тестирования .
- Стьюдентизированный остаток : в регрессионном анализе стандартные ошибки оценок в разных точках данных различаются (сравните среднюю и конечную точки простой линейной регрессии ), и, таким образом, необходимо разделить разные остатки на разные оценки ошибки, давая то, что называется стьюденизированные остатки .
См. также
[ редактировать ]- F -тест
- т 2 -статистика
- Т-распределение Стьюдента
- Т-критерий Стьюдента
- Проверка гипотез
- Распределения сложенной t и половинной формы
- Распределение хи-квадрат
Ссылки
[ редактировать ]- ^ Микробиом в здоровье и болезни . Академическая пресса. 29 мая 2020 г. с. 397. ИСБН 978-0-12-820001-8 .
- ^ Сабо, Иштван (2003), «Системы, состоящие из конечного числа твердых тел», Введение в техническую механику , Springer Berlin Heidelberg, стр. 196–199, doi : 10.1007/978-3-642-61925-0_16 , ISBN 978-3-540-13293-6
- ^ Шливич, Б. (октябрь 1937 г.). «Исследования анастомотического канала между чревной и верхней брыжеечной артериями и связанные с этим вопросы». Журнал анатомии и истории развития . 107 (6): 709–737. дои : 10.1007/bf02118337 . ISSN 0340-2061 . S2CID 27311567 .
- ^ Гельмерт (1876 г.). «Точность формулы Петерса для расчета вероятной ошибки наблюдения прямых наблюдений равной точности» . Астрономические новости (на немецком языке). 88 (8–9): 113–131. Бибкод : 1876AN.....88..113H . дои : 10.1002/asna.18760880802 .
- ^ Люрот, Дж. (1876). «Сравнение двух значений вероятной погрешности» . Астрономические новости (на немецком языке). 87 (14): 209–220. Бибкод : 1876AN.....87..209L . дои : 10.1002/asna.18760871402 .
- ^ Пфанзагль, Дж. (1996). «Исследования по истории вероятности и статистики XLIV. Предшественник t-распределения». Биометрика . 83 (4): 891–898. дои : 10.1093/biomet/83.4.891 . МР 1766040 .
- ^ Шейнин, Оскар (1995). «Работа Гельмерта по теории ошибок». Архив истории точных наук . 49 (1): 73–104. дои : 10.1007/BF00374700 . ISSN 0003-9519 . S2CID 121241599 .
- ^ Пирсон, Карл (1895). «X. Вклад в математическую теорию эволюции. — II. Асимметрия в однородном материале» . Философские труды Лондонского королевского общества А. 186 : 343–414. Бибкод : 1895RSPTA.186..343P . дои : 10.1098/rsta.1895.0010 . ISSN 1364-503X .
- ^ «Студент» ( Уильям Сили Госсет ) (1908). «Вероятная ошибка среднего». Биометрика . 6 (1): 1–25. дои : 10.1093/биомет/6.1.1 . hdl : 10338.dmlcz/143545 . JSTOR 2331554 .
- ^ «Т-таблица | История T-таблицы, этимология, односторонняя T-таблица, двусторонняя T-таблица и T-статистика» .
- ^ Вендл, MC (2016). «Псевдонимная слава». Наука . 351 (6280): 1406. doi : 10.1126/science.351.6280.1406 . ПМИД 27013722 .
- ^ Таттл, Мэриленд; Аназонву, Б.с., Уолтер; Рубин, Мэриленд, Ли (2014). «Анализ подгруппы местного применения транексамовой кислоты при тотальной артропластике коленного сустава» . Реконструктивный обзор . 4 (2): 37–41. дои : 10.15438/rr.v4i2.72 .
- ^ Уолпол, Рональд Э. (2006). Вероятность и статистика для инженеров и ученых . Майерс, Х. Рэймонд. (7-е изд.). Нью-Дели: Пирсон. ISBN 81-7758-404-9 . OCLC 818811849 .