97,5-й процентиль
![](http://upload.wikimedia.org/wikipedia/commons/thumb/b/bf/NormalDist1.96.png/250px-NormalDist1.96.png)
В теории вероятности и статистике 97,5 -й процентиль стандартного нормального распределения — это число, обычно используемое для статистических расчетов. Приблизительное значение этого числа составляет 1,96 , что означает, что 95% площади под нормальной кривой находится в пределах примерно 1,96 стандартных отклонений от среднего значения . Из-за центральной предельной теоремы это число используется при построении приблизительных 95% доверительных интервалов . Его повсеместное распространение обусловлено произвольным, но распространенным соглашением об использовании доверительных интервалов с вероятностью 95% в науке и частотной статистике, хотя иногда используются и другие вероятности (90%, 99% и т. д.). [1] [2] [3] [4] Это соглашение, по-видимому, особенно распространено в медицинской статистике. [5] [6] [7] но также распространен в других областях применения, таких как науки о Земле, [8] социальные науки и бизнес-исследования. [9]
Для этого номера не существует единого общепринятого названия; его также часто называют «стандартным нормальным отклонением », « нормальным показателем » или « оценкой Z » для процентиля 97,5, балла 0,975 или просто его приблизительного значения 1,96.
Если X имеет стандартное нормальное распределение, т.е. X ~ N(0,1),
и поскольку нормальное распределение симметрично,
Одно из обозначений этого числа — z .975 . [10] Из функции плотности вероятности стандартного нормального распределения точное значение z 0,975 определяется выражением
История [ править ]
Использование этого числа в прикладной статистике можно объяснить влиянием Рональда Фишера классического учебника « Статистические методы для научных работников» , впервые опубликованного в 1925 году:
«Значение, для которого P = 0,05, или 1 из 20, равно 1,96 или почти 2; удобно принять эту точку как предел при оценке того, следует ли считать отклонение значительным или нет». [11]
В таблице 1 той же работы он дал более точное значение 1,959964. [12] В 1970 году значение, усеченное до 20 десятичных знаков , было рассчитано как
Таким образом, обычно используемое приблизительное значение 1,96 имеет точность более одной части из 50 000, что более чем достаточно для прикладных работ.
Некоторые люди даже используют значение 2 вместо 1,96, указывая доверительный интервал 95,4% как доверительный интервал 95%. Это не рекомендуется, но иногда встречается. [15]
Функции программного обеспечения [ править ]
обратную стандартную нормальную CDF Для вычисления значения можно использовать . Ниже приведена таблица вызовов функций, которые возвращают 1,96 в некоторых часто используемых приложениях:
Приложение | Вызов функции |
---|---|
Эксель | НОРМ.С.ОБР (0,975) |
МАТЛАБ | норминв (0,975) |
р | qнорма (0,975) |
Питон ( SciPy ) | scipy.stats.norm.ppf (0,975) |
САС | probit (0.025); |
СПСС | x = ВЫЧИСИТЬ IDF.НОРМАЛЬНЫЙ (0,975,0,1). |
Был | ненормальный (0,975) |
Язык Wolfram ( Математика ) | InverseCDF[NormalDistribution[0, 1], 0,975] [16] [17] |
См. также [ править ]
Ссылки [ править ]
- ^
Рис, Д.Г. (1987), Основы статистики , CRC Press, стр. 246, ISBN 0-412-28560-6 ,
Почему 95% уверенности? Почему не какой-то другой уровень доверия ? Использование 95% отчасти является общепринятым, но также используются такие уровни, как 90%, 98% и иногда 99,9%.
- ^
«Справочник по инженерной статистике: доверительные пределы для среднего» . Национальный институт стандартов и технологий. Архивировано из оригинала 5 февраля 2008 года . Проверено 4 февраля 2008 г.
Хотя выбор коэффициента достоверности несколько произволен, на практике часто используются интервалы 90%, 95% и 99%, причем чаще всего используется интервал 95%.
- ^
Олсон, Эрик Т; Олсон, Тэмми Перри (2000), Реальная математика: статистика , Walch Publishing, стр. 66 , ISBN 0-8251-3863-9 Хотя могут быть выбраны и
другие более строгие или более свободные пределы, статистики очень часто отдают предпочтение 95-процентному интервалу.
- ^
Свифт, МБ (2009). «Сравнение доверительных интервалов для среднего Пуассона - дальнейшие соображения». Коммуникации в статистике – теория и методы . 38 (5): 748–759. дои : 10.1080/03610920802255856 . S2CID 120748700 .
В современной прикладной практике практически все доверительные интервалы устанавливаются на уровне 95%.
- ^ Саймон, Стив (2002), Почему доверительный интервал 95%? , архивировано из оригинала 28 января 2008 г. , получено 1 февраля 2008 г.
- ^ Мохер, Д; Шульц, К.Ф.; Альтман, Д.Г. (2001), «Заявление CONSORT: пересмотренные рекомендации по улучшению качества отчетов о рандомизированных исследованиях в параллельных группах». , Lancet , 357 (9263): 1191–1194, doi : 10.1016/S0140-6736(00)04337-3 , PMID 11323066 , S2CID 52871971 , получено 4 февраля 2008 г.
- ^
«Ресурсы для авторов: исследования» . BMJ Publishing Group Ltd. Архивировано из оригинала 18 июля 2009 года . Проверено 4 февраля 2008 г.
Для стандартных оригинальных исследовательских статей укажите следующие заголовки и информацию: [...] результаты – основные результаты с (для количественных исследований) 95% доверительными интервалами и, при необходимости, точным уровнем статистической значимости и количеством пациентов, нуждающихся в лечении/ вред
- ^
Боррадейл, Грэм Дж. (2003), Статистика данных наук о Земле , Springer, стр. 79, ISBN 3-540-43603-0 ,
Для простоты мы принимаем принятое в науках о Земле соглашение о доверительном интервале 95%.
- ^
Кук, Сара (2004), «Измерение эффективности обслуживания клиентов» , Gower Publishing, стр. 24, ISBN 0-566-08538-0 ,
Большинство исследователей используют 95-процентный доверительный интервал.
- ^ Гослинг, Дж. (1995), Вводная статистика , Pascal Press, стр. 78–9, ISBN 1-86441-015-9
- ^ Фишер, Рональд (1925), Статистические методы для научных работников , Эдинбург: Оливер и Бойд, стр. 47 , ISBN 0-05-002170-2
- ^ Фишер, Рональд (1925), Статистические методы для научных работников , Эдинбург: Оливер и Бойд, ISBN 0-05-002170-2 , Таблица 1
- ^ Уайт, Джон С. (июнь 1970 г.), «Таблицы нормальных процентилей», Журнал Американской статистической ассоциации , 65 (330), Американская статистическая ассоциация: 635–638, doi : 10.2307/2284575 , JSTOR 2284575
- ^ Слоан, Нью-Джерси (ред.). «Последовательность A220510» . Электронная энциклопедия целочисленных последовательностей . Фонд ОЭИС.
- ^ «Оценка среднего значения численности населения с использованием интервалов» . stat.wmich.edu . Лаборатория статистических вычислений. Архивировано из оригинала 4 июля 2018 года . Проверено 7 августа 2018 г.
- ^ InverseCDF , Центр языковой документации Wolfram.
- ^ NormalDistribution , Центр языковой документации Wolfram.
Дальнейшее чтение [ править ]
- Гарднер, Мартин Дж; Альтман, Дуглас Дж. , ред. (1989), Статистика с уверенностью , BMJ Books, ISBN 978-0-7279-0222-1