Погрешность

Плотности вероятности опросов разного размера, каждый из которых имеет цветовую кодировку для своего 95% доверительного интервала (внизу), погрешности (слева) и размера выборки (справа). Каждый интервал отражает диапазон, в пределах которого можно иметь 95%-ную уверенность в том, что *истинный* процент может быть найден, учитывая заявленный процент в 50%. Погрешность *составляет* половину доверительного интервала (а также *радиуса* интервала). Чем больше выборка, тем меньше погрешность. Кроме того, чем дальше от 50% заявленный процент, тем меньше погрешность.

Погрешность – это статистический показатель , выражающий величину ошибки случайной выборки в результатах опроса . Чем больше погрешность, тем меньше следует быть уверенности в том, что результат опроса будет отражать результат переписи всего населения . Предел погрешности будет положительным, если совокупность отобрана не полностью и показатель результата имеет положительную дисперсию , то есть всякий раз, когда показатель изменяется .

Термин «погрешность» часто используется в контексте, не связанном с обследованием, для обозначения ошибки наблюдения при сообщении измеренных величин.

Концепция

Рассмотрим простой «да/нет» опрос $P$ как образец $n$ респонденты, отобранные из населения $N{\text{, }}(n\ll N)$ сообщая о проценте $p$ ответов «да» . Мы хотели бы знать, насколько близко $p$ является истинным результатом опроса всего населения $N$ , без необходимости его проведения. Если бы, гипотетически, мы провели опрос $P$ над последующими образцами $n$ респонденты (недавно отобранные из $N$ ), мы ожидаем, что последующие результаты $p_{1},p_{2},\ldots$ нормально распределяться по ${\overline {p}}$ , истинный, но неизвестный процент населения. Погрешность описывает расстояние, в пределах которого ожидается , что указанный процент этих результатов будет отличаться от ${\overline {p}}$ .

Согласно правилу 68-95-99,7 мы ожидаем, что 95% результатов $p_{1},p_{2},\ldots$ будет находиться в пределах примерно двух стандартных отклонений ( $\pm 2\sigma _{P}$ ) по обе стороны от истинного среднего значения ${\overline {p}}$ . Этот интервал называется доверительным интервалом , а радиус (половина интервала) называется пределом погрешности , что соответствует уровню достоверности 95% .

Как правило, на уровне доверия $\gamma$ , размер выборки $n$ населения, ожидавшего стандартного отклонения $\sigma$ имеет погрешность

MOE_{\gamma }=z_{\gamma }\times {\sqrt {\frac {\sigma ^{2}}{n}}}

где $z_{\gamma }$ обозначает квантиль (также обычно z-показатель ), и ${\sqrt {\frac {\sigma ^{2}}{n}}}$ это стандартная ошибка .

Стандартное отклонение и стандартная ошибка

Мы ожидаем, что среднее значение нормально распределенных значений $p_{1},p_{2},\ldots$ иметь стандартное отклонение, которое каким-то образом меняется в зависимости от $n$ . Чем меньше $n$ , тем шире поле. Это называется стандартной ошибкой $\sigma _{\overline {p}}$ .

Для единственного результата нашего опроса мы предполагаем , что $p={\overline {p}}$ , и что все последующие результаты $p_{1},p_{2},\ldots$ вместе будет иметь разницу $\sigma _{P}^{2}=P(1-P)$ .

{\text{Standard error}}=\sigma _{\overline {p}}\approx {\sqrt {\frac {\sigma _{P}^{2}}{n}}}\approx {\sqrt {\frac {p(1-p)}{n}}}

Обратите внимание, что $p(1-p)$ соответствует дисперсии распределения Бернулли .

Максимальная погрешность на разных уровнях достоверности

доверия Для уровня $\gamma$ , существует соответствующий доверительный интервал относительно среднего значения $\mu \pm z_{\gamma }\sigma$ , то есть интервал $[\mu -z_{\gamma }\sigma ,\mu +z_{\gamma }\sigma ]$ в пределах которых значения $P$ должно упасть с вероятностью $\gamma$ . Точные значения $z_{\gamma }$ определяются квантильной функцией нормального распределения (которую аппроксимирует правило 68-95-99,7).

Обратите внимание, что $z_{\gamma }$ не определено для $|\gamma |\geq 1$ , то есть, $z_{1.00}$ не определено, как и $z_{1.10}$ .

$\gamma$	$z_{\gamma }$	$\gamma$	$z_{\gamma }$
0.84	0.994 457 883 210	0.9995	3.290 526 731 492
0.95	1.644 853 626 951	0.99995	3.890 591 886 413
0.975	1.959963984540	0.999995	4.417 173 413 469
0.99	2.326 347 874 041	0.9999995	4.891 638 475 699
0.995	2.575 829 303 549	0.99999995	5.326 723 886 384
0.9975	2.807 033 768 344	0.999999995	5.730 728 868 236
0.9985	2.967 737 925 342	0.9999999995	6.109 410 204 869

С $\max \sigma _{P}^{2}=\max P(1-P)=0.25$ в $p=0.5$ , мы можем произвольно установить $p={\overline {p}}=0.5$ , рассчитать $\sigma _{P}$ , $\sigma _{\overline {p}}$ , и $z_{\gamma }\sigma _{\overline {p}}$ чтобы получить максимальную погрешность для $P$ на заданном уровне доверия $\gamma$ и размер выборки $n$ , даже до получения фактических результатов. С $p=0.5,n=1013$

MOE_{95}(0.5)=z_{0.95}\sigma _{\overline {p}}\approx z_{0.95}{\sqrt {\frac {\sigma _{P}^{2}}{n}}}=1.96{\sqrt {\frac {.25}{n}}}=0.98/{\sqrt {n}}=\pm 3.1\%

MOE_{99}(0.5)=z_{0.99}\sigma _{\overline {p}}\approx z_{0.99}{\sqrt {\frac {\sigma _{P}^{2}}{n}}}=2.58{\sqrt {\frac {.25}{n}}}=1.29/{\sqrt {n}}=\pm 4.1\%

Также, что полезно, для любых сообщаемых $MOE_{95}$

MOE_{99}={\frac {z_{0.99}}{z_{0.95}}}MOE_{95}\approx 1.3\times MOE_{95}

Конкретные пределы погрешности

Если опрос имеет несколько процентных результатов (например, опрос, измеряющий одно предпочтение с несколькими вариантами ответов), результат, ближайший к 50%, будет иметь наибольшую погрешность. Обычно именно это число указывается как погрешность для всего опроса. Представьте себе опрос $P$ отчеты $p_{a},p_{b},p_{c}$ как $71\%,27\%,2\%,n=1013$

MOE_{95}(P_{a})=z_{0.95}\sigma _{\overline {p_{a}}}\approx 1.96{\sqrt {\frac {p_{a}(1-p_{a})}{n}}}=0.89/{\sqrt {n}}=\pm 2.8\%

(как на рисунке выше)

MOE_{95}(P_{b})=z_{0.95}\sigma _{\overline {p_{b}}}\approx 1.96{\sqrt {\frac {p_{b}(1-p_{b})}{n}}}=0.87/{\sqrt {n}}=\pm 2.7\%

MOE_{95}(P_{c})=z_{0.95}\sigma _{\overline {p_{c}}}\approx 1.96{\sqrt {\frac {p_{c}(1-p_{c})}{n}}}=0.27/{\sqrt {n}}=\pm 0.8\%

Когда данный процент приближается к крайним значениям 0% или 100%, его погрешность приближается к ±0%.

Сравнение процентов

Представьте себе опрос с несколькими вариантами ответов $P$ отчеты $p_{a},p_{b},p_{c}$ как $46\%,42\%,12\%,n=1013$ . Как описано выше, погрешность, сообщаемая для опроса, обычно составляет $MOE_{95}(P_{a})$ , как $p_{a}$ ближе всего к 50%. Однако популярное понятие статистической ничьи или статистического ничьего касается не точности отдельных результатов, а точности ранжирования результатов . Что на первом месте?

Если бы, гипотетически, мы провели опрос $P$ над последующими образцами $n$ респонденты (недавно отобранные из $N$ ) и сообщить результат $p_{w}=p_{a}-p_{b}$ , мы могли бы использовать стандартную ошибку разницы, чтобы понять, как $p_{w_{1}},p_{w_{2}},p_{w_{3}},\ldots$ ожидается падение примерно ${\overline {p_{w}}}$ . Для этого нам нужно применить сумму дисперсий , чтобы получить новую дисперсию: $\sigma _{P_{w}}^{2}$ ,

\sigma _{P_{w}}^{2}=\sigma _{P_{a}-P_{b}}^{2}=\sigma _{P_{a}}^{2}+\sigma _{P_{b}}^{2}-2\sigma _{P_{a},P_{b}}=p_{a}(1-p_{a})+p_{b}(1-p_{b})+2p_{a}p_{b}

где $\sigma _{P_{a},P_{b}}=-P_{a}P_{b}$ это ковариация $P_{a}$ и $P_{b}$ .

Таким образом (после упрощения)

{\text{Standard error of difference}}=\sigma _{\overline {w}}\approx {\sqrt {\frac {\sigma _{P_{w}}^{2}}{n}}}={\sqrt {\frac {p_{a}+p_{b}-(p_{a}-p_{b})^{2}}{n}}}=0.029,P_{w}=P_{a}-P_{b}

MOE_{95}(P_{a})=z_{0.95}\sigma _{\overline {p_{a}}}\approx \pm {3.1\%}

MOE_{95}(P_{w})=z_{0.95}\sigma _{\overline {w}}\approx \pm {5.8\%}

Обратите внимание, что это предполагает, что $P_{c}$ близок к константе, то есть респонденты, выбравшие либо А, либо Б, почти никогда не выберут С (что делает $P_{a}$ и $P_{b}$ близка к совершенно отрицательной корреляции ). При наличии трех или более вариантов выбора в условиях более тесного конфликта выбор правильной формулы для $\sigma _{P_{w}}^{2}$ становится сложнее.

Влияние конечной численности популяции

Приведенные выше формулы для погрешности предполагают, что население бесконечно велико и, следовательно, не зависит от размера населения. $N$ , но только от размера выборки $n$ . Согласно теории выборки , это предположение разумно, когда доля выборки мала. Предел погрешности для конкретного метода выборки по существу одинаков, независимо от того, является ли исследуемая совокупность размером со школу, город, штат или страну, при условии, что доля выборки невелика.

В тех случаях, когда доля выборки больше (на практике более 5%), аналитики могут скорректировать погрешность, используя конечную поправку на генеральную совокупность , чтобы учесть дополнительную точность, полученную за счет выборки гораздо большего процента генеральной совокупности. FPC можно рассчитать по формуле ^[1]

\operatorname {FPC} ={\sqrt {\frac {N-n}{N-1}}}

...и так, если опрос $P$ были проведены более 24%, скажем, электората в 300 000 избирателей,

MOE_{95}(0.5)=z_{0.95}\sigma _{\overline {p}}\approx {\frac {0.98}{\sqrt {72,000}}}=\pm 0.4\%

MOE_{95_{FPC}}(0.5)=z_{0.95}\sigma _{\overline {p}}{\sqrt {\frac {N-n}{N-1}}}\approx {\frac {0.98}{\sqrt {72,000}}}{\sqrt {\frac {300,000-72,000}{300,000-1}}}=\pm 0.3\%

Интуитивно, для достаточно больших $N$ ,

\lim _{n\to 0}{\sqrt {\frac {N-n}{N-1}}}\approx 1

\lim _{n\to N}{\sqrt {\frac {N-n}{N-1}}}=0

В первом случае $n$ настолько мал, что не требует коррекции. В последнем случае опрос фактически становится переписью, и ошибка выборки становится спорной.

См. также

Ссылки

^ Иссерлис, Л. (1918). «О значении среднего значения, рассчитанного по выборке» . Журнал Королевского статистического общества . 81 (1). Издательство Блэквелл: 75–81. дои : 10.2307/2340569 . JSTOR 2340569 . (Уравнение 1)

Источники

Судман, Сеймур и Брэдберн, Норман (1982). Задавание вопросов: Практическое руководство по разработке анкет . Сан-Франциско: Джосси Басс. ISBN 0-87589-546-8
Воннакотт, TH; Р. Дж. Воннакотт (1990). Вводная статистика (5-е изд.). Уайли. ISBN 0-471-61518-8 .

Внешние ссылки

[1] Иссерлис, Л. (1918). «О значении среднего значения, рассчитанного по выборке» . Журнал Королевского статистического общества . 81 (1). Издательство Блэквелл: 75–81. дои : 10.2307/2340569 . JSTOR 2340569 . (Уравнение 1)

[1]