Jump to content

Определение размера выборки

(Перенаправлено из Размер выборки )

размера выборки Определение или оценка – это выбор количества наблюдений или повторов для включения в статистическую выборку . Размер выборки — важная особенность любого эмпирического исследования, цель которого — сделать выводы о совокупности на основе выборки. На практике размер выборки, используемый в исследовании, обычно определяется на основе стоимости, времени или удобства сбора данных, а также необходимости обеспечения достаточной статистической мощности . В комплексных исследованиях могут быть выделены выборки разных размеров, например, в стратифицированных исследованиях или экспериментальных планах с несколькими группами лечения. При переписи данные собираются для всего населения, поэтому предполагаемый размер выборки равен численности населения. При планировании эксперимента , когда исследование может быть разделено на различные группы лечения , для каждой группы могут быть разные размеры выборки.

Размер выборки можно выбрать несколькими способами:

  • использование опыта: небольшие выборки, хотя иногда и неизбежны, могут привести к широким доверительным интервалам и риску ошибок при проверке статистических гипотез .
  • использование целевой дисперсии для оценки, которая должна быть получена на основе полученной в конечном итоге выборки, т. е. если требуется высокая точность (узкий доверительный интервал), это приводит к низкой целевой дисперсии оценщика.
  • использование целевого показателя мощности, т.е. мощности статистического теста, который будет применяться после сбора выборки.
  • использование уровня достоверности, т.е. чем выше требуемый уровень достоверности, тем больше размер выборки (при условии постоянного требования к точности).

Введение [ править ]

Определение размера выборки является важнейшим аспектом методологии исследования, который играет важную роль в обеспечении надежности и достоверности результатов исследования. Чтобы повлиять на точность оценок, мощность статистических тестов и общую надежность результатов исследования, необходимо тщательно выбирать количество участников или точек данных, которые будут включены в исследование.

Например, если мы проводим опрос для определения среднего уровня удовлетворенности клиентов относительно нового продукта. Чтобы определить подходящий размер выборки, нам необходимо учитывать такие факторы, как желаемый уровень уверенности, погрешность и изменчивость ответов. Мы можем решить, что нам нужен уровень достоверности 95 %, то есть мы на 95 % уверены, что истинный средний уровень удовлетворенности находится в пределах рассчитанного диапазона. Мы также определяем предел погрешности в размере ±3%, который указывает на приемлемый диапазон различий между нашей выборочной оценкой и истинным параметром совокупности. Кроме того, мы можем иметь некоторое представление об ожидаемой изменчивости уровней удовлетворенности на основе предыдущих данных или предположений.

Важность [ править ]

Большие размеры выборки обычно приводят к повышению точности при оценке неизвестных параметров. Например, чтобы точно определить распространенность возбудителя инфекции у конкретного вида рыб, предпочтительнее исследовать выборку из 200 рыб, а не из 100 рыб. Это явление описывают несколько фундаментальных фактов математической статистики, включая закон больших чисел и центральную предельную теорему .

В некоторых ситуациях повышение точности для выборок большего размера минимально или даже отсутствует. Это может быть результатом наличия систематических ошибок или сильной зависимости в данных, или того, что данные следуют распределению с тяжелым хвостом, или потому, что данные сильно зависимы или предвзяты.

Размер выборки можно оценить по качеству полученных оценок следующим образом. Обычно он определяется на основе стоимости, времени или удобства сбора данных, а также необходимости наличия достаточной статистической мощности. Например, если оценивается доля, может потребоваться, чтобы 95% доверительный интервал был шириной менее 0,06 единиц. Альтернативно, размер выборки может быть оценен на основе силы проверки гипотезы. Например, если мы сравниваем поддержку определенного политического кандидата среди женщин с поддержкой этого кандидата среди мужчин, нам может потребоваться иметь 80% власти, чтобы обнаружить разницу в уровнях поддержки в 0,04 единицы.

Оценка [ править ]

Оценка доли [ править ]

Относительно простой ситуацией является оценка доли . Это фундаментальный аспект статистического анализа, особенно при оценке распространенности определенной характеристики среди населения. Например, мы можем захотеть оценить долю жителей в сообществе в возрасте не менее 65 лет.

Оценка пропорции , где X — количество «положительных» случаев (например, количество людей из n выбранных людей в возрасте не менее 65 лет). Когда наблюдения независимы , эта оценка имеет (масштабированное) биномиальное распределение (а также является выборочным средним данных из распределения Бернулли ). Максимальная дисперсия этого распределения составляет 0,25, что происходит, когда истинный параметр равен p = 0,5. В практических приложениях, где истинный параметр p неизвестен, максимальная дисперсия часто используется для оценки размера выборки. Если известна разумная оценка p, величина можно использовать вместо 0,25.

Когда размер выборки n становится достаточно большим, распределение будет близко аппроксимироваться нормальным распределением . [1] Используя это и метод Вальда для биномиального распределения , получаем доверительный интервал, где Z представляет собой стандартный Z-показатель для желаемого уровня достоверности (например, 1,96 для 95% доверительного интервала) в форме:

Чтобы определить подходящий размер выборки n для оценки пропорций, можно решить приведенное ниже уравнение, где W представляет собой желаемую ширину доверительного интервала. Полученная формула размера выборки часто применяется с консервативной оценкой p (например, 0,5):

для n , что дает размер выборки

размеры выборки для биномиальных пропорций с учетом разных уровней достоверности и погрешностей

, в случае использования 0,5 в качестве наиболее консервативной оценки доли. (Примечание: W/2 = погрешность .)

На рисунке ниже можно увидеть, как размеры выборки для биномиальных пропорций изменяются при различных уровнях достоверности и пределах погрешности.


В противном случае формула будет иметь вид , что дает .Например, при оценке доли населения США, поддерживающего кандидата в президенты, с шириной доверительного интервала 95% в 2 процентных пункта (0,02), размер выборки (1,96) 2 / (0.02 2 ) = 9604 требуется с погрешностью в данном случае 1 процентный пункт. В этом случае разумно использовать оценку p 0,5, поскольку президентские гонки часто близки к 50/50, и также разумно использовать консервативную оценку. Погрешность в этом случае составляет 1 процентный пункт (половина 0,02).

На практике формула: обычно используется для формирования 95% доверительного интервала для истинной доли. Уравнение можно решить для n , обеспечивая минимальный размер выборки, необходимый для достижения желаемой погрешности. Вышеизложенное обычно упрощается: [2] [3] п = 4/ Вт 2 = 1/ Б 2 где B — граница погрешности оценки, т. е. оценка обычно дается в пределах ± B . Для B = 10% требуется n = 100, для B = 5% необходимо n = 400, для B = 3% требование приближается к n = 1000, а для B размер выборки n = 1% требуется = 10000. . Эти цифры часто приводятся в новостях, опросах общественного мнения и других выборочных опросах . Однако сообщаемые результаты могут не соответствовать точному значению, поскольку числа желательно округлять в большую сторону. Зная, что значение n представляет собой минимальное количество точек выборки, необходимое для получения желаемого результата, количество респондентов должно находиться на уровне минимума или превышать его.

Оценка среднего [ править ]

Проще говоря, если мы пытаемся оценить среднее время, которое требуется людям, чтобы добраться до работы в городе. Вместо опроса всего населения вы можете взять случайную выборку из 100 человек, записать время их пути на работу, а затем рассчитать среднее (среднее) время в пути для этой выборки. Например, человеку 1 требуется 25 минут, человеку 2 — 30 минут, ..., человеку 100 — 20 минут. Сложите все время в пути и разделите на количество людей в выборке (в данном случае 100). Результатом будет ваша оценка среднего времени в пути для всего населения. Этот метод практичен, когда невозможно измерить всех членов популяции, и он обеспечивает разумную аппроксимацию на основе репрезентативной выборки.

Точно математическим способом, при оценке среднего значения совокупности с использованием независимой и одинаково распределенной (iid) выборки размера n , где каждое значение данных имеет дисперсию σ 2 , стандартная ошибка выборочного среднего равна:

Это выражение количественно описывает, как оценка становится более точной по мере увеличения размера выборки. Использование центральной предельной теоремы для обоснования аппроксимации выборочного среднего с помощью нормального распределения дает доверительный интервал вида

,
где Z — стандартный Z-показатель для желаемого уровня достоверности (1,96 для 95% доверительного интервала).

Чтобы определить размер выборки n, необходимый для доверительного интервала шириной W, где W/2 является погрешностью на каждой стороне выборочного среднего, уравнение

можно решить. Это дает формулу размера выборки для n :

.

Например, если оценить влияние препарата на артериальное давление с 95% доверительным интервалом шириной шесть единиц, а известное стандартное отклонение артериального давления в популяции равно 15, требуемый размер выборки будет равен , которое будет округлено до 97, поскольку размеры выборки должны быть целыми числами и должны соответствовать рассчитанному минимальному значению или превышать его. Понимание этих расчетов важно для исследователей, планирующих исследования для точной оценки средних значений численности населения в пределах желаемого уровня достоверности.

выборки для проверки гипотез Требуемые размеры

Одна из распространенных проблем, с которыми сталкиваются статистики, вращается вокруг задачи расчета размера выборки, необходимого для достижения заданной статистической мощности теста, при сохранении заранее определенного коэффициента ошибок типа I α, который означает уровень значимости при проверке гипотез. . Это дает определенную мощность для теста при заданных заранее условиях. Таким образом, это можно оценить с помощью заранее определенных таблиц для определенных значений, с помощью уравнения ресурсов Мида или, в более общем смысле, с помощью кумулятивной функции распределения :

Таблицы [ править ]

[4]
 
Власть
Коэн д
0.2 0.5 0.8
0.25 84 14 6
0.50 193 32 13
0.60 246 40 16
0.70 310 50 20
0.80 393 64 26
0.90 526 85 34
0.95 651 105 42
0.99 920 148 58

Таблицу, показанную справа, можно использовать в двухвыборочном t-тесте для оценки размеров выборки экспериментальной группы и контрольной группы , которые имеют одинаковый размер, то есть общее количество участников в исследовании в два раза превышает заданного числа, а желаемый уровень значимости составляет 0,05. [4] Используемые параметры:

Мида Уравнение ресурсов

Уравнение ресурсов Мида часто используется для оценки размеров выборок лабораторных животных , а также во многих других лабораторных экспериментах. Он может быть не таким точным, как использование других методов оценки размера выборки, но дает подсказку о том, какой размер выборки является подходящим, когда такие параметры, как ожидаемые стандартные отклонения или ожидаемые различия в значениях между группами, неизвестны или очень трудно оценить. [5]

Все параметры в уравнении по сути являются степенями свободы числа их понятий, и, следовательно, их числа вычитаются на 1 перед подстановкой в ​​уравнение.

Уравнение: [5]

где:

  • N — общее количество лиц или единиц в исследовании (минус 1)
  • B блокирующий компонент , представляющий воздействие окружающей среды, предусмотренное проектом (минус 1).
  • T компонент лечения , соответствующий количеству используемых групп лечения (включая контрольную группу ) или количеству задаваемых вопросов (минус 1).
  • E — это степени свободы компонента ошибки и должно быть где-то между 10 и 20.

Например, если исследование с использованием лабораторных животных планируется с четырьмя экспериментальными группами ( T =3), по восемь животных в каждой группе, всего 32 животных ( N =31), без какой-либо дальнейшей стратификации ( B =0), тогда E будет равно 28, что превышает пороговое значение в 20, что указывает на то, что размер выборки может быть слишком большим, и шесть животных на группу могут быть более подходящими. [6]

распределения Кумулятивная функция

Пусть X i , i = 1, 2, ..., n — независимые наблюдения, взятые из нормального распределения с неизвестным средним значением µ и известной дисперсией σ. 2 . Рассмотрим две гипотезы, нулевую гипотезу :

и альтернативная гипотеза:

для некоторой «наименьшей значимой разницы» μ * > 0. Это наименьшее значение, при котором нам важно наблюдать разницу. Теперь, чтобы (1) отвергнуть H 0 с вероятностью не менее 1 − β , когда H a истинно (т.е. степень 1 − β ) и (2) отвергнуть H 0 с вероятностью α, когда H 0 истинно, необходимо следующее: Если z α — верхняя процентная точка α стандартного нормального распределения, то

и так

'Отклонить H 0, если среднее значение нашей выборки ( ) больше, чем '

является решающим правилом , удовлетворяющим (2). (Это односторонний тест.) В таком сценарии достижение этого с вероятностью не менее 1-β, когда альтернативная гипотеза H a верна, становится обязательным. Здесь выборочное среднее происходит из нормального распределения со средним значением µ * . Таким образом, требование выражается в следующем:

Путем тщательного манипулирования можно показать (см. Пример статистической мощности ), что это происходит, когда

где – нормальная кумулятивная функция распределения .

выборки стратифицированной Размер

При использовании более сложных методов выборки, таких как стратифицированная выборка , выборку часто можно разделить на подвыборки. Обычно, если H таких подвыборок (из H разных слоев), то каждая из них будет иметь размер выборки n h , h = 1, 2, ..., H . Эти n h должны соответствовать правилу, что n 1 + n 2 + ... + n H = n (т. е. общий размер выборки определяется суммой размеров подвыборки). Оптимальный выбор этих n h можно выполнить различными способами, используя, например, оптимальное распределение Неймана.

Существует множество причин для использования стратифицированной выборки: [7] уменьшить дисперсию выборочных оценок, использовать частично неслучайные методы или изучать слои индивидуально. Полезным, частично неслучайным методом будет выборка отдельных лиц там, где это легко доступно, а там, где это невозможно, выборка кластеров для экономии транспортных расходов. [8]

В общем, для страт H взвешенное выборочное среднее равно

с

[9]

Веса, , часто, но не всегда, представляют собой пропорции элементов совокупности в слоях, и . Для фиксированного размера выборки, т.е. ,

[10]

который можно сделать минимальным, если частоту выборки внутри каждой страты сделатьпропорционально стандартному отклонению внутри каждой страты: , где и константа такая, что .

«Оптимальное распределение» достигается, когда частота выборки внутри слоевделаются прямо пропорциональными стандартным отклонениям внутри страти обратно пропорциональна квадратному корню из стоимости выборки на элементвнутри слоев, :

[11]

где константа такая, что или, в более общем смысле, когда

[12]

исследования Качественные

Качественные исследования подходят к определению размера выборки с использованием особой методологии, которая отличается от количественных методов. Вместо того, чтобы полагаться на заранее определенные формулы или статистические расчеты, оно предполагает субъективное и повторяющееся суждение на протяжении всего исследовательского процесса. В качественных исследованиях исследователи часто занимают субъективную позицию, делая выводы по мере развития исследования. Определение размера выборки в качественных исследованиях использует другой подход. Обычно это субъективное суждение, принимаемое по ходу исследования. [13] Один из распространенных подходов заключается в постоянном включении дополнительных участников или материалов до тех пор, пока не будет достигнута точка «насыщения». Насыщение происходит, когда новые участники или данные перестают давать свежие идеи, что указывает на то, что исследование адекватно отражает разнообразие точек зрения или опыта в пределах выбранной выборки . Насыщение достигается. [14] Количество, необходимое для достижения насыщения, было исследовано эмпирически. [15] [16] [17] [18]

В отличие от количественных исследований, качественные исследования сталкиваются с нехваткой надежных указаний относительно оценки размера выборки до начала исследования.Представьте себе, что при проведении глубинных интервью с людьми, пережившими рак, качественные исследователи могут использовать насыщение данных для определения подходящего размера выборки. Если в ходе нескольких интервью не обнаруживается свежих тем или идей, значит, насыщение достигнуто, и дальнейшие интервью могут не сильно расширить наши знания об опыте пережившего насилие. Таким образом, вместо следования заранее заданной статистической формуле концепция достижения насыщения служит динамическим руководством для определения размера выборки в качественных исследованиях. Существует недостаток надежных руководств по оценке размеров выборки перед началом исследования, а также дается ряд предложений. [16] [19] [20] [21] В попытке привнести некоторую структуру в процесс определения размера выборки в качественных исследованиях был предложен инструмент, аналогичный количественным расчетам мощности. Этот инструмент, основанный на отрицательном биномиальном распределении , специально предназначен для тематического анализа . [22] [21]

См. также [ править ]

Ссылки [ править ]

  1. ^ NIST / SEMATECH , «7.2.4.2. Требуемые размеры выборки» , электронный справочник по статистическим методам.
  2. ^ «Вывод о регрессии» . utdallas.edu .
  3. ^ «Доверительный интервал для пропорции». Архивировано 23 августа 2011 г. в Wayback Machine.
  4. ^ Jump up to: Перейти обратно: а б Глава 13 , стр. 215, в: Кенни, Дэвид А. (1987). Статистика для социальных и поведенческих наук . Бостон: Литтл, Браун. ISBN  978-0-316-48915-7 .
  5. ^ Jump up to: Перейти обратно: а б Кирквуд, Джеймс; Роберт Хубрехт (2010). Справочник UFAW по уходу и содержанию лабораторных и других исследовательских животных . Уайли-Блэквелл. п. 29. ISBN  978-1-4051-7523-4 . онлайн Страница 29
  6. ^ Isogenic.info > Уравнение ресурсов Майкла Ф. В. Фестинга. Обновлено в сентябре 2006 г.
  7. ^ Киш (1965, раздел 3.1)
  8. ^ Киш (1965), с. 148.
  9. ^ Киш (1965), с. 78.
  10. ^ Киш (1965), с. 81.
  11. ^ Киш (1965), с. 93.
  12. ^ Киш (1965), с. 94.
  13. ^ Санделовски, М. (1995). Размер выборки в качественных исследованиях. Исследования в области сестринского дела и здравоохранения , 18, 179–183.
  14. ^ Глейзер, Б. (1965). Постоянный сравнительный метод качественного анализа. Социальные проблемы , 12, 436–445.
  15. ^ Фрэнсис, Джилл Дж.; Джонстон, Мари; Робертсон, Клэр; Глайдвелл, Лиз; Энтвистл, Викки; Экклс, Мартин П.; Гримшоу, Джереми М. (2010). «Каков адекватный размер выборки? Оперативное насыщение данных для теоретических интервью-исследований» (PDF) . Психология и здоровье . 25 (10): 1229–1245. дои : 10.1080/08870440903194015 . ПМИД   20204937 . S2CID   28152749 .
  16. ^ Jump up to: Перейти обратно: а б Гость, Грег; Банс, Арвен; Джонсон, Лаура (2006). «Сколько интервью достаточно?». Полевые методы . 18 : 59–82. дои : 10.1177/1525822X05279903 . S2CID   62237589 .
  17. ^ Райт, Адам; Мэлони, Франсин Л.; Фебловиц, Джошуа К. (2011). «Отношение врачей к электронным спискам проблем и их использованию: тематический анализ» . BMC Медицинская информатика и принятие решений . 11:36 . дои : 10.1186/1472-6947-11-36 . ПМК   3120635 . ПМИД   21612639 .
  18. ^ Мейсон, Марк (2010). «Размер выборки и насыщенность аспирантуры с использованием качественных интервью» . Форум Качественного социального обеспечения . 11 (3): 8.
  19. ^ Эммель, Н. (2013). Выборка и выбор случаев в качественных исследованиях: реалистичный подход. Лондон: Сейдж.
  20. ^ Онвуегбузи, Энтони Дж.; Пиявка, Нэнси Л. (2007). «Призыв к качественному анализу мощности». Качество и количество . 41 : 105–121. дои : 10.1007/s11135-005-1098-1 . S2CID   62179911 .
  21. ^ Jump up to: Перейти обратно: а б Фугард AJB; Поттс HWW (10 февраля 2015 г.). «Поддержка размышлений о размерах выборки для тематического анализа: количественный инструмент» (PDF) . Международный журнал методологии социальных исследований . 18 (6): 669–684. дои : 10.1080/13645579.2015.1005453 . S2CID   59047474 .
  22. ^ Гэлвин Р. (2015). Сколько интервью достаточно? Дают ли качественные интервью в ходе исследования энергопотребления в зданиях надежные знания? Журнал строительной техники, 1: 2–12.

Общие ссылки [ править ]

Дальнейшее чтение [ править ]

  • NIST: Выбор размера выборки
  • ASTM E122-07: Стандартная практика расчета размера выборки для оценки с заданной точностью среднего значения характеристики партии или процесса.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5640b7c81956b5521ea3e8c5a0005f6b__1715924580
URL1:https://arc.ask3.ru/arc/aa/56/6b/5640b7c81956b5521ea3e8c5a0005f6b.html
Заголовок, (Title) документа по адресу, URL1:
Sample size determination - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)