Стратифицированная рандомизация

В статистике . стратифицированная рандомизация — это метод выборки , который сначала расслояет всю исследуемую совокупность на подгруппы с одинаковыми атрибутами или характеристиками, известными как страты, а затем следует простая случайная выборка из стратифицированных групп, где каждый элемент в одной и той же подгруппе отбирается беспристрастно на любом этапе процесса отбора проб, случайно и совершенно случайно. [1] [2] Стратифицированная рандомизация считается подразделением стратифицированной выборки и должна применяться, когда общие признаки существуют частично и сильно различаются между подгруппами исследуемой популяции, так что они требуют особого рассмотрения или четкого различия во время выборки. [3] Этот метод выборки следует отличать от кластерной выборки , при которой отбирается простая случайная выборка из нескольких целых кластеров для представления всей совокупности, или от стратифицированной систематической выборки, когда систематическая выборка осуществляется после процесса стратификации.
Шаги по стратифицированной случайной выборке
[ редактировать ]Стратифицированная рандомизация чрезвычайно полезна, когда целевая популяция неоднородна , и эффективно показывает, как изучаемые тенденции или характеристики различаются между группами. [1] При выполнении стратифицированной рандомизации необходимо предпринять следующие 8 шагов: [4]
- Определите целевую группу населения.
- стратификации Определите переменные и решите, сколько страт будет создано. Критерии определения переменных для стратификации включают возраст , социально-экономический статус , национальность , расу , уровень образования и другие и должны соответствовать цели исследования. В идеале следует использовать 4–6 страт, поскольку любое увеличение переменных стратификации повысит вероятность того, что некоторые из них нейтрализуют влияние других переменных.
- Используйте основу выборки для оценки всех элементов целевой совокупности. Впоследствии внесите изменения в зависимости от охвата и группировки.
- Перечислите все элементы и рассмотрите результат выборки. Каждая страта должна быть взаимоисключающей и в сумме охватывать всех членов совокупности, при этом каждый член совокупности должен попадать в уникальную страту вместе с другими членами с минимальными различиями. [4]
- Принимайте решения по критериям отбора случайной выборки. Это можно сделать вручную или с помощью разработанной компьютерной программы.
- Присвойте случайный и уникальный номер всем элементам с последующей сортировкой этих элементов в соответствии с присвоенным им номером.
- Просмотрите размер каждого слоя и численное распределение всех элементов в каждом слое. Определите тип выборки: пропорциональную или непропорциональную стратифицированную выборку.
- Выполните выбранную случайную выборку, как это определено на шаге 5. Как минимум, один элемент должен быть выбран из каждой страты, чтобы окончательная выборка включала представителей из каждой страты. Если выбраны два или более элемента из каждой страты, можно рассчитать погрешность собранных данных.
Стратифицированное случайное распределение
[ редактировать ]Стратифицированная рандомизация может также относиться к случайному назначению лечения субъектам в дополнение к случайной выборке субъектов из популяции, как описано выше.
В этом контексте стратифицированная рандомизация использует один или несколько прогностических факторов для создания подгрупп в среднем со схожими входными характеристиками. Фактор пациента можно точно определить, изучив результаты предыдущих исследований. [5]
Количество подгрупп можно рассчитать путем умножения количества страт для каждого фактора. Факторы измеряются до или во время рандомизации и подопытные делятся на несколько подгрупп или слоев в соответствии с результатами измерений. [6]
Внутри каждой страты можно применять несколько стратегий рандомизации, включая простую рандомизацию , блокированную рандомизацию и минимизацию .
Простая рандомизация внутри слоев
[ редактировать ]Простая рандомизация считается самым простым методом распределения субъектов по каждой страте. Испытуемые распределяются в каждую группу совершенно случайным образом для каждого задания. Несмотря на то, что ее легко провести, простая рандомизация обычно применяется в стратах, содержащих более 100 выборок, поскольку небольшой размер выборки сделает распределение неравным. [6]
Блокировать рандомизацию внутри слоев
[ редактировать ]Блочная рандомизация , иногда называемая рандомизацией перестановочных блоков, применяет блоки для равномерного распределения субъектов из одних и тех же слоев в каждую группу исследования. При рандомизации блоков указываются коэффициент распределения (отношение количества одной конкретной группы к другим группам) и размеры групп. Размер блока должен быть кратен количеству обработок, чтобы образцы в каждом слое можно было отнести к группам обработок с заданным соотношением. [6] Например, в клиническом исследовании рака молочной железы должно быть 4 или 8 слоев, где возраст и статус узлов являются двумя прогностическими факторами, и каждый фактор разделен на два уровня. Различные блоки можно назначать образцам разными способами, включая случайный список и компьютерное программирование. [7] [8]
Блочная рандомизация обычно используется в экспериментах с относительно большим размером выборки, чтобы избежать несбалансированного распределения выборок с важными характеристиками. В некоторых областях со строгими требованиями рандомизации, таких как клинические испытания , распределение будет предсказуемым, если не будет процесса ослепления для проводников и размер блока ограничен. Рандомизация с перестановкой блоков в слоях может привести к дисбалансу выборок между слоями, поскольку количество слоев увеличивается, а размер выборки ограничен. Например, существует вероятность того, что не будет найдена выборка, отвечающая характеристикам определенных слоев. [9]
Метод минимизации
[ редактировать ]Чтобы гарантировать сходство каждой группы лечения, предпринимаются попытки метода «минимизации», который является более прямым, чем случайный перестановочный блок внутри страт. В методе минимизации образцы в каждой страте распределяются по группам лечения на основе суммы образцов в каждой группе лечения, что позволяет сохранять баланс между количеством субъектов в группе. [6] Если суммы для нескольких групп лечения одинаковы, для назначения лечения будет проведена простая рандомизация. На практике метод минимизации требует ежедневного учета назначений лечения с учетом прогностических факторов, что можно эффективно сделать, используя для записи набор учетных карточек. Метод минимизации эффективно позволяет избежать дисбаланса между группами, но включает в себя менее случайный процесс, чем блочная рандомизация, поскольку случайный процесс проводится только тогда, когда суммы лечения одинаковы. Возможным решением является применение дополнительного случайного списка, благодаря которому группы лечения с меньшей суммой предельных сумм имеют более высокий шанс (например, ¾), в то время как другие методы лечения имеют меньший шанс (например, ¼). [10]
Приложение
[ редактировать ]
Стратифицированная случайная выборка полезна и продуктивна в ситуациях, требующих разного взвешивания конкретных страт. Таким образом, исследователи могут манипулировать механизмами отбора из каждой страты, чтобы усилить или минимизировать желаемые характеристики результатов опроса. [11]
Стратифицированная рандомизация полезна, когда исследователи намерены искать связи между двумя или более слоями, поскольку простая случайная выборка увеличивает вероятность неравномерного представительства целевых групп. Это также полезно, когда исследователи хотят устранить факторы, искажающие результаты в наблюдательных исследованиях , поскольку стратифицированная случайная выборка позволяет корректировать ковариации и p значения для получения более точных результатов. [12]
Существует также более высокий уровень статистической точности стратифицированной случайной выборки по сравнению с простой случайной выборкой из-за высокой релевантности элементов, выбранных для представления генеральной совокупности. Различия внутри страт гораздо меньше, чем между стратами. Следовательно, поскольку различия между выборками сводятся к минимуму, стандартное отклонение будет соответственно ужесточено, что приведет к более высокой степени точности и небольшой ошибке в окончательных результатах. Это эффективно уменьшает необходимый размер выборки и повышает экономическую эффективность отбора проб в условиях ограниченного финансирования исследований.
В реальной жизни стратифицированная случайная выборка может применяться к результатам предвыборных опросов, расследованию различий в доходах между социальными группами или измерению возможностей образования в разных странах. [1]
Стратифицированная рандомизация в клинических исследованиях
[ редактировать ]В клинических исследованиях пациенты стратифицируются в соответствии с их социальным и индивидуальным происхождением или любым фактором, имеющим отношение к исследованию, чтобы соответствовать каждой из этих групп внутри всей популяции пациентов. Целью этого является создание баланса клинических/прогностических факторов, поскольку исследования не дадут достоверных результатов, если дизайн исследования не будет сбалансированным. [13] Этап стратифицированной рандомизации чрезвычайно важен как попытка гарантировать, что никакая предвзятость, преднамеренная или случайная, не повлияет на репрезентативность исследуемой выборки пациентов. [14] Это увеличивает мощность исследования, особенно в небольших клинических исследованиях (n<400), поскольку считается, что стратифицированные известные клинические характеристики влияют на результаты вмешательств. [15] Это помогает предотвратить возникновение ошибки I рода , которая высоко ценится в клинических исследованиях. [16] Это также оказывает важное влияние на размер выборки для исследований эквивалентности активного контроля и теоретически облегчает анализ подгрупп и промежуточный анализ . [16]
Преимущество
[ редактировать ]К преимуществам стратифицированной рандомизации относятся:
- Стратифицированная рандомизация может точно отражать результаты общей популяции, поскольку влиятельные факторы применяются для стратификации всей выборки и балансировки жизненно важных характеристик выборки между группами лечения. Например, применение стратифицированной рандомизации для формирования выборки из 100 человек из популяции может гарантировать баланс мужчин и женщин в каждой экспериментальной группе, в то время как использование простой рандомизации может привести к тому, что только 20 мужчин в одной группе и 80 мужчин в другой группе. [6]
- Стратифицированная рандомизация может иметь меньшую дисперсию, чем другие методы выборки, такие как кластерная выборка , простая случайная выборка, систематическая выборка или невероятностные методы, поскольку измерения внутри страт могут иметь более низкое стандартное отклонение . Рандомизация разделенных слоев в некоторых случаях более управляема и дешевле, чем простая рандомизация общих выборок. [10]
- Группу легче обучить стратификации выборки из-за точности характера стратифицированной рандомизации. [6]
- Иногда стратифицированная рандомизация желательна для оценки параметров популяции для групп внутри популяции. [10]
Недостаток
[ редактировать ]К ограничениям стратифицированной рандомизации относятся:
- Стратифицированная рандомизация сначала делит выборки на несколько слоев с учетом прогностических факторов, но возможно, что выборки невозможно разделить. При применении значимость прогностических факторов в некоторых случаях не имеет строгого подтверждения, что может в дальнейшем привести к систематической ошибке. Вот почему потенциал факторов в отношении достижения результата должен быть проверен до того, как факторы будут включены в стратификацию. В некоторых случаях, когда влияние факторов на результат не может быть подтверждено, предлагается нестратифицированная рандомизация. [17]
- Размер подгруппы считается имеющим такое же значение, если имеющиеся данные не могут отражать общую численность подгруппы. В некоторых приложениях размер подгруппы определяется с учетом объема доступных данных, а не масштабирования размеров выборки до размера подгруппы, что может привести к смещению влияния факторов. В некоторых случаях, когда данные необходимо стратифицировать по дисперсиям, дисперсия подгрупп значительно различается, поэтому невозможно гарантировать, что размер выборки каждой подгруппы будет пропорционален общей совокупности подгрупп. [18]
- Будет работать хуже, чем другие методы, если слои выбраны неправильно. В частности, это происходит, если дисперсия внутри страты высока.
- Процесс распределения выборок на подгруппы может включать дублирование, если субъекты соответствуют стандарту включения нескольких слоев, что может привести к искажению данных о совокупности. [18]
См. также
[ редактировать ]- Выборка
- Простая случайная выборка
- Стратифицированная выборка
- Стратификация (клинические исследования)
- Квотная выборка
- Определение размера выборки
- Ошибка выборки
Ссылки
[ редактировать ]- ^ Jump up to: а б с Николас, Стивен (14 июля 2019 г.). «Как работает стратифицированная случайная выборка» . Инвестопедия . Проверено 7 апреля 2020 г.
- ^ «Простая случайная выборка» , Arc.Ask3.Ru , 18 марта 2020 г. , получено 7 апреля 2020 г.
- ^ «Стратифицированная выборка» , Arc.Ask3.Ru , 9 февраля 2020 г. , получено 7 апреля 2020 г.
- ^ Jump up to: а б Стефани (11 декабря 2013 г.). «Стратифицированная случайная выборка: определение, примеры» . Статистика Как сделать . Проверено 7 апреля 2020 г.
- ^ Сильвестр, Ричард (декабрь 1982 г.). «Основы клинических исследований». Контролируемые клинические исследования . 3 (4): 385–386. дои : 10.1016/0197-2456(82)90029-0 . ISSN 0197-2456 .
- ^ Jump up to: а б с д и ж Покок, Стюарт Дж. (1 июля 2013 г.). Клинические испытания: практический подход . John Wiley & Sons Ltd. Чичестер: ISBN 978-1-118-79391-6 . OCLC 894581169 .
- ^ «Запечатанный конверт | Случайные переставленные блоки» . www.sealedenvelope.com . 25 февраля 2020 г. Проверено 7 апреля 2020 г.
- ^ Фридман, Лоуренс М.; Фурберг, Курт Д.; ДеМец, Дэвид Л. (2010), «Введение в клинические испытания», Fundamentals of Clinical Trials , Springer New York, стр. 1–18, doi : 10.1007/978-1-4419-1586-3_1 , ISBN 978-1-4419-1585-6
- ^ Основы клинических исследований . Фридман, Лоуренс М., 1942-, Фурберг, Курт, ДеМец, Дэвид Л., 1944-, Ребуссен, Дэвид, Грейнджер, Кристофер Б. (Пятое изд.). Нью-Йорк. 27 августа 2015 г. ISBN 978-3-319-18539-2 . OCLC 919463985 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) CS1 maint: другие ( ссылка ) - ^ Jump up to: а б с Покок, SJ (март 1979 г.). «Отделение пациентов для лечения в клинических исследованиях». Биометрия . 35 (1): 183–197. дои : 10.2307/2529944 . ISSN 0006-341X . JSTOR 2529944 . ПМИД 497334 .
- ^ Кроссман, Эшли (27 января 2020 г.). «Понимание стратифицированных выборок и способы их создания» . МысльКо . Проверено 7 апреля 2020 г.
- ^ Хеннекенс, Чарльз Х. (1987). Эпидемиология в медицине . Бьюринг, Джули Э., Мэйрент, Шерри Л. (1-е изд.). Бостон, Массачусетс: Литтл, Браун. ISBN 0-316-35636-0 . OCLC 16890223 .
- ^ Полит, Д.Ф.; Бек, Коннектикут (2012). Исследования в области сестринского дела: получение и оценка данных для сестринского дела, 9-е изд . Филадельфия, США: Wolters Klower Health: Lippincott Williams & Wilkins.
- ^ «Стратификация пациентов в клинических исследованиях» . Омиксон | NGS для HLA . 01.12.2014 . Проверено 26 апреля 2020 г.
- ^ Стефани (20 мая 2016 г.). «Стратифицированная рандомизация в клинических исследованиях» . Статистика Как сделать . Проверено 26 апреля 2020 г.
- ^ Jump up to: а б Кернан, В. (январь 1999 г.). «Стратифицированная рандомизация для клинических исследований» . Журнал клинической эпидемиологии . 52 (1): 19–26. дои : 10.1016/S0895-4356(98)00138-3 . ПМИД 9973070 .
- ^ Мерфи, Крис Б. (13 апреля 2019 г.). «Плюсы и минусы стратифицированной случайной выборки» . Инвестопедия . Проверено 7 апреля 2020 г.
- ^ Jump up to: а б Стекло, Энна; Кундт, Гюнтер (2014), Потенциальные преимущества и недостатки стратификации в методах рандомизации , Springer Proceedings in Mathematics & Статистика, vol. 114, Springer New York, стр. 239–246, doi : 10.1007/978-1-4939-2104-1_23 , ISBN. 978-1-4939-2103-4