Jump to content

Блокировка (статистика)

В статистической теории планирования экспериментов блокирование это объединение экспериментальных единиц схожих друг с другом в группы (блоки) на основе одной или нескольких переменных. Эти переменные выбираются тщательно, чтобы минимизировать влияние их изменчивости на наблюдаемые результаты. Существуют разные способы реализации блокировки, что приводит к различным мешающим эффектам. Однако разные методы преследуют одну и ту же цель: контролировать изменчивость, вызванную конкретными факторами, которые могут повлиять на результат эксперимента. Корни блокировки возникли у статистика Рональда Фишера после его разработки ANOVA . [1]

Использование блокировки в экспериментальном дизайне имеет развивающуюся историю, охватывающую множество дисциплин. Основополагающие концепции блокировки зародились в начале 20-го века такими статистиками, как Рональд А. Фишер . Его работа по разработке дисперсионного анализа (ANOVA) заложила основу для группировки экспериментальных единиц для контроля посторонних переменных. Блокирование развивалось с годами, что привело к формализации структур рандомизированных блоков и конструкций латинских квадратов . [1] Сегодня блокировка по-прежнему играет ключевую роль в разработке экспериментов, а в последние годы достижения в области статистического программного обеспечения и вычислительных возможностей позволили исследователям изучить более сложные схемы блокировки.

Использовать

[ редактировать ]

Блокировка уменьшает необъяснимую изменчивость. Его принцип заключается в том, что изменчивость, которую невозможно преодолеть (например, потребность в двух партиях сырья для производства одного контейнера с химическим веществом), смешивается или смешивается с взаимодействием (n) (высшего/высшего порядка), чтобы исключить его влияние на конечный продукт. [2] высокого порядка Взаимодействия обычно имеют наименьшее значение (подумайте о том, что температура реактора или партии сырья более важна, чем их комбинация – это особенно верно, когда больше (3, 4, ...) факторы присутствуют); поэтому предпочтительнее путать эту изменчивость с более высоким взаимодействием. [2]

  • Мужчина и женщина : Эксперимент предназначен для испытания нового препарата на пациентах. Существует два уровня лечения: препарат и плацебо , которые назначаются пациентам мужского и женского пола в ходе двойного слепого исследования. Пол пациента является блокирующим фактором, объясняющим вариабельность лечения между мужчинами и женщинами . Это уменьшает источники изменчивости и, таким образом, приводит к большей точности.
  • Высота : Эксперимент предназначен для проверки воздействия нового пестицида на определенный участок травы. Область травы содержит значительные перепады высот и, таким образом, состоит из двух отдельных областей: «высокая высота» и «низкая высота». Группа обработки (новый пестицид) и группа плацебо применяются как к высокогорным, так и к низинным участкам травы. В этом случае исследователь блокирует коэффициент повышения, который может учитывать изменчивость применения пестицидов.
  • Вмешательство : Предположим, изобретен процесс, призванный продлить срок службы подошв обуви, и составлен план проведения полевых испытаний. Учитывая группу из n добровольцев, одним из возможных вариантов может быть предоставление n /2 из них обуви с новой подошвой и n /2 обуви с обычной подошвой, рандомизируя распределение двух типов подошв. Этот тип эксперимента представляет собой полностью рандомизированный план . Затем обе группы просят некоторое время походить в обуви, а затем измерить степень износа подошвы. Это осуществимый экспериментальный план, но чисто с точки зрения статистической точности (игнорируя любые другие факторы), лучшим вариантом было бы дать каждому человеку одну обычную подошву и одну новую подошву, случайным образом распределяя два типа слева и справа. правый ботинок каждого добровольца. Такая конструкция называется «рандомизированной полной блочной конструкцией ». Этот план будет более чувствительным, чем первый, поскольку каждый человек действует как собственный контроль и, следовательно, как контрольная группа. более точно соответствует дизайну лечебной группы блока

Неприятные переменные

[ редактировать ]
Влияние мешающей переменной на переменную ответа
Влияние переменной беспокойства (пола) на переменную ответа (потеря веса)

В приведенных выше примерах мешающая переменная — это переменная, которая не является основной целью исследования, но может повлиять на результаты эксперимента. [3] Они считаются потенциальными источниками изменчивости, которые, если их не контролировать и не учитывать, могут затруднить интерпретацию независимых и зависимых переменных .

Чтобы устранить неприятные переменные, исследователи могут использовать различные методы, такие как блокировка или рандомизация. Блокировка предполагает группировку экспериментальных единиц на основе уровней мешающей переменной для контроля ее влияния. Рандомизация помогает равномерно распределить эффекты мешающих переменных по группам лечения.

Используя один из этих методов для учета мешающих переменных, исследователи могут повысить внутреннюю достоверность своих экспериментов, гарантируя, что наблюдаемые эффекты с большей вероятностью будут связаны с манипулируемыми переменными, а не с внешними влияниями.

В первом примере, приведенном выше, пол пациента будет мешающей переменной. Например, предположим, что препарат был таблеткой для похудения, и исследователи хотели проверить влияние таблеток для похудения на потерю веса. Объясняющая переменная — это таблетка для похудения, а переменная отклика — величина потери веса. Хотя пол пациента не является основным предметом эксперимента (а именно эффект препарата), вполне возможно, что пол человека повлияет на количество потерянного веса.

Блокировка используется для мешающих факторов, которыми можно управлять.

[ редактировать ]

В статистической теории планирования эксперимента блокирование — это расположение экспериментальных единиц в группах (блоках), сходных между собой. Обычно блокирующий фактор является источником изменчивости , который не представляет основного интереса для экспериментатора. [3] [4]

Экспериментальный дизайн без блокировки (слева) и блокировки (справа)

При изучении теории вероятностей метод блоков заключается в разбиении выборки на блоки (группы), разделенные более мелкими подблоками, так что блоки можно считать практически независимыми. [5] Метод блоков помогает доказывать предельные теоремы в случае зависимых случайных величин.

Метод блоков был введен С. Бернштейном : [6] Метод успешно применялся в теории сумм зависимых случайных величин и в теории экстремальных значений . [7] [8] [9]

Без блокировок: таблетки для похудения vs плацебо в похудении

В нашем предыдущем примере с таблетками для похудения блокирующим фактором мог быть пол пациента. Мы могли бы поместить людей в один из двух блоков (мужской или женский). И в рамках каждого из двух блоков мы можем случайным образом назначить пациентов либо на таблетки для похудения (лечение), либо на таблетки плацебо (контроль). Блокируя секс, этот источник изменчивости контролируется, что приводит к более полной интерпретации того, как таблетки для похудения влияют на потерю веса.

С блокировкой: таблетки для похудения против плацебо в похудении

Определение блокирующих факторов

[ редактировать ]

Мешающий фактор используется в качестве блокирующего фактора, если каждый уровень основного фактора встречается одинаковое количество раз с каждым уровнем мешающего фактора. [3] Анализ эксперимента будет сосредоточен на влиянии различных уровней основного фактора в каждом блоке эксперимента.

Блокируйте несколько наиболее важных мешающих факторов

[ редактировать ]

Общее правило таково:

«Блокируйте то, что можете; рандомизируйте то, что не можете». [3]

Блокировка используется для устранения влияния некоторых наиболее важных мешающих переменных. Затем используется рандомизация, чтобы уменьшить влияние оставшихся мешающих переменных. Для важных переменных, вызывающих беспокойство, блокировка даст более высокую значимость интересующих переменных, чем рандомизация. [10]

Выполнение

[ редактировать ]

Внедрение блокировки в экспериментальный дизайн включает в себя ряд шагов для эффективного контроля посторонних переменных и повышения точности оценок эффекта лечения.

Определите мешающие переменные

[ редактировать ]

Определите потенциальные факторы, которые не являются основным предметом исследования, но могут привести к изменчивости.

Выберите подходящие факторы блокировки

[ редактировать ]

Тщательно выбирайте блокирующие факторы, исходя из их значимости для исследования, а также их способности искажать основные представляющие интерес факторы. [11]

Определить размеры блоков

[ редактировать ]

Разделение эксперимента определенного размера на определенное количество блоков имеет последствия, поскольку количество блоков определяет количество смешанных эффектов. [12]

Назначьте обработки блокам

[ редактировать ]

Вы можете случайным образом распределить экспериментальные единицы по условиям лечения в каждом блоке, что может помочь гарантировать, что любая неучтенная изменчивость будет равномерно распределена по группам лечения. Однако в зависимости от того, как вы назначаете лечение блокам, вы можете получить разное количество смешанных эффектов. [4] Таким образом, можно выбрать количество, а также то, какие конкретные эффекты будут смешиваться, а это означает, что назначение лечения блокам лучше, чем случайное назначение . [4]

Репликация

[ редактировать ]

Запуская разный дизайн для каждой реплики , где каждый раз смешиваются разные эффекты, эффекты взаимодействия частично смешиваются, вместо того, чтобы полностью жертвовать одним отдельным эффектом. [4] Повторение повышает надежность результатов и позволяет более надежно оценить эффект лечения. [12]

Один из полезных способов рассмотрения рандомизированного блочного эксперимента — рассматривать его как совокупность полностью рандомизированных экспериментов, каждый из которых проводится в пределах одного из блоков общего эксперимента. [3]

Рандомизированные блочные конструкции (RBD)
Название дизайна Количество факторов k Количество запусков n
2-факторный RBD 2 Л 1 * Л 2
3-факторный RBD 3 Л1 * Л2 2 * LЛ3
4-факторный RBD 4 Л1 * Л2 2 * Л3 3 * LЛ4
k -фактор RBD к Л 1 * Л 2 * * Л к

с

L 1 = количество уровней (настроек) коэффициента 1
L 2 = количество уровней (настроек) коэффициента 2
L 3 = количество уровней (настроек) коэффициента 3
L 4 = количество уровней (настроек) коэффициента 4
L k = количество уровней (настроек) коэффициента k

Предположим, инженеры предприятия по производству полупроводников хотят проверить, оказывают ли различные дозы материала имплантата на пластины существенное влияние на измерения удельного сопротивления после процесса диффузии, происходящего в печи. У них есть четыре разные дозировки, которые они хотят попробовать, и достаточное количество экспериментальных пластин из одной партии, чтобы использовать по три пластины с каждой дозировкой.

Неприятным фактором, который их беспокоит, является «работа печи», поскольку известно, что каждая работа печи отличается от предыдущей и влияет на многие параметры процесса.

Идеальный способ провести этот эксперимент — запустить все пластины 4x3=12 в одной печи. Это полностью устранило бы неприятный фактор печи. Тем не менее, обычные производственные пластины имеют приоритет в печи, и только несколько экспериментальных пластин могут быть загружены в печь одновременно.

Неблокируемый способ проведения этого эксперимента — запустить каждую из двенадцати экспериментальных пластин в случайном порядке, по одной на каждый проход печи. Это увеличило бы экспериментальную ошибку каждого измерения удельного сопротивления из-за изменчивости печи от пробега к проходу и затруднило бы изучение влияния различных дозировок. Блокированный способ провести этот эксперимент, предполагая, что вы можете убедить производство позволить вам поместить в печь четыре экспериментальные пластины, состоит в том, чтобы поместить четыре пластины с разными дозировками в каждый из трех циклов печи. Единственной рандомизацией будет выбор того, какая из трех пластин с дозировкой 1 пойдет в печь 1, и аналогично для пластин с дозировкой 2, 3 и 4.

Описание эксперимента

[ редактировать ]

Пусть X 1 будет «уровнем» дозировки, а X 2 будет коэффициентом блокировки при работе печи. Тогда эксперимент можно описать следующим образом:

k = 2 фактора (1 основной фактор X 1 и 1 блокирующий фактор X 2 )
L 1 = 4 уровня фактора X 1
L 2 = 3 уровня фактора X 2
n = 1 репликация на ячейку
N = L 1 * L 2 = 4 * 3 = 12 прогонов

До рандомизации дизайн-испытания выглядят следующим образом:

х 1 х 2
1 1
1 2
1 3
2 1
2 2
2 3
3 1
3 2
3 3
4 1
4 2
4 3

Матричное представление

[ редактировать ]

Альтернативным способом суммирования проектных испытаний было бы использование матрицы 4x3, 4 строки которой представляют собой уровни лечения X 1 , а столбцы — 3 уровня блокирующей переменной X 2 . Ячейки в матрице имеют индексы, соответствующие комбинациям X 1 , X 2 выше.

Уход Блок 1 Блок 2 Блок 3
1 1 1 1
2 1 1 1
3 1 1 1
4 1 1 1

В более широком смысле, обратите внимание, что испытания для любого плана рандомизированного блока с K-фактором представляют собой просто индексы ячеек k- мерной матрицы.

Модель рандомизированного блочного дизайна с одной мешающей переменной:

где

Y ij — любое наблюдение, для которого X 1 = i и X 2 = j
X 1 является основным фактором
X 2 – коэффициент блокировки
μ — общий параметр местоположения (т. е. среднее значение)
T i — эффект лечения i (фактора X 1 )
B j — эффект от пребывания в блоке j (коэффициент X 2 )
Оценка для μ : = среднее значение всех данных
Оценка для T i : с = среднее значение всех Y , для которых X 1 = i .
Оценка Bj : для с = среднее значение всех Y , для которых X 2 = j .

Обобщения

[ редактировать ]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Коробка, Джоан Фишер (1980). «РА Фишер и план экспериментов, 1922-1926» . Американский статистик . 34 (1): 1–7. дои : 10.2307/2682986 . ISSN   0003-1305 . JSTOR   2682986 .
  2. ^ Jump up to: а б «5.3.3.3.3. Блокировка полных факторных планов» . www.itl.nist.gov . Проверено 11 декабря 2023 г.
  3. ^ Jump up to: а б с д и «5.3.3.2. Рандомизированные блочные конструкции» . www.itl.nist.gov . Проверено 11 декабря 2023 г.
  4. ^ Jump up to: а б с д Бергер, Пол Д.; Маурер, Роберт Э.; Челли, Джована Б. (2018). Экспериментальный дизайн . дои : 10.1007/978-3-319-64583-4 . ISBN  978-3-319-64582-7 .
  5. ^ «Рандомизированный блочный дизайн» , Краткая энциклопедия статистики , Нью-Йорк, штат Нью-Йорк: Springer, 2008, стр. 447–448, doi : 10.1007/978-0-387-32833-1_344 , ISBN  978-0-387-32833-1 , получено 11 декабря 2023 г.
  6. ^ Бернштейн С. Н. (1926) О распространении предельной теоремы исчисления вероятностей на суммы зависимых величин. Математика. Аннален, гр. 97, 1–59.
  7. ^ Ибрагимов И.А. и Линник Ю.В. (1971) Независимые и стационарные последовательности случайных величин. Вольтерс-Нордхофф, Гронинген.
  8. ^ Ледбеттер М.Р., Линдгрен Г. и Руцен Х. (1983) Экстремумы и связанные с ними свойства случайных последовательностей и процессов. Нью-Йорк: Springer Verlag.
  9. ^ Новак С.Ю. (2011) Методы экстремальной стоимости с применением в финансах. Чепмен и Холл/CRC Press, Лондон.
  10. ^ Кармакар, Бийкрам (ноябрь 2022 г.). «Аппроксимационный алгоритм блокировки экспериментальной конструкции» : 1726–1750. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  11. ^ Пэшли, Николь Э.; Миратрикс, Люк В. (7 июля 2021 г.). «Блокируйте все, что можете, кроме тех случаев, когда не следует» . Журнал образовательной и поведенческой статистики . 47 (1): 69–100. arXiv : 2010.14078 . дои : 10.3102/10769986211027240 . ISSN   1076-9986 .
  12. ^ Jump up to: а б Ледольтер, Йоханнес; Кардон, Рэнди Х. (9 июля 2020 г.). «Фокус на данных: статистическое планирование экспериментов и выбор размера выборки с использованием энергетического анализа» . Исследовательская офтальмология и визуальные науки . 61 (8): 11. doi : 10.1167/iovs.61.8.11 . ISSN   0146-0404 . ПМЦ   7425741 . ПМИД   32645134 .

Библиография

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8b6efa20658473112be7d7d00e01a770__1719388440
URL1:https://arc.ask3.ru/arc/aa/8b/70/8b6efa20658473112be7d7d00e01a770.html
Заголовок, (Title) документа по адресу, URL1:
Blocking (statistics) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)