Планирование экспериментов

План экспериментов ( DOE или DOX ), также известный как план эксперимента или план эксперимента , — это план любой задачи, целью которой является описание и объяснение изменения информации в условиях, которые, как предполагается, отражают это изменение. Этот термин обычно ассоциируется с экспериментами , в которых план вводит условия, которые непосредственно влияют на вариацию, но может также относиться к плану квазиэкспериментов , в которых естественные для наблюдения выбираются условия, влияющие на вариацию.

В своей простейшей форме эксперимент направлен на предсказание результата путем внесения изменения в предварительные условия, которые представлены одной или несколькими независимыми переменными , также называемыми «входными переменными» или «переменными-предикторами». Обычно предполагается, что изменение одной или нескольких независимых переменных приведет к изменению одной или нескольких зависимых переменных , также называемых «выходными переменными» или «переменными отклика». В плане эксперимента можно также определить контрольные переменные , которые необходимо поддерживать постоянными, чтобы внешние факторы не влияли на результаты. Планирование эксперимента включает не только выбор подходящих независимых, зависимых и контрольных переменных, но и планирование проведения эксперимента в статистически оптимальных условиях с учетом ограничений доступных ресурсов. Существует несколько подходов к определению набора расчетных точек (уникальных комбинаций настроек независимых переменных), которые будут использоваться в эксперименте.

Основные проблемы при планировании экспериментов включают установление достоверности , надежности и воспроизводимости . Например, эти проблемы можно частично решить, тщательно выбрав независимую переменную, уменьшив риск ошибки измерения и обеспечив достаточно подробную документацию метода. Связанные с этим проблемы включают достижение соответствующего уровня статистической мощности и чувствительности .

Правильно спланированные эксперименты расширяют знания в области естественных, социальных наук и техники, а методология разработки экспериментов признана ключевым инструментом в успешной реализации структуры «Качество через дизайн » (QbD). ^[1] Другие приложения включают маркетинг и разработку политики. Изучение планирования экспериментов является важной темой метанауки .

История

Статистические эксперименты по Чарльзу С. Пирсу

Теория статистического вывода была развита Чарльзом С. Пирсом в « Иллюстрациях логики науки » (1877–1878). ^[2] и « Теория вероятного вывода » (1883 г.), ^[3] две публикации, в которых подчеркивалась важность выводов на основе рандомизации в статистике. ^[4]

Рандомизированные эксперименты

Чарльз С. Пирс случайным образом распределил добровольцев на слепое чтобы исследование с повторными измерениями, оценить их способность различать вес. ^[5]^[6]^[7]^[8]Эксперимент Пирса вдохновил других исследователей в области психологии и образования, которые в 1800-х годах развили исследовательскую традицию рандомизированных экспериментов в лабораториях и специализированных учебниках. ^[5]^[6]^[7]^[8]

Оптимальные планы для регрессионных моделей

Чарльз С. Пирс также опубликовал первую англоязычную публикацию об оптимальном дизайне регрессионных . моделей в 1876 году ^[9] Новаторский оптимальный план полиномиальной регрессии был предложен Жергонном в 1815 году. В 1918 году Кирстин Смит опубликовала оптимальные планы для полиномов шестой степени (и меньше). ^[10]^[11]

Последовательность экспериментов

Использование последовательности экспериментов, где план каждого из них может зависеть от результатов предыдущих экспериментов, включая возможное решение о прекращении экспериментов, находится в рамках последовательного анализа , области, которая была впервые разработана. ^[12] в Абрахамом Вальдом контексте последовательной проверки статистических гипотез. ^[13] Герман Чернофф написал обзор оптимальных последовательных проектов. ^[14] в то время как адаптивный дизайн был исследован С. Заксом. ^[15] Одним из конкретных типов последовательной конструкции является «двурукий бандит», обобщенный до многорукого бандита , ранняя работа над которым была проведена Гербертом Роббинсом в 1952 году. ^[16]

Принципы Фишера

Методику планирования экспериментов предложил Рональд Фишер в своих новаторских книгах: «Планирование полевых экспериментов» (1926) и «План экспериментов» (1935). Большая часть его новаторской работы была связана с применением статистических методов в сельском хозяйстве. В качестве обыденного примера он описал, как проверить о том, что женщина пробует чай гипотезу : некая женщина могла отличить только по вкусу, было ли сначала помещено в чашку молоко или чай. Эти методы нашли широкое применение в биологических, психологических и сельскохозяйственных исследованиях. ^[17]

Сравнение: В некоторых областях исследований невозможно провести независимые измерения в соответствии с прослеживаемым метрологическим стандартом . Сравнение методов лечения гораздо более ценно и обычно предпочтительнее, и часто сравнивается с научным контролем или традиционным лечением, которое действует в качестве базового уровня.

Рандомизация: Случайное распределение — это процесс случайного распределения людей по группам или разным группам в эксперименте, так что каждый человек из популяции имеет одинаковые шансы стать участником исследования. Случайное распределение людей по группам (или условиям внутри группы) отличает строгий «настоящий» эксперимент от наблюдательного исследования или «квазиэксперимента». ^[18] Существует обширная математическая теория, которая исследует последствия распределения единиц лечения с помощью какого-либо случайного механизма (например, таблиц случайных чисел или использования устройств рандомизации, таких как игральные карты или игральные кости). Случайное назначение единиц лечения имеет тенденцию смягчать смешивание , в результате чего эффекты, вызванные факторами, отличными от лечения, кажутся результатом лечения.

Риски, связанные со случайным распределением (например, серьезный дисбаланс ключевой характеристики между экспериментальной группой и контрольной группой), поддаются расчету и, следовательно, могут быть снижены до приемлемого уровня путем использования достаточного количества экспериментальных единиц. Однако если популяция разделена на несколько субпопуляций, которые каким-то образом различаются, и исследование требует, чтобы каждая субпопуляция была одинаковой по размеру, можно использовать стратифицированную выборку. Таким образом, рандомизируются единицы в каждой субпопуляции, а не вся выборка. Результаты эксперимента можно надежно обобщить с экспериментальных единиц на более крупную статистическую совокупность единиц только в том случае, если экспериментальные единицы представляют собой случайную выборку из более крупной совокупности; вероятная ошибка такой экстраполяции зависит, среди прочего, от размера выборки.

Статистическая репликация: Измерения обычно подвержены изменениям и неопределенности измерений ; таким образом, они повторяются и воспроизводятся полные эксперименты, чтобы помочь выявить источники вариаций, лучше оценить истинные эффекты лечения, еще больше повысить надежность и достоверность эксперимента, а также расширить существующие знания по этой теме. ^[19] Однако перед началом репликации эксперимента должны быть выполнены определенные условия: исходный вопрос исследования был опубликован в рецензируемом журнале или широко цитировался, исследователь независим от исходного эксперимента, исследователь должен сначала попытаться воспроизвести оригинальные результаты с использованием исходных данных, и в описании должно быть указано, что проведенное исследование является повторным исследованием, в котором пытались максимально строго следовать исходному исследованию. ^[20]

Блокировка: Блокировка (справа)
Блокирование – это неслучайное расположение экспериментальных единиц в группы (блоки), состоящие из единиц, схожих между собой. Блокирование уменьшает количество известных, но нерелевантных источников различий между единицами и, таким образом, позволяет повысить точность оценки источника изучаемых различий.




Ортогональность

Ортогональность касается форм сравнения (контрасты), которые могут быть законно и эффективно проведены. Контрасты могут быть представлены векторами, а наборы ортогональных контрастов некоррелированы и независимо распределены, если данные нормальные. Из-за этой независимости каждое ортогональное лечение предоставляет различную информацию другим. Если есть Т- обработки и ортогональные контрасты Т -1, вся информация, которую можно получить в ходе эксперимента, можно получить из набора контрастов.

Многофакторные эксперименты: Использование многофакторных экспериментов вместо однофакторного метода. Они эффективны при оценке эффектов и возможных взаимодействий нескольких факторов (независимых переменных). Анализ планирования эксперимента построен на основе дисперсионного анализа — набора моделей, которые разделяют наблюдаемую дисперсию на компоненты в зависимости от того, какие факторы эксперимент должен оценить или проверить.

Пример

Этот пример дизайнерских экспериментов приписывается Гарольду Хотеллингу , основанному на примерах Фрэнка Йейтса . ^[21]^[22]^[14] Эксперименты, разработанные в этом примере, включают в себя комбинаторные планы . ^[23]

Вес восьми предметов измеряется с помощью чашечных весов и набора эталонных гирь. При каждом взвешивании измеряется разница в весе между объектами в левой чашке и любыми объектами в правой чашке путем добавления калиброванных гирь к более легкой чашке до тех пор, пока весы не придут в равновесие. Каждое измерение имеет случайную погрешность . Средняя ошибка равна нулю; стандартные отклонения распределения вероятностей ошибок - одно и то же число σ при разных взвешиваниях; ошибки при разных взвешиваниях независимы . Обозначим истинные веса через

\theta _{1},\dots ,\theta _{8}.\,

Мы рассмотрим два разных эксперимента:

Взвесьте каждый предмет на одной чашке, оставив другую пустой. Пусть X _i будет измеренным весом объекта для i = 1,..., 8.
Выполните восемь взвешиваний в соответствии со следующим графиком — матрицей взвешивания :

{\begin{array}{lcc}&{\text{left pan}}&{\text{right pan}}\\\hline {\text{1st weighing:}}&1\ 2\ 3\ 4\ 5\ 6\ 7\ 8&{\text{(empty)}}\\{\text{2nd:}}&1\ 2\ 3\ 8\ &4\ 5\ 6\ 7\\{\text{3rd:}}&1\ 4\ 5\ 8\ &2\ 3\ 6\ 7\\{\text{4th:}}&1\ 6\ 7\ 8\ &2\ 3\ 4\ 5\\{\text{5th:}}&2\ 4\ 6\ 8\ &1\ 3\ 5\ 7\\{\text{6th:}}&2\ 5\ 7\ 8\ &1\ 3\ 4\ 6\\{\text{7th:}}&3\ 4\ 7\ 8\ &1\ 2\ 5\ 6\\{\text{8th:}}&3\ 5\ 6\ 8\ &1\ 2\ 4\ 7\end{array}}

Пусть Y _i — измеренная разность для i = 1,..., 8. Тогда оценочное значение веса θ ₁ равно

{\widehat {\theta }}_{1}={\frac {Y_{1}+Y_{2}+Y_{3}+Y_{4}-Y_{5}-Y_{6}-Y_{7}-Y_{8}}{8}}.

Аналогичные оценки можно найти и для веса других предметов:

{\begin{aligned}{\widehat {\theta }}_{2}&={\frac {Y_{1}+Y_{2}-Y_{3}-Y_{4}+Y_{5}+Y_{6}-Y_{7}-Y_{8}}{8}}.\\[5pt]{\widehat {\theta }}_{3}&={\frac {Y_{1}+Y_{2}-Y_{3}-Y_{4}-Y_{5}-Y_{6}+Y_{7}+Y_{8}}{8}}.\\[5pt]{\widehat {\theta }}_{4}&={\frac {Y_{1}-Y_{2}+Y_{3}-Y_{4}+Y_{5}-Y_{6}+Y_{7}-Y_{8}}{8}}.\\[5pt]{\widehat {\theta }}_{5}&={\frac {Y_{1}-Y_{2}+Y_{3}-Y_{4}-Y_{5}+Y_{6}-Y_{7}+Y_{8}}{8}}.\\[5pt]{\widehat {\theta }}_{6}&={\frac {Y_{1}-Y_{2}-Y_{3}+Y_{4}+Y_{5}-Y_{6}-Y_{7}+Y_{8}}{8}}.\\[5pt]{\widehat {\theta }}_{7}&={\frac {Y_{1}-Y_{2}-Y_{3}+Y_{4}-Y_{5}+Y_{6}+Y_{7}-Y_{8}}{8}}.\\[5pt]{\widehat {\theta }}_{8}&={\frac {Y_{1}+Y_{2}+Y_{3}+Y_{4}+Y_{5}+Y_{6}+Y_{7}+Y_{8}}{8}}.\end{aligned}}

Вопрос планирования эксперимента заключается в следующем: какой эксперимент лучше?

оценки X ₁ θ 1 _равна σ Дисперсия ² если мы воспользуемся первым экспериментом. Но если мы воспользуемся вторым экспериментом, дисперсия приведенной выше оценки составит σ ²/8. Таким образом, второй эксперимент дает нам в 8 раз большую точность оценки одного элемента и оценивает все элементы одновременно с той же точностью. То, что достигается во втором эксперименте с восемью предметами, потребует 64 взвешиваний, если предметы взвешиваются отдельно. Однако обратите внимание, что оценки предметов, полученные во втором эксперименте, имеют ошибки, коррелирующие друг с другом.

Многие проблемы планирования экспериментов связаны с комбинаторными планами , как в этом примере и других. ^[23]

Как избежать ложных срабатываний

Ложноположительные выводы, часто возникающие в результате давления с целью публикации или предвзятости автора в подтверждении , представляют собой неотъемлемую опасность во многих областях. ^[24]

Использование двойного слепого дизайна может предотвратить систематические ошибки , которые могут привести к ложноположительным результатам на этапе сбора данных . При использовании двойного слепого метода участников случайным образом распределяют по экспериментальным группам, но исследователь не знает, какие участники к какой группе принадлежат. Следовательно, исследователь не может повлиять на реакцию участников на вмешательство. ^[25]

Экспериментальные конструкции с неизвестными степенями свободы ^{[ жаргон ]} являются проблемой, ^[26] в том, что они могут привести к сознательному или неосознанному « п-хакингу »: пробовать несколько вещей, пока не получите желаемый результат. Обычно это включает в себя манипулирование – возможно, неосознанное – процессом статистического анализа и степенями свободы до тех пор, пока они не вернутся к значению ниже p<0,05 уровня статистической значимости . ^[27]^[28]

P-хакинг можно предотвратить путем предварительной регистрации исследований, при которой исследователи должны отправить свой план анализа данных в журнал, в котором они хотят опубликовать свою статью, еще до того, как они начнут сбор данных, поэтому никакие манипуляции с данными невозможны. ^[29]^[30]

Другой способ предотвратить это — использовать двойной слепой дизайн на этапе анализа данных, сделав исследование тройным слепым, когда данные отправляются аналитику данных, не имеющему отношения к исследованию, который шифрует данные, чтобы не было возможности чтобы знать, к каким участникам принадлежат, прежде чем они потенциально будут исключены как выбросы. ^[25]

Четкая и полная документация экспериментальной методологии также важна для поддержки воспроизведения результатов . ^[31]

Темы для обсуждения при постановке экспериментальной конструкции

План эксперимента или рандомизированное клиническое исследование требует тщательного рассмотрения нескольких факторов перед фактическим проведением эксперимента. ^[32] План эксперимента — это составление подробного плана эксперимента перед его проведением. Некоторые из следующих тем уже обсуждались в разделе «Принципы планирования эксперимента»:

Сколько факторов имеет проект, и являются ли уровни этих факторов фиксированными или случайными?
Нужны ли условия контроля и какими они должны быть?
Проверка манипуляции: действительно ли манипуляция сработала?
Каковы фоновые переменные?
Каков размер выборки? Сколько единиц необходимо собрать, чтобы эксперимент был обобщаемым и имел достаточную мощность ?
Какова значимость взаимодействия между факторами?
Каково влияние отсроченных эффектов существенных факторов на результаты?
Как изменения в ответах влияют на показатели самоотчета?
Насколько осуществимо повторное использование одних и тех же измерительных приборов в одних и тех же учреждениях в разное время с пост-тестом и последующими тестами?
А как насчет использования предварительного тестирования прокси?
Есть ли скрытые переменные ?
Должен ли клиент/пациент, исследователь или даже аналитик данных быть слеп к условиям?
Какова целесообразность последующего применения разных условий к одним и тем же единицам?
Сколько факторов управления и шума следует принимать во внимание?

Независимая переменная исследования часто имеет много уровней или разные группы. В настоящем эксперименте исследователи могут иметь экспериментальную группу, в которой реализуется их интервенционная проверка гипотезы, и контрольную группу, которая имеет все те же элементы, что и экспериментальная группа, но без интервенционного элемента. Таким образом, когда все остальное, за исключением одного вмешательства, остается неизменным, исследователи могут с некоторой уверенностью подтвердить, что именно этот элемент и вызвал наблюдаемое изменение. В некоторых случаях наличие контрольной группы неэтично. Иногда эту проблему решают с использованием двух разных экспериментальных групп. В некоторых случаях независимыми переменными невозможно манипулировать, например, при проверке разницы между двумя группами, страдающими разными заболеваниями, или при проверке разницы между полами (очевидно, это переменные, к которым было бы сложно или неэтично отнести участников). В таких случаях можно использовать квазиэкспериментальный план.

Причинно-следственные связи

В чистом плане эксперимента исследователь манипулирует независимой (прогностической) переменной, то есть каждый участник исследования выбирается случайным образом из совокупности, и каждому выбранному участнику случайным образом назначаются условия независимой переменной. Только когда это будет сделано, можно с высокой вероятностью подтвердить, что причина различий в переменных результата вызвана разными условиями. Поэтому исследователям следует, когда это возможно, отдавать предпочтение экспериментальному плану перед другими типами планов. Однако природа независимой переменной не всегда позволяет манипулировать ею. В таких случаях исследователи должны помнить о том, что нельзя подтверждать причинную атрибуцию, если их конструкция этого не позволяет. Например, в планах наблюдения участники не распределяются по условиям случайным образом, и поэтому, если есть различия, обнаруженные в переменных результата между условиями, вполне вероятно, что существует что-то иное, чем различия между условиями, что вызывает различия в результатах, что is – третья переменная. То же самое касается исследований с корреляционным дизайном (Adér & Mellenbergh, 2008).

Статистический контроль

Лучше всего, чтобы процесс находился под разумным статистическим контролем до проведения запланированных экспериментов. Когда это невозможно, правильное блокирование, репликация и рандомизация позволяют тщательно провести запланированные эксперименты. ^[33]Чтобы контролировать неприятные переменные, исследователи в качестве дополнительных мер вводят контрольные проверки . Исследователи должны гарантировать, что неконтролируемые воздействия (например, восприятие достоверности источника) не искажают результаты исследования. Проверка манипуляции является одним из примеров контрольной проверки. Проверки манипулирования позволяют исследователям изолировать основные переменные, чтобы усилить подтверждение того, что эти переменные работают по плану.

Одним из наиболее важных требований к планированию экспериментальных исследований является необходимость устранения влияния ложных , промежуточных и предшествующих переменных . В самой базовой модели причина (X) приводит к следствию (Y). Но может быть третья переменная (Z), которая влияет на (Y), а X может вообще не быть истинной причиной. Говорят, что Z является ложной переменной и ее необходимо контролировать. То же самое верно для промежуточных переменных (переменная между предполагаемой причиной (X) и следствием (Y)), а также предшествующих переменных (переменная, предшествующая предполагаемой причине (X), которая является истинной причиной). Когда задействована третья переменная, но она не контролируется, отношение называется отношением нулевого порядка . В большинстве практических применений экспериментальных исследований существует несколько причин (X1, X2, X3). В большинстве проектов одновременно манипулируют только одной из этих причин.

Экспериментальные разработки по Фишеру

Некоторые эффективные схемы оценки нескольких основных эффектов были независимо и почти последовательно найдены Раджем Чандрой Босом и К. Кишеном в 1940 году в Индийском статистическом институте , но оставались малоизвестными до тех пор, пока планы Плакетта-Бермана не были опубликованы в журнале Biometrika в 1946 году. В то же время Ч.Р. Рао представил концепцию ортогональных массивов в качестве экспериментального проекта. Эта концепция сыграла центральную роль в разработке методов Тагучи Геничи Тагучи , которая произошла во время его визита в Индийский статистический институт в начале 1950-х годов. Его методы были успешно применены и приняты промышленными предприятиями Японии и Индии, а затем, хотя и с некоторыми оговорками, были приняты промышленностью США.

В 1950 году Гертруда Мэри Кокс и Уильям Джеммел Кокран опубликовали книгу «Экспериментальные планы», которая на долгие годы стала основным справочником по планированию экспериментов для статистиков.

Развитие теории линейных моделей охватило и превзошло те случаи, которые касались ранних авторов. Сегодня теория опирается на продвинутые темы линейной алгебры , алгебры и комбинаторики .

Как и в других областях статистики, при планировании эксперимента используются как частотный , так и байесовский подходы: при оценке статистических процедур, таких как планы экспериментов, частотная статистика изучает распределение выборки , в то время как байесовская статистика обновляет распределение вероятностей в пространстве параметров.

Некоторыми важными специалистами в области экспериментальных планов являются К.С. Пирс , Р.А. Фишер , Ф. Йейтс , Р.К. Бозе , А.С. Аткинсон , Р.А. Бэйли , Д.Р. Кокс , Дж.П. Бокс , У.Г. Кокран , У.Т. Федерер , В.В. Федоров , А.С. Хедаят , Дж. Кифер. , О. Кемпторн , Дж. А. Нелдер , Андрей Пазман , Фридрих Пукельсхайм , Д. Рагхаварао , Ч. Р. Рао , Шрикханде С. С. , Дж. Н. Шривастава , Уильям Дж. Стадден , Г. Тагучи и Х. П. Винн . ^[34]

Учебники Д. Монтгомери, Р. Майерса и Г. Бокса/У. Hunter/JS Hunter охватили несколько поколений студентов и практиков. ^[35]^[36]^[37]^[38]^[39] Кроме того, продолжаются дискуссии о планировании экспериментов в контексте построения моделей статических или динамических моделей, также известных как идентификация системы . ^[40]^[41]

Ограничения участия человека

Законы и этические соображения исключают некоторые тщательно разработанные эксперименты на людях. Правовые ограничения зависят от юрисдикция . Ограничения могут включать институциональные наблюдательные советы , информированное согласие и конфиденциальность, затрагивающая как клинические (медицинские) исследования, так и поведенческие и социальные эксперименты. ^[42]Например, в области токсикологии проводятся эксперименты. на лабораторных животных с целью определения безопасных пределов воздействия для людей . ^[43] Балансировкаограничениями являются взгляды из медицинской области. ^[44] Что касается рандомизации пациентов, «...если никто не знает, какая терапия лучше, не существует этического необходимо использовать ту или иную терапию». (стр. 380). экспериментальный план: «... явно неэтично помещать испытуемых рискуют собрать данные в плохо спланированном исследовании, когда такая ситуация можно легко избежать...» (с. 393).

См. также

Ссылки

^ «Последовательный характер классического планирования экспериментов | Призма» . prismtc.co.uk . Проверено 10 марта 2023 г.
^ Пирс, Чарльз Сандерс (1887). «Иллюстрации логики науки». Открытый суд (10 июня 2014 г.). ISBN 0812698495 .
^ Пирс, Чарльз Сандерс (1883). «Теория вероятного вывода». В К.С. Пирсе (ред.), Исследования по логике, проведенные сотрудниками Университета Джонса Хопкинса (стр. 126–181). Литтл, Браун и компания (1883)
^ Стиглер, Стивен М. (1978). «Математическая статистика в ранних государствах» . Анналы статистики . 6 (2): 239–65 [248]. дои : 10.1214/aos/1176344123 . JSTOR 2958876 . МР 0483118 . Действительно, работа Пирса содержит одно из первых явных подтверждений математической рандомизации как основы для выводов, о которой мне известно (Peirce, 1957, стр. 216–219).
^ Jump up to: ^а ^б Пирс, Чарльз Сандерс ; Ястроу, Джозеф (1885). «О малых различиях в ощущениях» . Мемуары Национальной академии наук . 3 : 73–83.
^ Jump up to: ^а ^б из Хакерство, Ян (сентябрь 1988 г.). «Телепатия: истоки рандомизации в экспериментальном дизайне». Исида . 79 (3): 427–451. дои : 10.1086/354775 . JSTOR 234674 . МР 1013489 . S2CID 52201011 .
^ Jump up to: ^а ^б Стивен М. Стиглер (ноябрь 1992 г.). «Исторический взгляд на статистические концепции в психологии и исследованиях в области образования». Американский журнал образования . 101 (1): 60–70. дои : 10.1086/444032 . JSTOR 1085417 . S2CID 143685203 .
^ Jump up to: ^а ^б Труди Деуэ (декабрь 1997 г.). «Обман, эффективность и случайные группы: психология и постепенное возникновение конструкции случайных групп» . Исида . 88 (4): 653–673. дои : 10.1086/383850 . ПМИД 9519574 . S2CID 23526321 .
^ Пирс, CS (1876 г.). «Записка по теории экономики исследований». Отчет берегового обследования : 197–201. , фактически опубликовано в 1879 году, NOAA PDF Eprint. Архивировано 2 марта 2017 года в Wayback Machine .
Перепечатано в Сборнике статей 7 , параграфы 139–157, а также в Писаниях 4 , стр. 72–78, и в Пирс, CS (июль – август 1967 г.). «Записка по теории экономики исследований». Исследование операций . 15 (4): 643–648. дои : 10.1287/опре.15.4.643 . JSTOR 168276 .
^ Гутторп, П.; Линдгрен, Г. (2009). «Карл Пирсон и скандинавская школа статистики». Международный статистический обзор . 77:64 . CiteSeerX 10.1.1.368.8328 . дои : 10.1111/j.1751-5823.2009.00069.x . S2CID 121294724 .
^ Смит, Кирстин (1918). «О стандартных отклонениях скорректированных и интерполированных значений наблюдаемой полиномиальной функции и ее констант и рекомендациях, которые они дают для правильного выбора распределения наблюдений» . Биометрика . 12 (1–2): 1–85. дои : 10.1093/biomet/12.1-2.1 .
^ Джонсон, Нидерланды (1961). «Последовательный анализ: опрос». Журнал Королевского статистического общества , серия A. Vol. 124 (3), 372–411. (страницы 375–376)
^ Уолд, А. (1945) «Последовательные проверки статистических гипотез», Анналы математической статистики , 16 (2), 117–186.
^ Jump up to: ^а ^б Герман Чернофф , Последовательный анализ и оптимальное проектирование , SIAM , 1972. Монография
^ Закс, С. (1996) «Адаптивные проекты для параметрических моделей». В: Гош С. и Рао ЧР (ред.) (1996). «Планирование и анализ экспериментов», Статистический справочник , том 13. Северная Голландия. ISBN 0-444-82061-2 . (стр. 151–180)
^ Роббинс, Х. (1952). «Некоторые аспекты последовательного планирования экспериментов» . Бюллетень Американского математического общества . 58 (5): 527–535. дои : 10.1090/S0002-9904-1952-09620-8 .
^ Миллер, Джеффри (2000). Брачный разум: как сексуальный выбор повлиял на эволюцию человеческой природы , Лондон: Хейнеман, ISBN 0-434-00741-2 (также Doubleday, ISBN 0-385-49516-1 ) «Для биологов он был архитектором «современного синтеза», который использовал математические модели для интеграции менделевской генетики с теориями отбора Дарвина. Для психологов Фишер был изобретателем различных статистических тестов, которые до сих пор Предполагалось, что Фишер будет использоваться, когда это возможно, в психологических журналах. Для фермеров Фишер был основателем экспериментальных сельскохозяйственных исследований, спасших миллионы людей от голода с помощью программ рационального селекции сельскохозяйственных культур». стр.54.
^ Кресвелл, JW (2008), Образовательные исследования: планирование, проведение и оценка количественных и качественных исследований (3-е издание) , Аппер-Сэддл-Ривер, Нью-Джерси: Прентис-Холл. 2008, с. 300. ISBN 0-13-613550-1
^ Доктор Хани (2009). «Исследование репликации» . Архивировано из оригинала 2 июня 2012 года . Проверено 27 октября 2011 г.
^ Берман, Леонард Э.; Роберт В. Рид; Джеймс Алм (2010), «Призыв к повторным исследованиям» , Public Finance Review , 38 (6): 787–793, doi : 10.1177/1091142110385210 , S2CID 27838472 , получено 27 октября 2011 г.
^ Хотеллинг, Гарольд (1944). «Некоторые улучшения в взвешивании и других экспериментальных методах» . Анналы математической статистики . 15 (3): 297–306. дои : 10.1214/aoms/1177731236 .
^ Гири, Нараян К.; Дас, Миннесота (1979). Планирование и анализ экспериментов . Нью-Йорк, штат Нью-Йорк: Уайли. стр. 350–359. ISBN 9780852269145 .
^ Jump up to: ^а ^б Джек Сифри (8 декабря 2014 г.). «Как использовать планирование экспериментов для создания надежных проектов с высокой доходностью» . youtube.com . Проверено 11 февраля 2015 г.
^ Форстмайер, Вольфганг; Вагенмейкерс, Эрик-Ян; Паркер, Тимоти Х. (23 ноября 2016 г.). «Обнаружение и предотвращение вероятных ложноположительных результатов – практическое руководство» . Биологические обзоры . 92 (4): 1941–1968. дои : 10.1111/brv.12315 . hdl : 11245.1/31f84a5b-4439-4a4c-a690-6e98354199f5 . ISSN 1464-7931 . ПМИД 27879038 . S2CID 26793416 .
^ Jump up to: ^а ^б Дэвид, Шарун; Хандхар1, Парас Б. (17 июля 2023 г.). «Двойное слепое исследование» . Издательство StatPearls . ПМИД 31536248 . {{cite journal}}: CS1 maint: числовые имена: список авторов ( ссылка )
^ Симмонс, Джозеф; Лейф Нельсон; Ури Симонсон (ноябрь 2011 г.). «Ложноположительная психология: нераскрытая гибкость в сборе и анализе данных позволяет представить все что угодно как значимое». Психологическая наука . 22 (11): 1359–1366. дои : 10.1177/0956797611417632 . ISSN 0956-7976 . ПМИД 22006061 .
^ «Наука, доверие и психология в кризисе» . КПЛУ . 2 июня 2014 года. Архивировано из оригинала 14 июля 2014 года . Проверено 12 июня 2014 г.
^ «Почему статистически значимые исследования могут быть незначительными» . Тихоокеанский стандарт . 4 июня 2014 года . Проверено 12 июня 2014 г.
^ Носек, Брайан А.; Эберсол, Чарльз Р.; ДеХейвен, Александр К.; Меллор, Дэвид Т. (13 марта 2018 г.). «Революция предварительной регистрации» . Труды Национальной академии наук . 115 (11): 2600–2606. Бибкод : 2018PNAS..115.2600N . дои : 10.1073/pnas.1708274114 . ISSN 0027-8424 . ПМК 5856500 . ПМИД 29531091 .
^ «Предварительная регистрация исследований – что это такое, как вы это делаете и почему?» . www.acf.hhs.gov . Проверено 29 августа 2023 г.
^ Крис Чемберс (10 июня 2014 г.). «Физика завидует: есть ли в «точных» науках решение кризиса репликации в психологии?» . theguardian.com . Проверено 12 июня 2014 г.
^ Адер, Мелленберг и Хэнд (2008) «Консультирование по методам исследования: спутник консультанта»
^ Бисгаард, С. (2008) «Должен ли процесс находиться под статистическим контролем перед проведением запланированных экспериментов?», Quality Engineering , ASQ, 20 (2), стр. 143–176
^ Гири, Нараян К.; Дас, Миннесота (1979). Планирование и анализ экспериментов . Нью-Йорк, штат Нью-Йорк: Уайли. стр. 53, 159, 264. ISBN. 9780852269145 .
^ Монтгомери, Дуглас (2013). Планирование и анализ экспериментов (8-е изд.). John Wiley & Sons, Inc. Хобокен, Нью-Джерси: ISBN 9781118146927 .
^ Уолпол, Рональд Э.; Майерс, Рэймонд Х.; Майерс, Шэрон Л.; Йе, Кейинг (2007). Вероятность и статистика для инженеров и ученых (8-е изд.). Река Аппер-Сэддл, Нью-Джерси: Пирсон Прентис Холл. ISBN 978-0131877115 .
^ Майерс, Рэймонд Х.; Монтгомери, Дуглас К.; Вининг, Дж. Джеффри; Робинсон, Тимоти Дж. (2010). Обобщенные линейные модели: с приложениями в технике и науке (2-е изд.). Хобокен, Нью-Джерси: Уайли. ISBN 978-0470454633 .
^ Бокс, Джордж Э.П.; Хантер, Уильям Г.; Хантер, Дж. Стюарт (1978). Статистика для экспериментаторов: введение в проектирование, анализ данных и построение моделей . Нью-Йорк: Уайли. ISBN 978-0-471-09315-2 .
^ Бокс, Джордж Э.П.; Хантер, Уильям Г.; Хантер, Дж. Стюарт (2005). Статистика для экспериментаторов: дизайн, инновации и открытия (2-е изд.). Хобокен, Нью-Джерси: Уайли. ISBN 978-0471718130 .
^ Сполл, Дж. К. (2010). «Факторный дизайн для эффективного экспериментирования: создание информативных данных для идентификации системы». Журнал IEEE Control Systems . 30 (5): 38–53. дои : 10.1109/MCS.2010.937677 . S2CID 45813198 .
^ Пронцато, Л (2008). «Оптимальный план эксперимента и некоторые связанные с ним проблемы управления». Автоматика . 44 (2): 303–325. arXiv : 0802.4381 . дои : 10.1016/j.automatica.2007.05.016 . S2CID 1268930 .
^ Мур, Дэвид С.; Нотц, Уильям И. (2006). Статистика: концепции и противоречия (6-е изд.). Нью-Йорк: WH Freeman. стр. Глава 7: Этика данных. ISBN 9780716786368 .
^ Оттобони, М. Алиса (1991). Доза делает яд: простое руководство по токсикологии (2-е изд.). Нью-Йорк, штат Нью-Йорк: Ван Ностранд Рейнхольд. ISBN 978-0442006600 .
^ Гланц, Стэнтон А. (1992). Букварь биостатистики (3-е изд.). ISBN 978-0-07-023511-3 .

Источники

Пирс, CS (1877–1878), «Иллюстрации логики науки» (серия), Popular Science Monthly , тт. 12–13. Соответствующие отдельные документы:
- (Март 1878 г.), «Доктрина шансов», Popular Science Monthly , т. 12, мартовский выпуск, стр. 604–615 . Интернет-архив Эпринт .
- (апрель 1878 г.), «Вероятность индукции», Popular Science Monthly , т. 12, стр. 705–718 . Интернет-архив Эпринт .
- (июнь 1878 г.), «Порядок природы», Popular Science Monthly , т. 13, стр. 203–217 . Интернет-архив Эпринт .
- (август 1878 г.), «Дедукция, индукция и гипотеза», Popular Science Monthly , т. 13, стр. 470–482 . Интернет-архив Эпринт .
- (1883), «Теория вероятного вывода», Исследования по логике , стр. 126–181 , Little, Brown and Company. (Перепечатано в 1983 г., издательство John Benjamins Publishing Company, ISBN 90-272-3271-7 )

Внешние ссылки

Ресурсы библиотеки о
Экспериментальный дизайн

Ресурсы в вашей библиотеке

Глава из « Справочника NIST/SEMATECH по инженерной статистике» в NIST.
Проекты Бокса-Бенкена взяты из «Справочника NIST/SEMATECH по инженерной статистике» NIST .
Подробные математические разработки наиболее распространенных DoE в онлайн-справке Opera Magistris v3.6, глава 15, раздел 7.4, ISBN 978-2-8399-0932-7 .

[1] «Последовательный характер классического планирования экспериментов | Призма» . prismtc.co.uk . Проверено 10 марта 2023 г.

[2] Пирс, Чарльз Сандерс (1887). «Иллюстрации логики науки». Открытый суд (10 июня 2014 г.). ISBN 0812698495 .

[3] Пирс, Чарльз Сандерс (1883). «Теория вероятного вывода». В К.С. Пирсе (ред.), Исследования по логике, проведенные сотрудниками Университета Джонса Хопкинса (стр. 126–181). Литтл, Браун и компания (1883)

[Stigler78-4] Стиглер, Стивен М. (1978). «Математическая статистика в ранних государствах» . Анналы статистики . 6 (2): 239–65 [248]. дои : 10.1214/aos/1176344123 . JSTOR 2958876 . МР 0483118 . Действительно, работа Пирса содержит одно из первых явных подтверждений математической рандомизации как основы для выводов, о которой мне известно (Peirce, 1957, стр. 216–219).

[smalldiff-5] Jump up to: ^а ^б Пирс, Чарльз Сандерс ; Ястроу, Джозеф (1885). «О малых различиях в ощущениях» . Мемуары Национальной академии наук . 3 : 73–83.

[telepathy-6] Jump up to: ^а ^б из Хакерство, Ян (сентябрь 1988 г.). «Телепатия: истоки рандомизации в экспериментальном дизайне». Исида . 79 (3): 427–451. дои : 10.1086/354775 . JSTOR 234674 . МР 1013489 . S2CID 52201011 .

[stigler-7] Jump up to: ^а ^б Стивен М. Стиглер (ноябрь 1992 г.). «Исторический взгляд на статистические концепции в психологии и исследованиях в области образования». Американский журнал образования . 101 (1): 60–70. дои : 10.1086/444032 . JSTOR 1085417 . S2CID 143685203 .

[dehue-8] Jump up to: ^а ^б Труди Деуэ (декабрь 1997 г.). «Обман, эффективность и случайные группы: психология и постепенное возникновение конструкции случайных групп» . Исида . 88 (4): 653–673. дои : 10.1086/383850 . ПМИД 9519574 . S2CID 23526321 .

[9] Пирс, CS (1876 г.). «Записка по теории экономики исследований». Отчет берегового обследования : 197–201. , фактически опубликовано в 1879 году, NOAA PDF Eprint. Архивировано 2 марта 2017 года в Wayback Machine .
Перепечатано в Сборнике статей 7 , параграфы 139–157, а также в Писаниях 4 , стр. 72–78, и в Пирс, CS (июль – август 1967 г.). «Записка по теории экономики исследований». Исследование операций . 15 (4): 643–648. дои : 10.1287/опре.15.4.643 . JSTOR 168276 .

[GL2009-10] Гутторп, П.; Линдгрен, Г. (2009). «Карл Пирсон и скандинавская школа статистики». Международный статистический обзор . 77:64 . CiteSeerX 10.1.1.368.8328 . дои : 10.1111/j.1751-5823.2009.00069.x . S2CID 121294724 .

[polynomials-11] Смит, Кирстин (1918). «О стандартных отклонениях скорректированных и интерполированных значений наблюдаемой полиномиальной функции и ее констант и рекомендациях, которые они дают для правильного выбора распределения наблюдений» . Биометрика . 12 (1–2): 1–85. дои : 10.1093/biomet/12.1-2.1 .

[12] Джонсон, Нидерланды (1961). «Последовательный анализ: опрос». Журнал Королевского статистического общества , серия A. Vol. 124 (3), 372–411. (страницы 375–376)

[13] Уолд, А. (1945) «Последовательные проверки статистических гипотез», Анналы математической статистики , 16 (2), 117–186.

[ref3-14] Jump up to: ^а ^б Герман Чернофф , Последовательный анализ и оптимальное проектирование , SIAM , 1972. Монография

[15] Закс, С. (1996) «Адаптивные проекты для параметрических моделей». В: Гош С. и Рао ЧР (ред.) (1996). «Планирование и анализ экспериментов», Статистический справочник , том 13. Северная Голландия. ISBN 0-444-82061-2 . (стр. 151–180)

[16] Роббинс, Х. (1952). «Некоторые аспекты последовательного планирования экспериментов» . Бюллетень Американского математического общества . 58 (5): 527–535. дои : 10.1090/S0002-9904-1952-09620-8 .

[Miller00-17] Миллер, Джеффри (2000). Брачный разум: как сексуальный выбор повлиял на эволюцию человеческой природы , Лондон: Хейнеман, ISBN 0-434-00741-2 (также Doubleday, ISBN 0-385-49516-1 ) «Для биологов он был архитектором «современного синтеза», который использовал математические модели для интеграции менделевской генетики с теориями отбора Дарвина. Для психологов Фишер был изобретателем различных статистических тестов, которые до сих пор Предполагалось, что Фишер будет использоваться, когда это возможно, в психологических журналах. Для фермеров Фишер был основателем экспериментальных сельскохозяйственных исследований, спасших миллионы людей от голода с помощью программ рационального селекции сельскохозяйственных культур». стр.54.

[18] Кресвелл, JW (2008), Образовательные исследования: планирование, проведение и оценка количественных и качественных исследований (3-е издание) , Аппер-Сэддл-Ривер, Нью-Джерси: Прентис-Холл. 2008, с. 300. ISBN 0-13-613550-1

[19] Доктор Хани (2009). «Исследование репликации» . Архивировано из оригинала 2 июня 2012 года . Проверено 27 октября 2011 г.

[20] Берман, Леонард Э.; Роберт В. Рид; Джеймс Алм (2010), «Призыв к повторным исследованиям» , Public Finance Review , 38 (6): 787–793, doi : 10.1177/1091142110385210 , S2CID 27838472 , получено 27 октября 2011 г.

[21] Хотеллинг, Гарольд (1944). «Некоторые улучшения в взвешивании и других экспериментальных методах» . Анналы математической статистики . 15 (3): 297–306. дои : 10.1214/aoms/1177731236 .

[22] Гири, Нараян К.; Дас, Миннесота (1979). Планирование и анализ экспериментов . Нью-Йорк, штат Нью-Йорк: Уайли. стр. 350–359. ISBN 9780852269145 .

[yout_Howt-23] Jump up to: ^а ^б Джек Сифри (8 декабря 2014 г.). «Как использовать планирование экспериментов для создания надежных проектов с высокой доходностью» . youtube.com . Проверено 11 февраля 2015 г.

[24] Форстмайер, Вольфганг; Вагенмейкерс, Эрик-Ян; Паркер, Тимоти Х. (23 ноября 2016 г.). «Обнаружение и предотвращение вероятных ложноположительных результатов – практическое руководство» . Биологические обзоры . 92 (4): 1941–1968. дои : 10.1111/brv.12315 . hdl : 11245.1/31f84a5b-4439-4a4c-a690-6e98354199f5 . ISSN 1464-7931 . ПМИД 27879038 . S2CID 26793416 .

[:0-25] Jump up to: ^а ^б Дэвид, Шарун; Хандхар1, Парас Б. (17 июля 2023 г.). «Двойное слепое исследование» . Издательство StatPearls . ПМИД 31536248 . {{cite journal}}: CS1 maint: числовые имена: список авторов ( ссылка )

[26] Симмонс, Джозеф; Лейф Нельсон; Ури Симонсон (ноябрь 2011 г.). «Ложноположительная психология: нераскрытая гибкость в сборе и анализе данных позволяет представить все что угодно как значимое». Психологическая наука . 22 (11): 1359–1366. дои : 10.1177/0956797611417632 . ISSN 0956-7976 . ПМИД 22006061 .

[27] «Наука, доверие и психология в кризисе» . КПЛУ . 2 июня 2014 года. Архивировано из оригинала 14 июля 2014 года . Проверено 12 июня 2014 г.

[28] «Почему статистически значимые исследования могут быть незначительными» . Тихоокеанский стандарт . 4 июня 2014 года . Проверено 12 июня 2014 г.

[29] Носек, Брайан А.; Эберсол, Чарльз Р.; ДеХейвен, Александр К.; Меллор, Дэвид Т. (13 марта 2018 г.). «Революция предварительной регистрации» . Труды Национальной академии наук . 115 (11): 2600–2606. Бибкод : 2018PNAS..115.2600N . дои : 10.1073/pnas.1708274114 . ISSN 0027-8424 . ПМК 5856500 . ПМИД 29531091 .

[30] «Предварительная регистрация исследований – что это такое, как вы это делаете и почему?» . www.acf.hhs.gov . Проверено 29 августа 2023 г.

[31] Крис Чемберс (10 июня 2014 г.). «Физика завидует: есть ли в «точных» науках решение кризиса репликации в психологии?» . theguardian.com . Проверено 12 июня 2014 г.

[32] Адер, Мелленберг и Хэнд (2008) «Консультирование по методам исследования: спутник консультанта»

[33] Бисгаард, С. (2008) «Должен ли процесс находиться под статистическим контролем перед проведением запланированных экспериментов?», Quality Engineering , ASQ, 20 (2), стр. 143–176

[34] Гири, Нараян К.; Дас, Миннесота (1979). Планирование и анализ экспериментов . Нью-Йорк, штат Нью-Йорк: Уайли. стр. 53, 159, 264. ISBN. 9780852269145 .

[35] Монтгомери, Дуглас (2013). Планирование и анализ экспериментов (8-е изд.). John Wiley & Sons, Inc. Хобокен, Нью-Джерси: ISBN 9781118146927 .

[36] Уолпол, Рональд Э.; Майерс, Рэймонд Х.; Майерс, Шэрон Л.; Йе, Кейинг (2007). Вероятность и статистика для инженеров и ученых (8-е изд.). Река Аппер-Сэддл, Нью-Джерси: Пирсон Прентис Холл. ISBN 978-0131877115 .

[37] Майерс, Рэймонд Х.; Монтгомери, Дуглас К.; Вининг, Дж. Джеффри; Робинсон, Тимоти Дж. (2010). Обобщенные линейные модели: с приложениями в технике и науке (2-е изд.). Хобокен, Нью-Джерси: Уайли. ISBN 978-0470454633 .

[38] Бокс, Джордж Э.П.; Хантер, Уильям Г.; Хантер, Дж. Стюарт (1978). Статистика для экспериментаторов: введение в проектирование, анализ данных и построение моделей . Нью-Йорк: Уайли. ISBN 978-0-471-09315-2 .

[39] Бокс, Джордж Э.П.; Хантер, Уильям Г.; Хантер, Дж. Стюарт (2005). Статистика для экспериментаторов: дизайн, инновации и открытия (2-е изд.). Хобокен, Нью-Джерси: Уайли. ISBN 978-0471718130 .

[40] Сполл, Дж. К. (2010). «Факторный дизайн для эффективного экспериментирования: создание информативных данных для идентификации системы». Журнал IEEE Control Systems . 30 (5): 38–53. дои : 10.1109/MCS.2010.937677 . S2CID 45813198 .

[41] Пронцато, Л (2008). «Оптимальный план эксперимента и некоторые связанные с ним проблемы управления». Автоматика . 44 (2): 303–325. arXiv : 0802.4381 . дои : 10.1016/j.automatica.2007.05.016 . S2CID 1268930 .

[42] Мур, Дэвид С.; Нотц, Уильям И. (2006). Статистика: концепции и противоречия (6-е изд.). Нью-Йорк: WH Freeman. стр. Глава 7: Этика данных. ISBN 9780716786368 .

[43] Оттобони, М. Алиса (1991). Доза делает яд: простое руководство по токсикологии (2-е изд.). Нью-Йорк, штат Нью-Йорк: Ван Ностранд Рейнхольд. ISBN 978-0442006600 .

[44] Гланц, Стэнтон А. (1992). Букварь биостатистики (3-е изд.). ISBN 978-0-07-023511-3 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

v т и Планирование экспериментов
Scientific method	Scientific experiment Statistical design Control Internal and external validity Experimental unit Blinding Optimal design: Bayesian Random assignment Randomization Restricted randomization Replication versus subsampling Sample size
Treatment and blocking	Treatment Effect size Contrast Interaction Confounding Orthogonality Blocking Covariate Nuisance variable
Models and inference	Linear regression Ordinary least squares Bayesian Random effect Mixed model Hierarchical model: Bayesian Analysis of variance (Anova) Cochran's theorem Manova (multivariate) Ancova (covariance) Compare means Multiple comparison
Designs Completely randomized	Factorial Fractional factorial Plackett–Burman Taguchi Response surface methodology Polynomial and rational modeling Box–Behnken Central composite Block Generalized randomized block design (GRBD) Latin square Graeco-Latin square Orthogonal array Latin hypercube Repeated measures design Crossover study Randomized controlled trial Sequential analysis Sequential probability ratio test
Glossary Category Mathematics portal Statistical outline Statistical topics

v т и шести сигм Инструменты
Define phase	Project charter Voice of the customer Value-stream mapping SIPOC
Measure phase	Business process mapping Process capability Pareto chart
Analyse phase	Root cause analysis Failure mode and effects analysis Multi-vari chart
Improve phase	Design of experiments Kaizen
Control phase	Control plan Statistical process control 5S Poka-yoke
DMAIC