Репликация (статистика)
В технике , науке и статистике репликация — это процесс повторения исследования или эксперимента в тех же или аналогичных условиях для подтверждения исходного утверждения, что имеет решающее значение для подтверждения точности результатов, а также для выявления и исправления недостатков оригинала. эксперимент. [1] ASTM в стандарте E1847 определяет репликацию как «...повторение набора всех комбинаций лечения, подлежащих сравнению в эксперименте. Каждое из повторений называется повторением » .
Для полного факторного плана повторы представляют собой несколько экспериментальных серий с одинаковыми уровнями факторов. Вы можете воспроизводить комбинации уровней факторов, группы комбинаций уровней факторов или даже целые проекты. Например, рассмотрим сценарий с тремя факторами, каждый из которых имеет два уровня, и эксперимент, в котором проверяются все возможные комбинации этих уровней (полный факторный план). Одна полная репликация этой конструкции будет включать 8 прогонов (2^3). Дизайн может быть выполнен один раз или в нескольких повторах. [2]
В статистике есть два основных типа репликации. Во-первых, существует тип, называемый «точная репликация» (также называемый «прямая репликация»), который предполагает повторение исследования как можно ближе к оригиналу, чтобы увидеть, можно ли точно воспроизвести исходные результаты. [3] Например, повторение исследования влияния конкретной диеты на потерю веса с использованием того же плана диеты и методов измерения. Второй тип репликации называется «концептуальной репликацией». Это предполагает проверку той же теории, что и исходное исследование, но в других условиях. [3] Например, тестирование влияния одной и той же диеты на уровень сахара в крови, а не на потерю веса, с использованием разных методов измерения.
Важны как точные (прямые) репликации, так и концептуальные репликации. Прямые репликации помогают подтвердить точность результатов в условиях, которые были первоначально протестированы. С другой стороны, концептуальные репликации проверяют обоснованность теории, лежащей в основе этих выводов, и исследуют различные условия, при которых эти выводы остаются верными. По сути, концептуальное воспроизведение дает представление о том, насколько обобщаемы результаты. [4]
Разница между репликами и повторами
[ редактировать ]Репликация — это не то же самое, что повторные измерения одного и того же объекта. Как повторные, так и повторные измерения включают в себя несколько наблюдений, выполненных при одних и тех же уровнях экспериментальных факторов. Однако повторные измерения собираются в течение одной экспериментальной сессии, тогда как повторные измерения собираются в разных экспериментальных сессиях. [2] Репликация в статистике оценивает согласованность результатов экспериментов в разных испытаниях для обеспечения внешней достоверности, тогда как повторение измеряет точность и внутреннюю согласованность в одних и тех же или похожих экспериментах. [5]
Повторный пример: тестирование влияния нового препарата на артериальное давление в отдельных группах в разные дни.
Пример повторения: Измерение артериального давления несколько раз в одной группе в течение одного сеанса.
Статистические методы в репликации
[ редактировать ]В повторных исследованиях в области статистики используется несколько ключевых методов и концепций для оценки надежности результатов исследований. Вот некоторые из основных статистических методов и концепций, используемых при репликации:
P-значения : P-значение является мерой вероятности того, что наблюдаемые данные возникли бы случайно, если бы нулевая гипотеза была верна. В исследованиях репликации значения p помогают нам определить, можно ли последовательно воспроизвести результаты. Низкое значение p в исследовании репликации указывает на то, что результаты вряд ли являются случайными. [6] Например, если исследование обнаружило статистически значимое влияние условий тестирования на результат, а повторение также обнаружило статистически значимые эффекты, это говорит о том, что первоначальные результаты, вероятно, воспроизводимы.
Доверительные интервалы . Доверительные интервалы представляют собой диапазон значений, в пределах которого вероятнее всего будет находиться истинный размер эффекта. В исследованиях репликации сравнение доверительных интервалов исходного исследования и репликации может указать, согласуются ли результаты. [6] Например, если в исходном исследовании сообщается об эффекте лечения с 95% доверительным интервалом [5, 10], а в повторном исследовании обнаруживается аналогичный эффект с доверительным интервалом [6, 11], это перекрытие указывает на согласованные результаты обоих исследований. исследования.
Пример
[ редактировать ]В качестве примера рассмотрим непрерывный процесс производства предметов. Затем партии товаров обрабатываются или обрабатываются. Наконец, проводятся испытания или измерения. Для получения десяти тестовых значений может быть доступно несколько вариантов. Некоторые возможности:
- Одно готовое и обработанное изделие можно измерить несколько раз, чтобы получить десять результатов испытаний. Был измерен только один элемент, поэтому повторение отсутствует. Повторные измерения помогают выявить ошибку наблюдений .
- Из партии можно взять десять готовых и обработанных изделий и измерить каждое один раз. Это не полная репликация, поскольку десять выборок не являются случайными и не являются репрезентативными для непрерывной или пакетной обработки.
- Пять пунктов взяты из непрерывного процесса на основе надежной статистической выборки. Они обрабатываются партиями и тестируются дважды каждый. Это включает в себя копирование исходных образцов, но не допускает изменений в обработке от партии к партии. Повторные тесты для каждого из них обеспечивают некоторую оценку и контроль ошибок тестирования.
- Пять пунктов взяты из непрерывного процесса на основе надежной статистической выборки. Они обрабатываются пятью различными партиями и тестируются дважды каждая. Этот план включает в себя надлежащее воспроизведение исходных образцов, а также вариации от партии к партии. Повторные тесты для каждого из них обеспечивают некоторую оценку и контроль ошибок тестирования.
- Для правильного отбора проб процесс или партия продукции должны находиться под разумным статистическим контролем ; Присущая случайная вариация присутствует, но вариация, обусловленная определяемыми (особыми) причинами, отсутствует. Оценка или тестирование одного изделия не допускают изменений от изделия к изделию и не могут отражать партию или процесс. Для учета этих различий между предметами и обработками необходима репликация.
Каждый вариант потребует использования разных методов анализа данных и приведет к разным выводам.
См. также
[ редактировать ]- Степени свободы (статистика)
- Планирование экспериментов
- Псевдорепликация
- Размер выборки
- Статистический ансамбль
- Статистический контроль процессов
- Метод испытания
Ссылки
[ редактировать ]- ^ Киллин, Питер Р. (2008), «Статистика репликации» , Передовой опыт в количественных методах , 2455 Teller Road, Thousand Oaks California 91320 Соединенные Штаты Америки: SAGE Publications, Inc., стр. 102–124, doi : 10.4135/9781412995627 .d10 , ISBN 978-1-4129-4065-8 , получено 11 декабря 2023 г.
{{citation}}
: CS1 maint: местоположение ( ссылка ) - ^ Jump up to: а б «Репликация и повторение в запланированных экспериментах» . support.minitab.com . Проверено 11 декабря 2023 г.
- ^ Jump up to: а б «Кризис репликации в психологии» . Ноба . Проверено 11 декабря 2023 г.
- ^ Хадсон, Роберт (01 августа 2023 г.). «Объяснение точной и концептуальной репликации» . Эркеннтнис . 88 (6): 2493–2514. дои : 10.1007/s10670-021-00464-z . ISSN 1572-8420 . ПМЦ 10300171 . ПМИД 37388139 .
- ^ Руис, Николь (07 сентября 2023 г.). «Повторение и репликация: ключевые различия» . Сиксигма DSI . Проверено 11 декабря 2023 г.
- ^ Jump up to: а б «Как доверительные интервалы полезны для понимания репликации?» . Научно обоснованно . 08.12.2016 . Проверено 11 декабря 2023 г.
Библиография
[ редактировать ]- ASTM E122-07 Стандартная практика расчета размера выборки для оценки с заданной точностью среднего значения характеристики партии или процесса
- « Справочник по инженерной статистике », NIST/SEMATEK
- Пыздек Т. «Справочник по инженерному обеспечению качества», 2003 г., ISBN 0-8247-4614-7 .
- Годфри, А.Б., «Справочник по качеству Джурана», 1999 г., ISBN 9780070340039 .