тест Даннетта
В статистике . критерий Даннета представляет собой множественного сравнения процедуру [ 1 ] разработан канадским статистиком Чарльзом Даннеттом. [ 2 ] для сравнения каждого из ряда обработок с одним контролем. [ 3 ] [ 4 ] Множественные сравнения с контролем также называются сравнениями «многие к одному».
История
[ редактировать ]Тест Даннета был разработан в 1955 году; [ 5 ] обновленная таблица критических значений была опубликована в 1964 году. [ 6 ]
Проблема множественных сравнений
[ редактировать ]Проблема множественных сравнений, множественности или множественного тестирования возникает, когда одновременно рассматривается набор статистических выводов или выводится подмножество параметров, выбранных на основе наблюдаемых значений. Основным вопросом при любом обсуждении процедур множественного сравнения является вопрос о вероятности ошибок первого рода. Большинство различий между альтернативными методами являются результатом разных подходов к вопросу о том, как контролировать эти ошибки. Проблема частично техническая; но на самом деле это гораздо более субъективный вопрос о том, как вы хотите определить частоту ошибок и насколько большой вы готовы допустить максимально возможную частоту ошибок. [ 7 ] Критерий Даннетта хорошо известен и широко используется в процедуре множественного сравнения для одновременного сравнения, путем интервальной оценки или проверки гипотез, всех активных обработок с контролем при выборке из распределения, где предположение о нормальности является разумным. Тест Даннетта разработан таким образом, чтобы поддерживать уровень семейных ошибок на уровне или ниже при проведении множественных сравнений лечебной группы с контролем. [ 7 ]
Использование теста Даннетта
[ редактировать ]Оригинальная работа по проблеме множественных сравнений была сделана Тьюки и Шеффе . Их метод был общим и учитывал все виды парных сравнений. [ 7 ] Методы Тьюки и Шеффе допускают любое количество сравнений набора выборочных средних. С другой стороны, тест Даннетта сравнивает только одну группу с другими, обращаясь к частному случаю проблемы множественных сравнений — попарным сравнениям нескольких групп лечения с одной контрольной группой. В общем случае, когда мы сравниваем каждую из пар, мы делаем сравнения (где k — количество групп), но в случае лечения и контроля мы будем проводить только сравнения. Если бы в случае экспериментальной и контрольной групп мы использовали более общие методы Тьюки и Шеффе, это могло бы привести к неоправданно широким доверительным интервалам. Тест Даннетта учитывает особую структуру сравнения лечения с контролем, что дает более узкие доверительные интервалы. [ 5 ]
Очень часто тест Даннетта используют в медицинских экспериментах, например, сравнивая результаты анализа крови у трех групп животных, одна из которых служила контролем, а две другие получали два разных препарата. Еще одно распространенное использование этого метода среди агрономов: агрономы могут захотеть изучить влияние определенных химикатов, добавленных в почву, на урожайность сельскохозяйственных культур, поэтому они оставят некоторые участки необработанными (контрольные участки) и сравнят их с участками, на которые были добавлены химикаты. почва (очистные участки).
Формальное описание теста Даннета
[ редактировать ]Критерий Даннетта выполняется путем расчета t-статистики Стьюдента для каждой экспериментальной или экспериментальной группы, где статистика сравнивает экспериментальную группу с одной контрольной группой. [ 8 ] [ 9 ] Поскольку каждое сравнение имеет один и тот же общий элемент управления, процедура включает зависимости между этими сравнениями. В частности, все t-статистики выводятся из одной и той же оценки дисперсии ошибок, которая получается путем объединения сумм квадратов ошибок во всех группах (лечебной и контрольной). Формальная статистика теста для критерия Даннета — это либо наибольшее по абсолютному значению этих t-статистик (если требуется двусторонний критерий), либо самая отрицательная или наиболее положительная из t-статистик (если односторонний критерий необходимый).
В тесте Даннета мы можем использовать общую таблицу критических значений, но в настоящее время во многих статистических пакетах легко доступны более гибкие варианты. Критические значения для любого процентного пункта зависят от: проводится ли одно- или двусторонний тест; количество сравниваемых групп; общее количество испытаний.
Предположения
[ редактировать ]В анализе рассматривается случай, когда результаты эксперимента являются численными, и эксперимент проводится для сравнения p обработок с контрольной группой. Результаты можно обобщить в виде набора рассчитанные средние значения наборов наблюдений, , пока речь идет о лечении и относится к контрольному набору наблюдений, и представляет собой независимую оценку общего стандартного отклонения всех наборы наблюдений. Все принадлежащий предполагается, что наборы наблюдений независимы и нормально распределены с общей дисперсией. и означает . Также предполагается, что существует доступная оценка для .
Расчет
[ редактировать ]Расчет теста Даннетта — это процедура, основанная на вычислении доверительных утверждений об истинных или ожидаемых значениях различия , таким образом, разница между средним значением групп лечения и средним значением контрольной группы. Эта процедура гарантирует, что вероятность всех заявления быть одновременно правильным равно указанному значению, . При расчете одностороннего верхнего (или нижнего) доверительного интервала для истинного значения разницы между средним значением группы лечения и контрольной группы , представляет собой вероятность того, что это фактическое значение будет меньше верхнего (или большего нижнего) предела этого интервала. При расчете двустороннего доверительного интервала представляет собой вероятность того, что истинное значение будет находиться между верхним и нижним пределами.
Сначала мы обозначим доступные N наблюдений через когда и и оцените общую дисперсию , например: когда это среднее значение группы и количество наблюдений в группе , и степени свободы. Как упоминалось ранее, мы хотели бы получить отдельные доверительные пределы для каждого различия. такая, что вероятность того, что все доверительные интервалы будут содержать соответствующие равно .
Мы рассмотрим общий случай, когда имеются группы лечения и одна контрольная группа. Мы напишем:
мы также напишем: , которое соответствует распределению t-статистики Стьюдента с n степенями свободы . Нижние доверительные пределы с совместным коэффициентом доверия для Эффекты лечения будет предоставлено:
и константы выбираются так, что . Аналогично, верхние пределы будут определяться следующим образом:
Для ограничения в обоих направлениях можно принять следующий интервал:
когда выбраны для удовлетворения . Решение этих конкретных значений для двустороннего теста и для одностороннего теста приведены в таблицах. [ 5 ] Обновленная таблица критических значений была опубликована в 1964 году. [ 6 ]
Пример: прочность ткани на разрыв
[ редактировать ]Следующий пример был адаптирован из примера Вилларса и представлен в оригинальной статье Даннета. [ 5 ] Данные представляют собой измерения прочности на разрыв ткани, обработанной тремя различными химическими процессами, по сравнению со стандартным методом производства. [ 10 ]
Стандартный | Процесс 1 | Процесс 2 | Процесс 3 | |
---|---|---|---|---|
1 | 55 | 55 | 55 | 50 |
2 | 47 | 64 | 49 | 44 |
3 | 48 | 64 | 52 | 41 |
Означает | 50 | 61 | 52 | 45 |
Дисперсия | 19 | 27 | 9 | 21 |
Критерий Даннетта можно рассчитать, применив следующие шаги:
1. Входные данные со средними значениями и отклонениями:
- Соберите измерения для каждой группы (стандартные и лечебные процессы). См. данные в приведенной выше таблице для необработанных чисел, средних и дисперсий каждой группы.
2. Рассчитать объединенную дисперсию :
- Вычислите объединенную дисперсию по всем группам. Например,
- .
3. Рассчитать стандартное отклонение :
- Возьмите квадратный корень из средней дисперсии. Например,
- .
4. Рассчитайте стандартную ошибку:
- Следующая формула дает стандартную ошибку для разницы двух средних. Например,
- .
5. Определите критическое значение :
- Используйте таблицы Даннета, чтобы найти для заданных степеней свободы и уровня доверия. Например,
- Для и :
- Односторонний:
- Двусторонний:
6. Величина, которую необходимо добавить к наблюдаемым различиям между средними значениями и/или вычесть из них, чтобы получить их доверительные пределы, обозначается как назвал это «надбавкой» ( Тьюки ) и может быть рассчитано следующим образом:
- Умножить по стандартной ошибке для разницы двух средних. Например
- Односторонний:
- Двусторонний:
7. Вычисление доверительных пределов:
- Рассчитайте доверительные пределы для каждого процесса по сравнению со стандартом. Например,
- Односторонние ограничения:
- Процесс 1:
- Процесс 2:
- Процесс 3:
- Двусторонние ограничения:
- Процесс 1:
- Процесс 2:
- Процесс 3:
8. Сделайте выводы:
- На основании вычисленных доверительных пределов сделайте выводы о каждом процессе по сравнению со стандартом. Например,
- Односторонний:
- Процесс 1: Прочность на разрыв превышает стандарт как минимум на 2,39 фунта.
- Процесс 2: Прочность на разрыв не превышает стандартную (отрицательное значение).
- Процесс 3: Прочность на разрыв не превышает стандартную (отрицательное значение).
- Двусторонний:
- Процесс 1: Прочность на разрыв превышает стандарт на 0,75–21,25 фунта.
- Процесс 2: Прочность на разрыв составляет от -8,25 до 12,25 фунтов (может превышать стандарт, а может и не превышать).
- Процесс 3: Прочность на разрыв составляет от -15,25 до 5,25 фунтов (может превышать стандарт, а может и не превышать).
Ссылки
[ редактировать ]- ^ Аптон Г. и Кук И. (2006.) Статистический словарь , 2e, Oxford University Press, Оксфорд, Соединенное Королевство.
- ^ Рамси, Дебора (19 августа 2009 г.). Статистика II для чайников . Уайли. п. 186 . Проверено 22 августа 2012 г.
Тест Даннета, разработанный.
- ^ Эверетт Б.С. и Шрондал А. (2010.) Кембриджский статистический словарь , 4e, Cambridge University Press, Кембридж, Соединенное Королевство.
- ^ «Статистическое программное обеспечение | Информационные технологии Университета Кентукки» . Уки.еду. Архивировано из оригинала 31 июля 2012 г. Проверено 22 августа 2012 г.
- ^ Jump up to: а б с д Даннетт CW (1955). «Процедура множественного сравнения для сравнения нескольких обработок с контролем» . Журнал Американской статистической ассоциации . 50 : 1096–1121. дои : 10.1080/01621459.1955.10501294 .
- ^ Jump up to: а б Даннетт К.В. (1964). «Новые таблицы для множественных сравнений с контролем», Биометрия , 20 : 482–491.
- ^ Jump up to: а б с Хауэлл, Дэвид К. Статистические методы в психологии (8-е изд.).
- ^ Тест Даннетта , HyperStat Online: вводный учебник по статистике и онлайн-учебник для помощи на курсах по статистике
- ^ Механика различных испытаний - Биостатистика BI 345. Архивировано 1 июня 2010 г. в Wayback Machine , Колледж Святого Ансельма.
- ^ Вилларс, Дональд Стэтлер (1951). Статистический дизайн и анализ экспериментов для исследований в области развития . Дубьюк, Айова: Wm. К. Браун Ко.