Односторонний дисперсионный анализ

В статистике ) — это метод сравнения того , односторонний дисперсионный анализ (или однофакторный дисперсионный анализ существенно ли различаются средние значения двух или более выборок (с использованием распределения F ). Этот метод дисперсионного анализа требует числовой переменной ответа «Y» и одной объясняющей переменной «X», следовательно, «однонаправленного». ^[1]

ANOVA проверяет нулевую гипотезу , которая утверждает, что выборки во всех группах взяты из популяций с одинаковыми средними значениями. Для этого делаются две оценки дисперсии генеральной совокупности. Эти оценки основаны на различных предположениях ( см. ниже ). ANOVA дает F-статистику — отношение дисперсии, рассчитанной между средними значениями, к дисперсии внутри выборок. Если групповые средние значения взяты из совокупностей с одинаковыми средними значениями, дисперсия между групповыми средними должна быть ниже, чем дисперсия выборок, в соответствии с центральной предельной теоремой . Таким образом, более высокий коэффициент означает, что выборки были взяты из популяций с разными средними значениями. ^[1]

Однако обычно однофакторный дисперсионный анализ используется для проверки различий как минимум между тремя группами, поскольку случай двух групп можно охватить с помощью t-критерия (Gosset, 1908). Когда есть только два средства для сравнения, t-критерий и F-тест эквивалентны; связь между ANOVA и t определяется как F = t ². Расширением однофакторного дисперсионного анализа является двусторонний дисперсионный анализ , который исследует влияние двух разных категориальных независимых переменных на одну зависимую переменную.

Предположения

Результаты однофакторного дисперсионного анализа можно считать надежными, если выполняются следующие допущения:

переменных ответа Остатки имеют нормальное распределение (или приблизительно нормальное распределение).
Дисперсии популяций равны.
Ответы для данной группы являются независимыми и одинаково распределенными нормальными случайными величинами (а не простой случайной выборкой (SRS)).

Если данные порядковые , следует использовать непараметрическую альтернативу этому тесту, например, однофакторный дисперсионный анализ Крускала-Уоллиса . обобщение t-критерия Уэлча для двух выборок. Если не известно, что дисперсии равны, можно использовать ^[2]

Отклонения от нормального состояния населения

ANOVA — относительно надежная процедура в отношении нарушений предположения о нормальности. ^[3]

Односторонний дисперсионный анализ можно обобщить на факторный и многомерный макеты, а также на ковариационный анализ. ^{[ нужны разъяснения ]}

В популярной литературе часто утверждается, что ни один из этих F -тестов не является надежным , когда имеются серьезные нарушения предположения о том, что каждая совокупность следует нормальному распределению , особенно для небольших уровней альфа и несбалансированных макетов. ^[4] Более того, также утверждается, что если основное предположение о гомоскедастичности нарушается, свойства ошибок типа I ухудшаются гораздо сильнее. ^[5]

Однако это заблуждение, основанное на работах, проведенных в 1950-х годах и ранее. Первое всестороннее исследование этой проблемы с помощью моделирования Монте-Карло было проведено Дональдсоном (1966). ^[6] Он показал, что при обычных отклонениях (положительная асимметрия, неравные дисперсии) « F -тест консервативен», и поэтому менее вероятно, чем должно быть, обнаружить, что переменная значима. Однако по мере увеличения размера выборки или количества ячеек «кривые мощности, похоже, сходятся к кривым, основанным на нормальном распределении». Тику (1971) обнаружил, что «степень ненормальной теории F отличается от мощности нормальной теории поправочным членом, который резко уменьшается с увеличением размера выборки». ^[7] Проблема ненормальности, особенно в больших выборках, гораздо менее серьезна, чем можно предположить в популярных статьях.

В настоящее время считается, что «исследования Монте-Карло широко использовались вместе с тестами, основанными на нормальном распределении, чтобы определить, насколько они чувствительны к нарушениям предположения о нормальном распределении анализируемых переменных в популяции. Общий вывод из этих исследований состоит в том, что последствия таких нарушений менее серьезны, чем считалось ранее. Хотя эти выводы не должны полностью отговаривать кого-либо от беспокойства по поводу предположения о нормальности, они увеличили общую популярность статистических тестов, зависящих от распределения, во всех областях исследований». ^[8]

Чтобы узнать о непараметрических альтернативах факториальной схемы, см. Савиловский. ^[9] Для получения дополнительной информации см. ANOVA по рангам .

Случай фиксированных эффектов, полностью рандомизированный эксперимент, несбалансированные данные.

Модель

Нормальная линейная модель описывает группы лечения с вероятностью распределения, которые представляют собой тождественные колоколообразные (нормальные) кривые с разные средства. Таким образом, для подгонки моделей требуются только средства каждой группы лечения и расчет дисперсии (средняя дисперсия в группах лечения). Расчеты средств и дисперсия выполняется как часть проверки гипотезы.

Обычно используемые нормальные линейные модели для полностью рандомизированный эксперимент: ^[10]

y_{i,j}=\mu _{j}+\varepsilon _{i,j}

(модель средств)

или

y_{i,j}=\mu +\tau _{j}+\varepsilon _{i,j}

(модель эффектов)

где

i=1,\dotsc ,I

это индекс экспериментальных единиц

j=1,\dotsc ,J

это индекс по группам лечения

I_{j}

количество экспериментальных единиц в j-й группе лечения

I=\sum _{j}I_{j}

общее количество экспериментальных единиц

y_{i,j}

это наблюдения

\mu _{j}

среднее значение наблюдений для j-й группы лечения

\mu

это среднее значение наблюдений

\tau _{j}

— j-й эффект лечения, отклонение от общего среднего значения

\sum \tau _{j}=0

\mu _{j}=\mu +\tau _{j}

\varepsilon \thicksim N(0,\sigma ^{2})

,

\varepsilon _{i,j}

представляют собой нормально распределенные случайные ошибки с нулевым средним значением.

Индекс $i$ над экспериментальными единицами можно интерпретировать несколько пути. В некоторых экспериментах одна и та же экспериментальная единица подвергаетсяспектр процедур; $i$ может указывать на конкретную единицу. В других, каждая группа лечения имеет отдельный набор экспериментальных единиц; $i$ можетпросто быть индексом в $j$ -й список.

Данные и статистические сводки данных

Одна из форм организации экспериментальных наблюдений. $y_{ij}$ с группами в столбцах:

Организация данных ANOVA, несбалансированная, однофакторная
	Списки групповых наблюдений
	$I_{1}$	$I_{2}$	$I_{3}$	$\dotso$	$I_{j}$
1	$y_{11}$	$y_{12}$	$y_{13}$		$y_{1j}$
2	$y_{21}$	$y_{22}$	$y_{23}$		$y_{2j}$
3	$y_{31}$	$y_{32}$	$y_{33}$		$y_{3j}$
$\vdots$					$\vdots$
$i$	$y_{i1}$	$y_{i2}$	$y_{i3}$	$\dotso$	$y_{ij}$

	Сводная статистика группы						Общая сводная статистика
# Соблюдается	$I_{1}$	$I_{2}$	$\dotso$	$I_{j}$	$\dotso$	$I_{J}$	# Соблюдается	$I=\sum I_{j}$
Сумма				$\sum _{i}y_{ij}$			Сумма	$\sum _{j}\sum _{i}y_{ij}$
Сумма кв.				$\sum _{i}(y_{ij})^{2}$			Сумма кв.	$\sum _{j}\sum _{i}(y_{ij})^{2}$
Иметь в виду	$m_{1}$	$\dotso$		$m_{j}$	$\dotso$	$m_{J}$	Иметь в виду	$m$
Дисперсия	$s_{1}^{2}$	$\dotso$		$s_{j}^{2}$	$\dotso$	$s_{J}^{2}$	Дисперсия	$s^{2}$

Сравнение модели с сводками: $\mu =m$ и $\mu _{j}=m_{j}$ . Среднее значение и большая дисперсия вычисляются на основе больших сумм: не из групповых средних и отклонений.

Проверка гипотезы

Учитывая сводную статистику, расчеты проверки гипотезы показаны в табличной форме. Хотя две колонки СС показаны для ихпояснительное значение, для отображения результатов требуется только один столбец.

Таблица ANOVA для фиксированной модели, однофакторного, полностью рандомизированного эксперимента
Источник вариаций	Суммы квадратов	Суммы квадратов	Степени свободы	Средний квадрат	Ф
	Пояснительная СС ^[11]	Вычислительная СС ^[12]	ДФ	РС
Лечение	$\sum _{Treatments}I_{j}(m_{j}-m)^{2}$	$\sum _{j}{\frac {(\sum _{i}y_{ij})^{2}}{I_{j}}}-{\frac {(\sum _{j}\sum _{i}y_{ij})^{2}}{I}}$	$J-1$	${\frac {SS_{Treatment}}{DF_{Treatment}}}$	${\frac {MS_{Treatment}}{MS_{Error}}}$
Ошибка	$\sum _{Treatments}(I_{j}-1)s_{j}^{2}$	$\sum _{j}\sum _{i}y_{ij}^{2}-\sum _{j}{\frac {(\sum _{i}y_{ij})^{2}}{I_{j}}}$	$I-J$	${\frac {SS_{Error}}{DF_{Error}}}$
Общий	$\sum _{Observations}(y_{ij}-m)^{2}$	$\sum _{j}\sum _{i}y_{ij}^{2}-{\frac {(\sum _{j}\sum _{i}y_{ij})^{2}}{I}}$	$I-1$

$MS_{Error}$ этооценка дисперсии, соответствующая $\sigma ^{2}$ принадлежащий модель.

Сводка анализа

Основной анализ ANOVA состоит из серии вычислений. данные собираются в табличной форме. Затем

Каждая группа лечения суммируется по количеству экспериментальных единиц, двум суммам, среднему значению и дисперсии. Сводные данные групп лечения объединяются для получения итоговых значений количества единиц и сумм. Общее среднее значение и большая дисперсия вычисляются на основе больших сумм. В модели используются лечение и основные средства.
Три DF и SS рассчитываются на основе сводок. Затем рассчитываются MS, и соотношение определяет F.
Компьютер обычно определяет значение p по F, которое определяет, дают ли методы лечения существенно отличающиеся результаты. Если результат значителен, то модель предварительно имеет валидность.

Если эксперимент сбалансирован, все $I_{j}$ условия равны, поэтому уравнения SS упрощаются.

В более сложном эксперименте, когда экспериментальные единицы (или воздействие на окружающую среду) неоднородны, статистика рядов также неоднородна. используется в анализе. Модель включает условия, зависящие от $i$ . Определение дополнительных членов уменьшает количествоимеющиеся степени свободы.

Пример

Рассмотрим эксперимент по изучению влияния трех разных уровней фактора на реакцию (например, трех уровней удобрения на рост растений). Если бы у нас было по 6 наблюдений для каждого уровня, мы могли бы записать результат эксперимента в такую таблицу, где a ₁ , a ₂ и a ₃ — три уровня изучаемого фактора.

1	a_а2	a_а3
6	8	13
8	12	9
4	9	11
5	11	8
3	6	7
4	8	12

Нулевая гипотеза, обозначенная H ₀ , для общего F -теста для этого эксперимента будет заключаться в том, что все три уровня фактора дают в среднем один и тот же ответ. Чтобы рассчитать коэффициент F :

Шаг 1. Рассчитайте среднее значение внутри каждой группы:

{\begin{aligned}{\overline {Y}}_{1}&={\frac {1}{6}}\sum Y_{1i}={\frac {6+8+4+5+3+4}{6}}=5\\{\overline {Y}}_{2}&={\frac {1}{6}}\sum Y_{2i}={\frac {8+12+9+11+6+8}{6}}=9\\{\overline {Y}}_{3}&={\frac {1}{6}}\sum Y_{3i}={\frac {13+9+11+8+7+12}{6}}=10\end{aligned}}

Шаг 2: Рассчитайте общее среднее значение:

{\overline {Y}}={\frac {\sum _{i}{\overline {Y}}_{i}}{a}}={\frac {{\overline {Y}}_{1}+{\overline {Y}}_{2}+{\overline {Y}}_{3}}{a}}={\frac {5+9+10}{3}}=8

где а — количество групп.

Шаг 3: Рассчитайте «межгрупповую» сумму квадратов разностей:

{\begin{aligned}S_{B}&=n({\overline {Y}}_{1}-{\overline {Y}})^{2}+n({\overline {Y}}_{2}-{\overline {Y}})^{2}+n({\overline {Y}}_{3}-{\overline {Y}})^{2}\\[8pt]&=6(5-8)^{2}+6(9-8)^{2}+6(10-8)^{2}=84\end{aligned}}

где n — количество значений данных на группу.

Межгрупповые степени свободы на единицу меньше числа групп.

f_{b}=3-1=2

поэтому среднеквадратичное значение между группами равно

MS_{B}=84/2=42

Шаг 4: Рассчитайте сумму квадратов «внутри группы». Начните с центрирования данных в каждой группе.

1	a_а2	a_а3
6−5=1	8−9=−1	13−10=3
8−5=3	12−9=3	9−10=−1
4−5=−1	9−9=0	11−10=1
5−5=0	11−9=2	8−10=−2
3−5=−2	6−9=−3	7−10=−3
4−5=−1	8−9=−1	12−10=2

Сумма квадратов внутри группы представляет собой сумму квадратов всех 18 значений в этой таблице.

{\begin{aligned}S_{W}=&(1)^{2}+(3)^{2}+(-1)^{2}+(0)^{2}+(-2)^{2}+(-1)^{2}+\\&(-1)^{2}+(3)^{2}+(0)^{2}+(2)^{2}+(-3)^{2}+(-1)^{2}+\\&(3)^{2}+(-1)^{2}+(1)^{2}+(-2)^{2}+(-3)^{2}+(2)^{2}\\=&\ 1+9+1+0+4+1+1+9+0+4+9+1+9+1+1+4+9+4\\=&\ 68\\\end{aligned}}

Внутригрупповые степени свободы

f_{W}=a(n-1)=3(6-1)=15

Таким образом, среднеквадратичное значение внутри группы равно

MS_{W}=S_{W}/f_{W}=68/15\approx 4.5

Шаг 5: коэффициент F -

F={\frac {MS_{B}}{MS_{W}}}\approx 42/4.5\approx 9.3

Критическое значение — это число, которое должна превысить статистика теста, чтобы тест был отклонен. В этом случае F _крит (2,15) = 3,68 при α = 0,05. Поскольку F =9,3 > 3,68, результаты значимы на уровне значимости 5%. Никто не принял бы нулевую гипотезу, заключив, что существуют убедительные доказательства того, что ожидаемые значения в трех группах различаются. Значение p для этого теста составляет 0,002.

После выполнения F -теста обычно проводится некоторый «апостериорный» анализ групповых средних. При этом средние две первых группы отличаются на 4 единицы, средние первой и третьей группы отличаются на 5 единиц, а средние второй и третьей группы отличаются всего на 1 единицу. Стандартная ошибка каждой из этих разностей равна ${\sqrt {4.5/6+4.5/6}}=1.2$ . Таким образом, первая группа сильно отличается от других групп, поскольку разница средних значений более чем в 3 раза превышает стандартную ошибку, поэтому мы можем быть вполне уверены, что среднее значение совокупности первой группы отличается от средних значений совокупности других групп. Однако нет никаких доказательств того, что вторая и третья группы имеют разные совокупные средние значения друг от друга, поскольку их средняя разница в одну единицу сравнима со стандартной ошибкой.

Примечание. F ( x , y ) обозначает кумулятивную функцию распределения F -распределения со степенями свободы x в числителе и степенями свободы y в знаменателе.

См. также

Дисперсионный анализ
F-тест ( включает пример однофакторного дисперсионного анализа )
Смешанная модель
Многомерный дисперсионный анализ (MANOVA)
Повторные измерения ANOVA
Двусторонний дисперсионный анализ
t-критерий Уэлча

Примечания

^ Jump up to: ^а ^б Хауэлл, Дэвид (2002). Статистические методы в психологии . Даксбери. стр. 324–325 . ISBN 0-534-37770-Х .
^ Уэлч, Б.Л. (1951). «О сравнении нескольких средних значений: альтернативный подход». Биометрика . 38 (3/4): 330–336. дои : 10.2307/2332579 . JSTOR 2332579 .
^ Кирк, Р.Э. (1995). Экспериментальный дизайн: процедуры для поведенческих наук (3-е изд.). Пасифик Гроув, Калифорния, США: Брукс/Коул.
^ Блер, Р.К. (1981). «Реакция на «Последствия невыполнения предположений, лежащих в основе анализа дисперсии и ковариации с фиксированными эффектами». ". Обзор образовательных исследований . 51 (4): 499–507. дои : 10.3102/00346543051004499 .
^ Рэндольф, Э.А.; Барчиковски, Р.С. (1989). «Коэффициент ошибок типа I, когда реальные значения исследования используются в качестве параметров популяции в исследовании Монте-Карло». Документ, представленный на 11-м ежегодном собрании Ассоциации исследований в области образования Среднего Запада, Чикаго .
^ Дональдсон, Теодор С. (1966). «Сила F-теста для ненормальных распределений и неравных дисперсий ошибок» . Документ подготовлен для проекта RAND ВВС США .
^ Тику, МЛ (1971). «Степневая функция F -теста в ненормальных ситуациях». Журнал Американской статистической ассоциации . 66 (336): 913–916. дои : 10.1080/01621459.1971.10482371 .
^ «Начало работы с концепциями статистики» . Архивировано из оригинала 4 декабря 2018 г. Проверено 22 сентября 2016 г.
^ Савиловский, С. (1990). «Непараметрические тесты взаимодействия при планировании эксперимента». Обзор образовательных исследований . 60 (1): 91–126. дои : 10.3102/00346543060001091 .
^ Монтгомери, Дуглас К. (2001). Планирование и анализ экспериментов (5-е изд.). Нью-Йорк: Уайли. п. Раздел 3–2. ISBN 9780471316497 .
^ Мур, Дэвид С.; Маккейб, Джордж П. (2003). Введение в практику статистики (4-е изд.). WH Freeman & Co. с. 764. ИСБН 0716796570 .
^ Винклер, Роберт Л.; Хейс, Уильям Л. (1975). Статистика: вероятность, вывод и решение (2-е изд.). Нью-Йорк: Холт, Райнхарт и Уинстон. п. 761 .

Дальнейшее чтение

Джордж Казелла (18 апреля 2008 г.). Статистический дизайн . Спрингер . ISBN 978-0-387-75965-4 .

[Howell_2002_324–325-1] Jump up to: ^а ^б Хауэлл, Дэвид (2002). Статистические методы в психологии . Даксбери. стр. 324–325 . ISBN 0-534-37770-Х .

[Welch1951-2] Уэлч, Б.Л. (1951). «О сравнении нескольких средних значений: альтернативный подход». Биометрика . 38 (3/4): 330–336. дои : 10.2307/2332579 . JSTOR 2332579 .

[Kirk-3] Кирк, Р.Э. (1995). Экспериментальный дизайн: процедуры для поведенческих наук (3-е изд.). Пасифик Гроув, Калифорния, США: Брукс/Коул.

[4] Блер, Р.К. (1981). «Реакция на «Последствия невыполнения предположений, лежащих в основе анализа дисперсии и ковариации с фиксированными эффектами». ". Обзор образовательных исследований . 51 (4): 499–507. дои : 10.3102/00346543051004499 .

[5] Рэндольф, Э.А.; Барчиковски, Р.С. (1989). «Коэффициент ошибок типа I, когда реальные значения исследования используются в качестве параметров популяции в исследовании Монте-Карло». Документ, представленный на 11-м ежегодном собрании Ассоциации исследований в области образования Среднего Запада, Чикаго .

[6] Дональдсон, Теодор С. (1966). «Сила F-теста для ненормальных распределений и неравных дисперсий ошибок» . Документ подготовлен для проекта RAND ВВС США .

[7] Тику, МЛ (1971). «Степневая функция F -теста в ненормальных ситуациях». Журнал Американской статистической ассоциации . 66 (336): 913–916. дои : 10.1080/01621459.1971.10482371 .

[8] «Начало работы с концепциями статистики» . Архивировано из оригинала 4 декабря 2018 г. Проверено 22 сентября 2016 г.

[9] Савиловский, С. (1990). «Непараметрические тесты взаимодействия при планировании эксперимента». Обзор образовательных исследований . 60 (1): 91–126. дои : 10.3102/00346543060001091 .

[10] Монтгомери, Дуглас К. (2001). Планирование и анализ экспериментов (5-е изд.). Нью-Йорк: Уайли. п. Раздел 3–2. ISBN 9780471316497 .

[11] Мур, Дэвид С.; Маккейб, Джордж П. (2003). Введение в практику статистики (4-е изд.). WH Freeman & Co. с. 764. ИСБН 0716796570 .

[12] Винклер, Роберт Л.; Хейс, Уильям Л. (1975). Статистика: вероятность, вывод и решение (2-е изд.). Нью-Йорк: Холт, Райнхарт и Уинстон. п. 761 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]