В статистике ожидаемые средние квадраты (EMS) — это ожидаемые значения определенных статистических данных, возникающих в разделах сумм квадратов при дисперсионном анализе (ANOVA). Их можно использовать для определения того, какая статистика должна появиться в знаменателе F-теста для проверки нулевой гипотезы об отсутствии определенного эффекта.
Когда общая скорректированная сумма квадратов в ANOVA разбивается на несколько компонентов, каждый из которых связан с влиянием определенной переменной-предиктора, каждая из сумм квадратов в этом разделе является случайной величиной, имеющей ожидаемое значение . Это ожидаемое значение, разделенное на соответствующее количество степеней свободы, представляет собой ожидаемый средний квадрат для этой предикторной переменной.
Следующий пример взят из «Продольного анализа данных» Дональда Хедекера и Роберта Д. Гиббонса . [1]
Каждый из s курсов лечения (один из которых может быть плацебо) назначается выборке из (столичных) N случайно выбранных пациентов, у которых определены определенные измерения.
наблюдаются в каждый из (строчных) n заданных моментов времени, для
(таким образом, количество пациентов, получающих различное лечение, может различаться), и
Мы предполагаем, что наборы пациентов, получающих различное лечение, не пересекаются, поэтому пациенты вложены в лечение, а не пересекаются с лечением. У нас есть

где
= среднее значение (фиксированное)
= эффект лечения
, (зафиксированный)
= эффект времени
, (зафиксированный)
= эффект взаимодействия лечения
и время
, (зафиксированный)
= эффект индивидуальных различий для пациента
вложенный в лечение
, (случайный)
= ошибка для пациента
на лечении
во время
. (случайный)
= дисперсия случайного эффекта пациентов, вложенных в лечение,
= дисперсия ошибки.
Общая исправленная сумма квадратов равна

Таблица ANOVA ниже разделяет сумму квадратов (где
):
источник изменчивости | степени свободы | сумма квадратов | средний квадрат | ожидаемый средний квадрат |
---|
уход |  |  |  |  |
время |  |  |  |  |
лечение × время |  |  |  |  |
пациенты в рамках лечения |  |  |  |  |
ошибка |  |  |  |  |
Нулевая гипотеза, представляющая интерес, заключается в том, что нет разницы между эффектами различных методов лечения, а значит, нет различий и между средствами лечения. Это можно выразить, сказав
(с обозначениями, использованными в таблице выше). Согласно этой нулевой гипотезе ожидаемый средний квадрат эффектов лечения равен 
Числителем F-статистики для проверки этой гипотезы является средний квадрат, обусловленный различиями между методами лечения, т.е.
Знаменатель, однако, не
Причина в том, что приведенная ниже случайная величина, хотя при нулевой гипотезе и имеет F-распределение , не является наблюдаемой (это не статистика), поскольку ее значение зависит от ненаблюдаемых параметров.
и 

Вместо этого в качестве тестовой статистики используется следующая случайная величина, которая не определена в терминах
:

- ^ Дональд Хедекер, Роберт Д. Гиббонс. Продольный анализ данных. Уайли Интерсайенс. 2006. стр. 21–24.