Срединный блеск
Медианная полировка — это простая и надежная процедура исследовательского анализа данных, предложенная статистиком Джоном Тьюки . Целью медианной полировки является нахождение аддитивно подходящей модели для данных в двусторонней таблице макета (обычно это результаты факторного эксперимента ) формы: эффект строки + эффект столбца + общая медиана.
Медианная полировка использует медианы, полученные из строк и столбцов двусторонней таблицы, для итеративного расчета влияния строк и столбцов на данные. Результаты не должны быть чувствительны к выбросам, поскольку итерационная процедура использует медианы, а не средние значения.
Модель двустороннего стола [ править ]
Предположим, что в ходе эксперимента переменная Y наблюдается под влиянием двух переменных. Мы можем расположить данные в двусторонней таблице, в которой одна переменная является постоянной по строкам, а другая переменная — постоянной по столбцам. Пусть i и j обозначают положение строк и столбцов (например, y ij обозначает значение y в i -й строке и j -м столбце). Тогда мы можем получить простое уравнение линейной регрессии:
где b 0 , b 1 , b 2 — константы, а x i и z j — значения, связанные со строками и столбцами соответственно.
Уравнение можно еще больше упростить, если для анализа не xi присутствуют и z j значения :
где c i и d j обозначают эффекты строк и эффекты столбцов соответственно.
Процедура [ править ]
Чтобы выполнить срединную полировку :
(1) найдите медианы строк для каждой строки, найдите медиану медиан строк, запишите это как общий эффект .
(2) вычесть каждый элемент в строке по его медиане строки, сделайте это для всех строк.
(3) вычесть общий эффект из медианы каждой строки.
(4) сделайте то же самое для каждого столбца и добавьте общий эффект от операций со столбцами к общему эффекту , полученному от операций со строками.
(5) повторяйте (1)–(4) до тех пор, пока не произойдет незначительное изменение медиан строк или столбцов.
Ссылки [ править ]
- Фредерик Мостеллер и Джон Тьюки (1977). «Анализ данных и регрессия». Ридинг, Массачусетс : Аддисон-Уэсли . ISBN 0-201-04854-X .
- Дж. Д. Эмерсон и Д. К. Хоглин (1983). «Анализ двусторонних таблиц по медианам». В книге «Понимание надежного и исследовательского анализа данных» под ред. Д. К. Хоглина, Ф. Мостеллера и Дж. В. Тьюки. Нью-Йорк : Джон Уайли и сыновья . ISBN 0-471-38491-7 . стр. 165–210.
- Уильям Н. Венейблс и Брайан Д. Рипли (2002). Статистика дополняет современную прикладную статистику S , стр. 4–5. ISBN 0-387-95457-0 .
- Анвар Фитрианто, Хари Виджаянто, Сохель Рана и Чеонг Йи Вун (2014). «Средний уровень польского языка для итоговых оценок курсов уровней MTH3000 и MTH4000». Прикладные математические науки, Vol. 8, нет. 126, стр. 6295-6302.