Jump to content

Разделение сумм квадратов

(Перенаправлено из Сумма квадратов (статистика) )

Разделение сумм квадратов – это концепция, которая пронизывает большую часть статистики вывода и описательной статистики . Точнее, это разделение сумм квадратов отклонений или ошибок . Математически сумма квадратов отклонений представляет собой немасштабированную или нескорректированную меру дисперсии (также называемой изменчивостью ). При масштабировании по количеству степеней свободы он оценивает дисперсию или разброс наблюдений об их среднем значении. Разделение суммы квадратов отклонений на различные компоненты позволяет отнести общую изменчивость в наборе данных к различным типам или источникам изменчивости, при этом относительная важность каждого из них количественно определяется размером каждого компонента общей суммы квадратов.

Расстояние от любой точки набора данных до среднего значения данных является отклонением. Это можно записать как , где - i-я точка данных, а это оценка среднего значения. Если все такие отклонения возвести в квадрат, то суммировать, как в , это дает «сумму квадратов» для этих данных.

Когда в коллекцию добавляется больше данных, сумма квадратов увеличивается, за исключением маловероятных случаев, например, когда новые данные равны среднему значению. Поэтому обычно сумма квадратов будет расти с размером сбора данных. Это проявление того, что оно немасштабировано.

Во многих случаях количество степеней свободы — это просто количество точек данных в коллекции минус одна. Мы запишем это как n - 1, где n — количество точек данных.

Масштабирование (также известное как нормализация) означает корректировку суммы квадратов таким образом, чтобы она не росла по мере увеличения размера коллекции данных. Это важно, когда мы хотим сравнить выборки разного размера, например выборку из 100 человек по сравнению с выборкой из 20 человек. Если бы сумма квадратов не была нормализована, ее значение для выборки из 100 человек всегда было бы больше, чем для выборки из 20 человек. Чтобы масштабировать сумму квадратов, мы делим ее на степени свободы, т. е. вычисляем сумму квадратов на степень свободы или дисперсию. Стандартное отклонение , в свою очередь, представляет собой квадратный корень дисперсии.

Вышеописанное описывает, как сумма квадратов используется в описательной статистике; см. статью об общей сумме квадратов , где описано применение этого широкого принципа к статистике вывода .

Разделение суммы квадратов в линейной регрессии

[ редактировать ]

Теорема. Учитывая модель линейной регрессии включая постоянную , по образцу содержащие n наблюдений, общая сумма квадратов можно разделить следующим образом на объяснимую сумму квадратов (ESS) и остаточную сумму квадратов (RSS):

где это уравнение эквивалентно каждой из следующих форм:

где значение, оцененное с помощью линии регрессии, имеющей , , ..., как расчетные коэффициенты . [1]

Доказательство

[ редактировать ]

Требование, чтобы модель включала константу или, что то же самое, чтобы матрица плана содержала столбец единиц, гарантирует, что , то есть .

Доказательство также можно выразить в векторной форме следующим образом:

При исключении терминов в последней строке использовался тот факт, что

Дальнейшее разбиение

[ редактировать ]

Обратите внимание, что остаточную сумму квадратов можно разделить на сумму квадратов несоответствия плюс сумму квадратов из-за чистой ошибки.

См. также

[ редактировать ]
  1. ^ «Сумма квадратов – определение, формулы, регрессионный анализ» . Институт корпоративных финансов . Проверено 16 октября 2020 г.
  • Бейли, РА (2008). План сравнительных экспериментов . Издательство Кембриджского университета. ISBN  978-0-521-68357-9 . Предварительные главы доступны в Интернете.
  • Кристенсен, Рональд (2002). Плоские ответы на сложные вопросы: теория линейных моделей (Третье изд.). Нью-Йорк: Спрингер. ISBN  0-387-95361-2 .
  • Уиттл, Питер (1963). Прогнозирование и регулирование . Издательство английских университетов. ISBN  0-8166-1147-5 .
    Переиздано как: Уиттл, П. (1983). Прогнозирование и регулирование линейными методами наименьших квадратов . Университет Миннесоты Пресс. ISBN  0-8166-1148-3 .
  • Уиттл, П. (20 апреля 2000 г.). Вероятность через ожидание (4-е изд.). Спрингер. ISBN  0-387-98955-2 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f2eb5dc0018a7b26879596a27c4b316b__1686375360
URL1:https://arc.ask3.ru/arc/aa/f2/6b/f2eb5dc0018a7b26879596a27c4b316b.html
Заголовок, (Title) документа по адресу, URL1:
Partition of sums of squares - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)