Уменьшенная статистика хи-квадрат
Эта статья может быть слишком технической для понимания большинства читателей . ( Апрель 2021 г. ) |
В статистике приведенная статистика хи-квадрат широко используется при проверке пригодности . Оно также известно как среднеквадратичное взвешенное отклонение ( MSWD ) при изотопном датировании. [1] и дисперсия единичного веса в контексте взвешенного метода наименьших квадратов . [2] [3]
Его квадратный корень называется стандартной ошибкой регрессии . [4] стандартная ошибка регрессии , [5] [6] или стандартная ошибка уравнения [7] (см. § Обычные наименьшие квадраты § Приведенный хи-квадрат )
Определение
[ редактировать ]Он определяется как хи-квадрат на степень свободы : [8] [9] [10] [11] : 85 [12] [13] [14] [15] где хи-квадрат представляет собой взвешенную сумму квадратов отклонений : со входами: дисперсия , наблюдения O и расчетные данные C . [8] Степень свободы, , равно количеству наблюдений n минус количество подогнанных параметров m .
В методе взвешенных наименьших квадратов определение часто записывается в матричной записи как где r — вектор остатков, а W — весовая матрица, обратная входной (диагональной) ковариационной матрице наблюдений. Если W недиагональна, то применяется обобщенный метод наименьших квадратов .
В обычном методе наименьших квадратов определение упрощается до: где числитель — остаточная сумма квадратов (RSS).
Когда соответствие является обычным средним значением, тогда выборки равно стандартному отклонению .
Обсуждение
[ редактировать ]Как правило, если дисперсия ошибки измерения известна заранее , указывает на плохую подгонку модели. А указывает на то, что подгонка не полностью уловила данные (или что дисперсия ошибки была недооценена). В принципе, значение вокруг указывает на то, что степень соответствия между наблюдениями и оценками соответствует дисперсии ошибок. А указывает на то, что модель « переобучает » данные: либо модель неправильно аппроксимирует шум, либо дисперсия ошибки была завышена. [11] : 89
Когда дисперсия ошибки измерения известна лишь частично, поправкой приведенный хи-квадрат может служить апостериорной .
Приложения
[ редактировать ]Геохронология
[ редактировать ]В геохронологии MSWD — это мера согласия, которая учитывает относительную важность как внутренней, так и внешней воспроизводимости, чаще всего используется при изотопном датировании. [16] [17] [1] [18] [19] [20]
В общем, когда:
MSWD = 1, если данные о возрасте соответствуют одномерному нормальному распределению в пространстве t (для среднего арифметического возраста) или log( t ) (для среднего геометрического возраста), или если данные о составе соответствуют двумерному нормальному распределению в пространстве [log( U / He ),log( Th /He)]-пространство (для центрального возраста).
MSWD < 1, если наблюдаемый разброс меньше, чем предсказывается аналитическими неопределенностями. В этом случае говорят, что данные «недостаточно разбросаны», что указывает на то, что аналитические неопределенности были завышены.
MSWD > 1, если наблюдаемый разброс превышает предсказанный аналитическими неопределенностями. В этом случае говорят, что данные «чрезмерно рассредоточены». Такая ситуация является скорее правилом, чем исключением в геохронологии (U-Th)/He, что указывает на неполное понимание изотопной системы. Для объяснения чрезмерного разброса данных по (U-Th)/He было предложено несколько причин, включая неравномерное распределение U-Th и радиационное повреждение.
Часто геохронолог определяет серию измерений возраста на одном образце, причем измеренное значение имеющий вес и связанная с этим ошибка для каждого определения возраста. Что касается взвешивания, можно либо одинаково взвесить все измеренные возрасты, либо взвесить их по доле выборки, которую они представляют. Например, если две трети выборки были использованы для первого измерения и одна треть для второго и последнего измерения, то первое измерение можно было бы взвесить в два раза больше, чем второе.
Среднее арифметическое определений возраста равно но это значение может ввести в заблуждение, если только каждое определение возраста не будет иметь одинаковое значение.
Когда можно предположить, что каждое измеренное значение имеет одинаковый вес или значимость, смещенные и несмещенные (или « выборка » и «популяция» соответственно) оценки дисперсии вычисляются следующим образом:
Стандартное отклонение — это квадратный корень дисперсии.
Когда отдельные определения возраста не имеют равной значимости, лучше использовать средневзвешенное значение для получения «среднего» возраста следующим образом:
Можно показать, что смещенная взвешенная оценка дисперсии имеет вид который можно вычислить как
Несмещенную взвешенную оценку выборочной дисперсии можно вычислить следующим образом: Опять же, соответствующее стандартное отклонение представляет собой квадратный корень дисперсии.
Несмещенную взвешенную оценку выборочной дисперсии также можно вычислить на лету следующим образом:
Затем можно вычислить невзвешенный средний квадрат взвешенных отклонений (невзвешенное MSWD) следующим образом:
По аналогии средневзвешенный квадрат взвешенных отклонений (взвешенное MSWD) можно вычислить следующим образом:
Экспресс-анализ
[ редактировать ]При анализе данных на основе модели Раша приведенная статистика хи-квадрат называется среднеквадратичной статистикой снаряжения, а приведенная с учетом информации приведенная статистика хи-квадрат называется среднеквадратичной статистикой соответствия. [21]
Ссылки
[ редактировать ]- ^ Jump up to: а б Вендт И. и Карл К., 1991, Статистическое распределение среднеквадратического взвешенного отклонения, Химическая геология, 275–285.
- ^ Стрэнг, Гилберт; Борре, Кае (1997). Линейная алгебра, геодезия и GPS . Уэлсли-Кембридж Пресс. п. 301. ИСБН 9780961408862 .
- ^ Кох, Карл-Рудольф (2013). Оценка параметров и проверка гипотез в линейных моделях . Шпрингер Берлин Гейдельберг. Раздел 3.2.5. ISBN 9783662039762 .
- ^ Джулиан Фарауэй (2000), Практическая регрессия и Anova с использованием R
- ^ Кенни, Дж.; Хранение, Е.С. (1963). Математика статистики . ван Ностранд. п. 187.
- ^ Цвиллингер, Д. (1995). Стандартные математические таблицы и формулы . Чепмен и Холл/CRC. п. 626. ИСБН 0-8493-2479-3 .
- ^ Хаяси, Фумио (2000). Эконометрика . Издательство Принстонского университета. ISBN 0-691-01018-8 .
- ^ Jump up to: а б Лауб, Чарли; Куль, Тоня Л. (nd), Насколько плохо — это хорошо? Критический взгляд на подбор моделей отражательной способности с использованием приведенной статистики хи-квадрат (PDF) , Калифорнийский университет, Дэвис, заархивировано из оригинала (PDF) 6 октября 2016 г. , получено 30 мая 2015 г.
- ^ Тейлор, Джон Роберт (1997), Введение в анализ ошибок , University Science Books, стр. 268
- ^ Киркман, TW (nd), Аппроксимация кривой хи-квадрат , получено 30 мая 2015 г.
- ^ Jump up to: а б Бевингтон, Филип Р. (1969), Сокращение данных и анализ ошибок для физических наук , Нью-Йорк: McGraw-Hill.
- ^ Измерения и их неопределенности: практическое руководство по современному анализу ошибок, Ифан Хьюз, Томас Хейс [1]
- ^ Работа с неопределенностями: Руководство по анализу ошибок, Манфред Дросг [2]
- ^ Практическая статистика для астрономов, Дж. В. Уолл, Ч. Р. Дженкинс.
- ^ Вычислительные методы в физике и технике, Сэмюэл Шоу Минг Вонг [3]
- ^ Дикин, А.П. 1995. Геология радиогенных изотопов. Издательство Кембриджского университета, Кембридж, Великобритания, 1995 г., ISBN 0-521-43151-4 , ISBN 0-521-59891-5
- ^ Макдугалл, И. и Харрисон, Т.М. 1988. Геохронология и термохронология, проведенная 40 с/ 39 Ар метод. Издательство Оксфордского университета.
- ^ Лэнс П. Блэк, Сандра Л. Камо, Шарлотта М. Аллен, Джон Н. Алейников, Дональд В. Дэвис, Рассел Дж. Корш, Крис Фудулис 2003. TEMORA 1: новый стандарт циркона для фанерозойской U-Pb геохронологии. Химическая геология 200, 155–170.
- ^ MJ Streule, RJ Phillips, MP Searle, DJ Waters и MSA Horstwood 2009. Эволюция и хронология метаморфического комплекса Пангонг, смежная с моделированием и U-Pb геохронологией Каракорумского разлома, Ладакх: ограничения термобарометрии, метаморфического моделирования и U-Pb геохронологии. Журнал Геологического общества 166, 919–932. дои : 10.1144/0016-76492008-117
- ^ Роджер Пауэлл, Джанет Хергт , Джон Вудхед, 2002. Улучшение расчетов изохрон с помощью надежной статистики и начальной загрузки. Химическая геология 185, 191–204.
- ^ Линакр, Дж. М. (2002). «Что означают Infit и Outfit, среднеквадратичный и стандартизированный?» . Транзакции измерения Раша . 16 (2): 878.