Доверительная область
В статистике доверительная область — это многомерное обобщение доверительного интервала . Это набор точек в n -мерном пространстве, часто представленный в виде эллипсоида вокруг точки, которая является предполагаемым решением проблемы, хотя могут встречаться и другие формы.
Интерпретация
[ редактировать ]Доверительная область рассчитывается таким образом, что если набор измерений повторялся много раз и доверительная область рассчитывалась одинаково для каждого набора измерений, то в определенный процент времени (например, 95%) доверительная область будет включите точку, представляющую «истинные» значения набора оцениваемых переменных. Однако если не определенные предположения об априорных вероятностях сделаны , это не означает, что при расчете одной доверительной области существует 95% вероятность того, что «истинные» значения лежат внутри этой области, поскольку мы не предполагаем никакой конкретной вероятности. распределение «истинных» значений, и мы можем иметь или не иметь другую информацию о том, где они могут находиться.
Случай независимых одинаково нормально распределенных ошибок
[ редактировать ]Предположим, мы нашли решение к следующей переопределенной задаче:
где Y — n -мерный вектор-столбец, содержащий наблюдаемые значения зависимой переменной , X — матрица n -x p наблюдаемых значений независимых переменных (которая может представлять физическую модель), которая предполагается точно известной, - вектор-столбец, содержащий параметры p , которые необходимо оценить, и представляет собой n -мерный вектор-столбец ошибок, которые, как предполагается, независимо распределены с нормальными распределениями с нулевым средним значением и каждая из которых имеет одинаковую неизвестную дисперсию. .
Совместная доверительная область 100(1 − α ) % для элементов представлен набором значений вектора b, удовлетворяющих следующему неравенству: [1]
где переменная b представляет собой любую точку доверительной области, p — количество параметров, т. е. количество элементов вектора – вектор оцениваемых параметров, s 2 — приведенный хи-квадрат , несмещенная оценка равный
Кроме того, F — функция квантиля , F-распределения где p и степени свободы , – уровень статистической значимости , а символ означает транспонирование .
Выражение можно переписать как:
где - это ковариационная матрица, масштабированная по методу наименьших квадратов .
Приведенное выше неравенство определяет эллипсоидальную область в p -мерном декартовом пространстве параметров R п . Центр эллипсоида находится по оценке . По мнению Пресса и др., эллипсоид легче построить после выполнения разложения по сингулярным значениям . Длины осей эллипсоида пропорциональны обратным значениям на диагоналях диагональной матрицы, а направления этих осей задаются строками 3-й матрицы разложения.
Взвешенные и обобщенные методы наименьших квадратов
[ редактировать ]Теперь рассмотрим более общий случай, когда некоторые отдельные элементы иметь известную ненулевую ковариацию (другими словами, ошибки в наблюдениях не распределяются независимо) и/или не все стандартные отклонения ошибок равны. Предположим, что ковариационная матрица является , где V — n x невырожденная матрица размера n , равная в более конкретном случае, рассмотренном в предыдущем разделе (где I — единичная матрица ), но здесь допускается наличие ненулевых недиагональных элементов, представляющих ковариацию пар отдельных наблюдений, а также не обязательно наличие всех диагональных элементов. равный.
можно найти [2] неособая симметричная матрица P такая, что
По сути, является квадратным корнем из ковариационной матрицы V. P
Задача наименьших квадратов
затем может быть преобразовано путем умножения каждого члена слева на обратное P , образуя новую формулировку проблемы
где
- и
Совместная доверительная область для параметров, т.е. для элементов , тогда ограничен эллипсоидом, заданным формулой: [3]
Здесь F представляет собой процентную точку F -распределения , а величины p и np представляют собой степени свободы , которые являются параметрами этого распределения.
Нелинейные задачи
[ редактировать ]Доверительные области могут быть определены для любого распределения вероятностей. Экспериментатор может выбрать уровень значимости и форму области, после чего размер области определяется распределением вероятностей. Естественный выбор — использовать в качестве границы набор точек с постоянными ( хи-квадрат ) значения.
Один из подходов состоит в том, чтобы использовать линейную аппроксимацию нелинейной модели, которая может быть близкой аппроксимацией вблизи решения, а затем применить анализ линейной задачи, чтобы найти приблизительную доверительную область. Это может быть разумным подходом, если доверительная область не очень велика и вторые производные модели также не очень велики.
начальной загрузки . Также можно использовать подходы [4]
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Дрейпер и Смит (1981, стр. 94)
- ^ Дрейпер и Смит (1981, стр. 108)
- ^ Дрейпер и Смит (1981, стр. 109)
- ^ Хаттон Т.Дж., Бакстон Б.Ф., Хаммонд П., Поттс HWW (2003). Оценка средних траекторий роста в пространстве форм с использованием сглаживания ядра . Транзакции IEEE по медицинской визуализации , 22 (6):747-53
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( сентябрь 2011 г. ) |
Ссылки
[ редактировать ]- Дрейпер, Северная Каролина; Х. Смит (1981) [1966]. Прикладной регрессионный анализ (2-е изд.). John Wiley and Sons Ltd. США: ISBN 0-471-02995-5 .
- Пресс, WH; С.А. Теукольский; У. Т. Феттерлинг; Б. П. Фланнери (1992) [1988]. Численные рецепты в C: Искусство научных вычислений (2-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета.