Режимы вариации
В статистике способы изменения [1] представляют собой непрерывно индексируемый набор векторов или функций, центрированных по среднему значению и используемых для отображения изменений в популяции или выборке. Обычно шаблоны вариаций данных можно разложить в порядке убывания собственных значений с направлениями, представленными соответствующими собственными векторами или собственными функциями . Режимы вариации обеспечивают визуализацию этого разложения и эффективное описание отклонения от среднего значения. Как в анализе главных компонентов (PCA), так и в функциональном анализе главных компонентов (FPCA) режимы вариаций играют важную роль в визуализации и описании изменений данных, вносимых каждым собственным компонентом. [2] В реальных приложениях собственные компоненты и связанные с ними режимы изменения помогают интерпретировать сложные данные, особенно при исследовательском анализе данных (EDA).
Формулировка
[ редактировать ]Режимы вариации являются естественным продолжением PCA и FPCA .
Режимы изменения PCA
[ редактировать ]Если случайный вектор имеет средний вектор и ковариационная матрица с собственными значениями и соответствующие ортонормированные собственные векторы , путем собственного разложения вещественной симметричной матрицы , ковариационная матрица можно разложить как
где ортогональная матрица , столбцы которой являются собственными векторами , и - диагональная матрица, элементы которой являются собственными значениями . С помощью разложения Карунена – Лоэва для случайных векторов можно выразить центрированный случайный вектор в собственном базисе
где является основным компонентом [3] связанный с -й собственный вектор , со свойствами
- и
Тогда -й способ изменения представляет собой набор векторов, индексированных ,
где обычно выбирается как .
Режимы вариаций в FPCA
[ редактировать ]Для интегрируемой с квадратом случайной функции, , где обычно и — интервал, обозначим среднюю функцию через и ковариационная функция
где являются собственными значениями и — ортонормированные собственные функции линейного оператора Гильберта–Шмидта
По теореме Карунена-Лёва можно выразить центрированную функцию в собственном базисе:
где
это -й главный компонент со свойствами
- и
Тогда -й способ изменения представляет собой набор функций, индексированных ,
которые рассматриваются одновременно в диапазоне , обычно для . [2]
Оценка
[ редактировать ]Приведенная выше формулировка основана на свойствах населения. Оценка необходима в реальных приложениях. Основная идея состоит в том, чтобы оценить среднее значение и ковариацию.
Режимы изменения PCA
[ редактировать ]Предположим, данные представлять независимые рисунки из некоторых -мерное население со средним вектором и ковариационная матрица . Эти данные дают выборочный средний вектор и выборочная ковариационная матрица с парами собственное значение-собственный вектор . Тогда -й способ изменения можно оценить по
Режимы вариаций в FPCA
[ редактировать ]Учитывать реализации с квадратом интегрируемой случайной функции, со средней функцией и ковариационная функция . Функциональный анализ главных компонент предоставляет методы оценки и подробно, часто с использованием точечной оценки и интерполяции . Подставляя оценки для неизвестных величин, -й способ изменения можно оценить по
Приложения
[ редактировать ]

Режимы вариаций полезны для визуализации и описания закономерностей вариаций данных, отсортированных по собственным значениям. В реальных приложениях режимы изменения, связанные с собственными компонентами, позволяют интерпретировать сложные данные, такие как эволюция характеристик функций. [5] и другие бесконечномерные данные. [6] Чтобы проиллюстрировать, как режимы изменения работают на практике, на графиках справа показаны два примера, которые отображают первые два режима изменения. Сплошная кривая представляет выборочную среднюю функцию. Штриховые, штрихпунктирные и пунктирные кривые соответствуют модам изменения с и , соответственно.
На первом графике показаны первые два режима изменения данных женской смертности из 41 страны в 2003 году. [4] Объектом интереса является логарифм функции риска в возрасте от 0 до 100 лет. Первый тип вариаций предполагает, что вариация женской смертности меньше в возрасте около 0 или 100 лет и больше в возрасте около 25 лет. Соответствующая и интуитивная интерпретация состоит в том, что смертность в возрасте около 25 лет обусловлена случайной смертью, а в возрасте около 0 или 100 лет — в результате несчастного случая. смертность связана с врожденными заболеваниями или естественной смертью.
По сравнению с данными женской смертности, способы изменения данных мужской смертности показывают более высокую смертность примерно после 20 лет, что, возможно, связано с тем, что ожидаемая продолжительность жизни женщин выше, чем у мужчин.
Ссылки
[ редактировать ]- ^ Кастро, ЧП; Лоутон, Вашингтон; Сильвестр, Э.А. (ноябрь 1986 г.). «Основные режимы изменения процессов с непрерывными выборочными кривыми». Технометрика . 28 (4): 329. дои : 10.2307/1268982 . ISSN 0040-1706 . JSTOR 1268982 .
- ^ Jump up to: а б Ван, Джейн-Линг; Чиу, Дженг-Мин; Мюллер, Ханс-Георг (июнь 2016 г.). «Функциональный анализ данных» . Ежегодный обзор статистики и ее применения . 3 (1): 257–295. doi : 10.1146/annurev-statistics-041715-033624 . ISSN 2326-8298 .
- ^ Клеффе, Юрген (январь 1973 г.). «Главные компоненты случайных величин со значениями в сепарабельном гильбертовом пространстве». Исследование математических операций и статистика . 4 (5): 391–406. дои : 10.1080/02331887308801137 . ISSN 0047-6277 .
- ^ Jump up to: а б с «База данных о смертности людей» . www.mortality.org . Проверено 12 марта 2020 г.
- ^ Киркпатрик, Марк; Хекман, Нэнси (август 1989 г.). «Количественная генетическая модель роста, формы, норм реакции и других бесконечномерных признаков». Журнал математической биологии . 27 (4): 429–450. дои : 10.1007/bf00290638 . ISSN 0303-6812 . ПМИД 2769086 . S2CID 46336613 .
- ^ Джонс, MC; Райс, Джон А. (май 1992 г.). «Отображение важных особенностей больших коллекций подобных кривых». Американский статистик . 46 (2): 140–145. дои : 10.1080/00031305.1992.10475870 . ISSN 0003-1305 .