Jump to content

Режимы вариации

В статистике способы изменения [1] представляют собой непрерывно индексируемый набор векторов или функций, центрированных по среднему значению и используемых для отображения изменений в популяции или выборке. Обычно шаблоны вариаций данных можно разложить в порядке убывания собственных значений с направлениями, представленными соответствующими собственными векторами или собственными функциями . Режимы вариации обеспечивают визуализацию этого разложения и эффективное описание отклонения от среднего значения. Как в анализе главных компонентов (PCA), так и в функциональном анализе главных компонентов (FPCA) режимы вариаций играют важную роль в визуализации и описании изменений данных, вносимых каждым собственным компонентом. [2] В реальных приложениях собственные компоненты и связанные с ними режимы изменения помогают интерпретировать сложные данные, особенно при исследовательском анализе данных (EDA).

Формулировка

[ редактировать ]

Режимы вариации являются естественным продолжением PCA и FPCA .

Режимы изменения PCA

[ редактировать ]

Если случайный вектор имеет средний вектор и ковариационная матрица с собственными значениями и соответствующие ортонормированные собственные векторы , путем собственного разложения вещественной симметричной матрицы , ковариационная матрица можно разложить как

где ортогональная матрица , столбцы которой являются собственными векторами , и - диагональная матрица, элементы которой являются собственными значениями . С помощью разложения Карунена – Лоэва для случайных векторов можно выразить центрированный случайный вектор в собственном базисе

где является основным компонентом [3] связанный с -й собственный вектор , со свойствами

и

Тогда -й способ изменения представляет собой набор векторов, индексированных ,

где обычно выбирается как .

Режимы вариаций в FPCA

[ редактировать ]

Для интегрируемой с квадратом случайной функции, , где обычно и — интервал, обозначим среднюю функцию через и ковариационная функция

где являются собственными значениями и ортонормированные собственные функции линейного оператора Гильберта–Шмидта

По теореме Карунена-Лёва можно выразить центрированную функцию в собственном базисе:

где

это -й главный компонент со свойствами

и

Тогда -й способ изменения представляет собой набор функций, индексированных ,

которые рассматриваются одновременно в диапазоне , обычно для . [2]

Приведенная выше формулировка основана на свойствах населения. Оценка необходима в реальных приложениях. Основная идея состоит в том, чтобы оценить среднее значение и ковариацию.

Режимы изменения PCA

[ редактировать ]

Предположим, данные представлять независимые рисунки из некоторых -мерное население со средним вектором и ковариационная матрица . Эти данные дают выборочный средний вектор и выборочная ковариационная матрица с парами собственное значение-собственный вектор . Тогда -й способ изменения можно оценить по

Режимы вариаций в FPCA

[ редактировать ]

Учитывать реализации с квадратом интегрируемой случайной функции, со средней функцией и ковариационная функция . Функциональный анализ главных компонент предоставляет методы оценки и подробно, часто с использованием точечной оценки и интерполяции . Подставляя оценки для неизвестных величин, -й способ изменения можно оценить по

Приложения

[ редактировать ]
Первый и второй режимы изменения данных женской смертности из 41 страны в 2003 г. [4]
Первый и второй режимы изменения данных мужской смертности из 41 страны в 2003 г. [4]

Режимы вариаций полезны для визуализации и описания закономерностей вариаций данных, отсортированных по собственным значениям. В реальных приложениях режимы изменения, связанные с собственными компонентами, позволяют интерпретировать сложные данные, такие как эволюция характеристик функций. [5] и другие бесконечномерные данные. [6] Чтобы проиллюстрировать, как режимы изменения работают на практике, на графиках справа показаны два примера, которые отображают первые два режима изменения. Сплошная кривая представляет выборочную среднюю функцию. Штриховые, штрихпунктирные и пунктирные кривые соответствуют модам изменения с и , соответственно.

На первом графике показаны первые два режима изменения данных женской смертности из 41 страны в 2003 году. [4] Объектом интереса является логарифм функции риска в возрасте от 0 до 100 лет. Первый тип вариаций предполагает, что вариация женской смертности меньше в возрасте около 0 или 100 лет и больше в возрасте около 25 лет. Соответствующая и интуитивная интерпретация состоит в том, что смертность в возрасте около 25 лет обусловлена ​​случайной смертью, а в возрасте около 0 или 100 лет — в результате несчастного случая. смертность связана с врожденными заболеваниями или естественной смертью.

По сравнению с данными женской смертности, способы изменения данных мужской смертности показывают более высокую смертность примерно после 20 лет, что, возможно, связано с тем, что ожидаемая продолжительность жизни женщин выше, чем у мужчин.

  1. ^ Кастро, ЧП; Лоутон, Вашингтон; Сильвестр, Э.А. (ноябрь 1986 г.). «Основные режимы изменения процессов с непрерывными выборочными кривыми». Технометрика . 28 (4): 329. дои : 10.2307/1268982 . ISSN   0040-1706 . JSTOR   1268982 .
  2. ^ Jump up to: а б Ван, Джейн-Линг; Чиу, Дженг-Мин; Мюллер, Ханс-Георг (июнь 2016 г.). «Функциональный анализ данных» . Ежегодный обзор статистики и ее применения . 3 (1): 257–295. doi : 10.1146/annurev-statistics-041715-033624 . ISSN   2326-8298 .
  3. ^ Клеффе, Юрген (январь 1973 г.). «Главные компоненты случайных величин со значениями в сепарабельном гильбертовом пространстве». Исследование математических операций и статистика . 4 (5): 391–406. дои : 10.1080/02331887308801137 . ISSN   0047-6277 .
  4. ^ Jump up to: а б с «База данных о смертности людей» . www.mortality.org . Проверено 12 марта 2020 г.
  5. ^ Киркпатрик, Марк; Хекман, Нэнси (август 1989 г.). «Количественная генетическая модель роста, формы, норм реакции и других бесконечномерных признаков». Журнал математической биологии . 27 (4): 429–450. дои : 10.1007/bf00290638 . ISSN   0303-6812 . ПМИД   2769086 . S2CID   46336613 .
  6. ^ Джонс, MC; Райс, Джон А. (май 1992 г.). «Отображение важных особенностей больших коллекций подобных кривых». Американский статистик . 46 (2): 140–145. дои : 10.1080/00031305.1992.10475870 . ISSN   0003-1305 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 0f2b72e838c367d0ca57dc475eccf2af__1702301880
URL1:https://arc.ask3.ru/arc/aa/0f/af/0f2b72e838c367d0ca57dc475eccf2af.html
Заголовок, (Title) документа по адресу, URL1:
Modes of variation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)