Модель Ли – Картера
Модель Ли-Картера представляет собой численный алгоритм, используемый для прогнозирования смертности и продолжительности жизни прогнозирования . [ 1 ] Входными данными для модели является матрица возрастных коэффициентов смертности, монотонно упорядоченная по времени, обычно с возрастом в столбцах и годами в строках. Выходные данные представляют собой прогнозируемую матрицу уровней смертности в том же формате, что и входные данные.
Модель использует разложение по сингулярным значениям (SVD), чтобы найти:
- Одномерный ряда временного вектор что отражает 80–90% тренда смертности (здесь нижний индекс относится ко времени),
- Вектор который описывает относительную смертность в каждом возрасте (здесь нижний индекс относится к возрасту) и
- Константа масштабирования (называемая здесь но в литературе не назван).
Удивительно, обычно является линейным, подразумевая, что прирост продолжительности жизни довольно постоянен из года в год в большинстве групп населения. Прежде чем рассчитывать SVD, возрастные коэффициенты смертности сначала преобразуются в , беря их логарифмы и затем центрируя их путем вычитания их возрастных средних значений с течением времени. Возрастное среднее значение во времени обозначается . Нижний индекс относится к тому факту, что охватывает как возраст, так и время.
Многие исследователи корректируют вектор, подгоняя его к эмпирической продолжительности жизни для каждого года, используя и созданный с помощью SVD. При настройке с использованием этого подхода меняется на обычно небольшие.
Чтобы спрогнозировать смертность, (скорректировано или нет) проецируется на будущие годы с использованием модели ARIMA . Соответствующий прогноз восстанавливается умножением к и первый диагональный элемент S (когда ). Фактические уровни смертности восстанавливаются путем экспоненты этого вектора.
Из-за линейности , обычно моделируется как случайное блуждание с тенденцией. Ожидаемая продолжительность жизни и другие показатели таблицы смертности могут быть рассчитаны на основе этой прогнозируемой матрицы после сложения средних и экспоненты, чтобы получить регулярные уровни смертности.
В большинстве реализаций доверительные интервалы для прогнозов генерируются путем моделирования множественных прогнозов смертности с использованием методов Монте-Карло . Диапазон смертности между 5% и 95% процентилей результатов моделирования считается достоверным прогнозом. Эти симуляции выполняются путем расширения в будущее с использованием рандомизации на основе стандартной ошибки полученные из входных данных.
Алгоритм
[ редактировать ]Алгоритм пытается найти решение уравнения методом наименьших квадратов:
где представляет собой матрицу смертности для каждого возраста в каждом году .
- Вычислить что является средним за период времени для каждого возраста:
- Вычислить который будет использоваться в СВД:
- Вычислите разложение по сингулярным значениям :
- Вывести , (масштабирующее собственное значение) и от , , и :
- Прогноз используя стандартную одномерную модель ARIMA для дополнительные годы:
- Используйте прогнозируемые , с оригиналом , и для расчета прогнозируемого уровня смертности для каждого возраста:
Обсуждение
[ редактировать ]Без применения SVD или какого-либо другого метода уменьшения размерностей таблица данных о смертности представляет собой сильно коррелированный многомерный ряд данных, и сложность этих многомерных временных рядов затрудняет их прогнозирование. SVD стал широко использоваться как метод уменьшения размеров во многих различных областях, в том числе в Google в их ранжирования страниц алгоритме .
Модель Ли-Картера была представлена Рональдом Д. Ли и Лоуренсом Картером в 1992 году в статье «Моделирование и прогнозирование смертности в США». [ 2 ] Модель возникла в результате их работы в конце 1980-х и начале 1990-х годов, когда они пытались использовать обратную проекцию для определения показателей исторической демографии . [ 3 ] Модель использовалась Администрацией социального обеспечения США , Бюро переписи населения США и Организацией Объединенных Наций. Сегодня этот метод прогнозирования смертности стал наиболее широко используемым в мире. [ 4 ]
Модель Ли-Картера была расширена, в первую очередь для учета пропущенных лет, корреляции мужского и женского населения, а также крупномасштабной согласованности в популяциях, которые имеют одинаковый режим смертности (например, в Западной Европе). Многие соответствующие статьи можно найти на веб-сайте профессора Рональда Ли .
Реализации
[ редактировать ]Существует на удивление мало программных пакетов для прогнозирования с использованием модели Ли-Картера.
- LCFIT — это веб-пакет с интерактивными формами.
- Профессор Роб Дж. Хайндман предоставляет пакет R для демографии , который включает процедуры для создания и прогнозирования модели Ли-Картера.
- Альтернативы в R включают пакет StMoMo Виллегаса, Миллоссовича и Кайшева (2015).
- Профессор Герман Родригес предоставляет код для модели Ли-Картера, используя Stata .
- Используя Matlab , профессор Эрик Жондо и профессор Майкл Рокинджер собрали набор инструментов Longevity Toolbox для оценки параметров.
Ссылки
[ редактировать ]- ^ «Метод Ли-Картера для прогнозирования смертности с различными расширениями и приложениями | SOA» (PDF) . Архивировано из оригинала (PDF) 7 марта 2019 года . Проверено 28 сентября 2010 г.
- ^ Ли, Рональд Д.; Картер, Лоуренс Р. (сентябрь 1992 г.). «Моделирование и прогнозирование смертности в США». Журнал Американской статистической ассоциации . 87 (419): 659–671. дои : 10.2307/2290201 .
- ^ Ли, Рональд (5 июня 2003 г.). «Размышления об обратной проекции: ее происхождение, развитие, расширение и связь с прогнозированием» .
- ^ Федерико Джирози; Гэри Кинг. «Понимание метода прогнозирования смертности Ли-Картера» (PDF) . Гарвардский университет . Проверено 12 апреля 2023 г.