Нелинейная модель смешанных эффектов
Часть серии о |
Регрессионный анализ |
---|
Модели |
Оценка |
Фон |
Нелинейные модели смешанных эффектов составляют класс статистических моделей, обобщающих линейные модели смешанных эффектов . Как и линейные модели смешанных эффектов, они особенно полезны в условиях, когда в пределах одних и тех же статистических единиц проводится несколько измерений или когда существуют зависимости между измерениями на связанных статистических единицах. Нелинейные модели смешанных эффектов применяются во многих областях, включая медицину , здравоохранение , фармакологию и экологию . [1] [2]
Определение
[ редактировать ]Хотя любая статистическая модель, содержащая как фиксированные эффекты , так и случайные эффекты, является примером нелинейной модели смешанных эффектов, наиболее часто используемые модели являются членами класса нелинейных моделей смешанных эффектов для повторяющихся измерений. [1]
где
- количество групп/предметов,
- количество наблюдений за группа/предмет,
- - это дифференцируемая функция с действительным знаком вектора параметров, специфичного для группы. и ковариатный вектор ,
- моделируется как линейная модель смешанных эффектов где представляет собой вектор фиксированных эффектов и представляет собой вектор случайных эффектов, связанных с группой , и
- — случайная величина, описывающая аддитивный шум.
Оценка
[ редактировать ]Когда модель нелинейна только по фиксированным эффектам, а случайные эффекты являются гауссовскими, оценка максимального правдоподобия может быть выполнена с использованием нелинейных методов наименьших квадратов , хотя асимптотические свойства средств оценки и тестовой статистики могут отличаться от обычной общей линейной модели . В более общей ситуации существует несколько методов оценки максимального правдоподобия или максимальной апостериорной оценки в определенных классах нелинейных моделей со смешанными эффектами - обычно в предположении о нормально распределенных случайных величинах. Популярным подходом является алгоритм Линдстрема-Бейтса. [3] который основан на итеративной оптимизации нелинейной задачи, локальной линеаризации модели вокруг этого оптимума, а затем использовании традиционных методов из линейных моделей со смешанными эффектами для оценки максимального правдоподобия. Стохастическая аппроксимация алгоритма максимизации ожидания дает альтернативный подход для оценки максимального правдоподобия. [4]
Приложения
[ редактировать ]Пример: моделирование прогрессирования заболевания
[ редактировать ]Нелинейные модели смешанных эффектов использовались для моделирования прогрессирования заболевания. [5] При прогрессирующем заболевании временные закономерности прогрессирования переменных результата могут иметь нелинейную временную форму, которая одинакова у разных пациентов. Однако стадия заболевания человека может быть неизвестна или известна лишь частично на основании того, что можно измерить. Следовательно, в модель можно включить переменную латентного времени, которая описывает индивидуальную стадию заболевания (т. е. состояние пациента на нелинейной средней кривой).
Пример: Моделирование снижения когнитивных функций при болезни Альцгеймера.
[ редактировать ]Болезнь Альцгеймера характеризуется прогрессирующим ухудшением когнитивных функций. Однако пациенты могут сильно различаться по когнитивным способностям и резервам , поэтому когнитивное тестирование в один момент времени часто может использоваться только для грубой группировки людей на разных стадиях заболевания . Теперь предположим, что у нас есть набор продольных когнитивных данных. от лица, каждый из которых классифицируется как имеющий нормальное когнитивное мышление (CN), легкое когнитивное нарушение (MCI) или деменцию (DEM) (время на исходном визите соответствующий измерению ). Эти продольные траектории можно смоделировать с использованием нелинейной модели смешанных эффектов, которая допускает различия в состоянии заболевания на основе базовой категоризации:
где
- — это функция, моделирующая средний временной профиль снижения когнитивных функций, форма которого определяется параметрами ,
- представляет время наблюдения (например, время с момента начала исследования),
- и являются фиктивными переменными, которые равны 1, если отдельные имеет MCI или деменцию на исходном уровне и 0 в противном случае,
- и являются параметрами, которые моделируют разницу в прогрессировании заболевания в группах MCI и деменции по сравнению с когнитивно нормальными,
- разница в стадии заболевания у отдельных людей относительно его/ее базовой категории, и
- — случайная величина, описывающая аддитивный шум.
Пример такой модели с экспоненциальной средней функцией, адаптированной к продольным измерениям когнитивной подшкалы шкалы оценки болезни Альцгеймера (ADAS-Cog), показан в рамке. Как показано, включение фиксированных эффектов исходной категоризации (MCI или деменция по отношению к нормальному познанию) и случайного эффекта отдельной стадии непрерывного заболевания выравнивает траектории когнитивного ухудшения, чтобы выявить общую картину когнитивного снижения.
Пример: анализ роста
[ редактировать ]Явления роста часто следуют нелинейным закономерностям (например, логистический рост , экспоненциальный рост и гиперболический рост ). Такие факторы, как дефицит питательных веществ, могут как непосредственно влиять на измеряемый результат (например, организмы с недостатком питательных веществ, в конечном итоге становятся меньше), так и, возможно, также на время (например, организмы с недостатком питательных веществ растут более медленными темпами). Если модель не может учесть различия во времени, расчетные кривые на уровне популяции могут сгладить более мелкие детали из-за отсутствия синхронизации между организмами. Нелинейные модели смешанных эффектов позволяют одновременно моделировать индивидуальные различия в результатах и сроках роста.
Пример: моделирование роста человека
[ редактировать ]Модели для оценки средних кривых роста и веса человека в зависимости от возраста и естественного отклонения от среднего значения используются для создания диаграмм роста . Однако рост детей может стать десинхронизированным из-за генетических факторов и факторов окружающей среды. Например, возраст начала полового созревания и связанный с ним скачок роста у разных подростков могут различаться на несколько лет. Следовательно, перекрестные исследования могут недооценивать величину скачка роста в пубертатном периоде, поскольку возраст не синхронизирован с биологическим развитием. Различия в биологическом развитии можно смоделировать с помощью случайных эффектов. которые описывают сопоставление наблюдаемого возраста со скрытым биологическим возрастом с использованием так называемой функции деформации. . Простая нелинейная модель смешанных эффектов с такой структурой имеет вид
где
- — это функция, которая представляет рост типичного ребенка в зависимости от возраста. Его форма определяется параметрами ,
- возраст ребенка соответствует измерению высоты ,
- — это функция деформации, которая сопоставляет возраст с биологическим развитием для синхронизации. Его форма определяется случайными эффектами ,
- – это случайная переменная, описывающая аддитивную вариацию (например, постоянную разницу в росте между детьми и шум измерений).
Существует несколько методов и программных пакетов для настройки таких моделей. Так называемая SITAR модель [7] могут соответствовать таким моделям, используя функции деформации, которые представляют собой аффинные преобразования времени (т.е. аддитивные сдвиги биологического возраста и различия в скорости созревания), в то время как так называемая pavpop модель [6] подходят модели с плавно меняющимися функциями деформирования. Пример последнего показан на рамке.
Пример: популяционное фармакокинетическое/фармакодинамическое моделирование.
[ редактировать ]Модели PK/PD для описания взаимосвязей воздействия и реакции, такие как модель Emax, могут быть сформулированы как нелинейные модели смешанных эффектов. [8] Подход смешанной модели позволяет моделировать как популяционный уровень, так и индивидуальные различия в эффектах, которые оказывают нелинейное влияние на наблюдаемые результаты, например, скорость, с которой соединение метаболизируется или распределяется в организме.
Пример: эпидемиологическое моделирование COVID-19.
[ редактировать ]Платформу нелинейных моделей смешанного эффекта можно использовать для описания траекторий заражения субъектов и понимания некоторых общих особенностей, присущих всем субъектам. В эпидемиологических проблемах субъектами могут быть страны, штаты или округа и т. д. Это может быть особенно полезно при оценке будущей тенденции эпидемии на ранней стадии пандемии, когда информации о заболевании известно очень мало. [9]
Пример: Прогноз кривой добычи нефти из сланцевых нефтяных скважин на новом месте с использованием скрытого кригинга.
[ редактировать ]Конечный успех проектов по разработке нефтяных месторождений во многом зависит от затрат на строительство скважин. Что касается нетрадиционных залежей нефти и газа, из-за очень низкой проницаемости и механизма течения, сильно отличающегося от механизма течения в традиционных пластах, оценки стоимости строительства скважин часто содержат высокий уровень неопределенности, и нефтяным компаниям приходится делать значительные инвестиции в бурение. и этап заканчивания скважин. Известно, что общий уровень коммерческого успеха горизонтальных скважин в США в последнее время составляет 65%, а это означает, что только 2 из 3 пробуренных скважин будут коммерчески успешными. По этой причине одной из важнейших задач инженеров-нефтяников является количественная оценка неопределенности, связанной с добычей нефти или газа из сланцевых коллекторов, и, кроме того, прогнозирование приблизительного поведения добычи новой скважины на новом месте с учетом конкретных данных по завершению до фактического Бурение происходит для значительной экономии затрат на строительство скважин.
Платформу нелинейных моделей смешанного эффекта можно расширить, чтобы учесть пространственную связь, включив геостатистические процессы, такие как гауссовский процесс , на второй этап модели следующим образом: [10]
где
- - это функция, моделирующая средний временной профиль логарифмического дебита нефти, форма которого определяется параметрами . Функция получается путем логарифмирования кривой снижения ставок, используемой при анализе кривой снижения .
- представляет собой ковариаты, полученные в результате завершения процесса гидроразрыва пласта и горизонтально- направленного бурения для -ну что ж,
- представляет пространственное положение (долгота, широта) -ну что ж,
- представляет гауссовский белый шум с дисперсией ошибок (также называемый эффектом самородка),
- представляет гауссовский процесс с гауссовой ковариационной функцией ,
- представляет собой априорную подковообразную усадку.
Регрессии гауссовского процесса, используемые на скрытом уровне (второй этап), в конечном итоге дают предикторы кригинга для параметров кривой. которые определяют форму средней кривой на уровне даты (первый уровень). Поскольку методы кригинга используются на скрытом уровне, этот метод называется скрытым кригингом. На правой панели показаны результаты прогнозирования метода скрытого кригинга, примененного к двум испытательным скважинам в сланцевом коллекторе Игл-Форд в Южном Техасе.
Байесовская нелинейная модель смешанных эффектов
[ редактировать ]Структура байесовского иерархического моделирования часто используется в различных приложениях. В частности, в последнее время значительное внимание получили байесовские нелинейные модели смешанных эффектов. Базовая версия байесовской нелинейной модели смешанных эффектов представлена в виде следующей трехэтапной схемы:
Этап 1: Модель индивидуального уровня
Этап 2: Модель населения
Этап 3: Приор
Здесь, обозначает непрерывный отклик -й субъект в данный момент времени , и это -я ковариата -й предмет. Параметры, участвующие в модели, написаны греческими буквами. — известная функция, параметризованная -мерный вектор . Как правило, является «нелинейной» функцией и описывает временную траекторию движения индивидуумов. В модели и описывают внутрииндивидуальную изменчивость и межиндивидуальную изменчивость соответственно. Если этап 3: Приоритет не рассматривается, то модель сводится к частотной нелинейной модели со смешанным эффектом.
Центральной задачей при применении байесовских нелинейных моделей смешанного эффекта является оценка апостериорной плотности:
На панели справа показан байесовский исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов. [12] Цикл исследования с использованием байесовской нелинейной модели смешанных эффектов состоит из двух этапов: (а) стандартный исследовательский цикл и (б) рабочий процесс, специфичный для Байеса. Стандартный цикл исследования включает обзор литературы, определение проблемы, определение вопроса и гипотезы исследования. Рабочий процесс, специфичный для Байеса, состоит из трех подэтапов: (b)–(i) формализация предшествующих распределений на основе базовых знаний и предварительного выявления; (b)–(ii) определение функции правдоподобия на основе нелинейной функции ; и (b)–(iii) сделать апостериорный вывод. Полученный апостериорный вывод можно использовать для начала нового исследовательского цикла.
См. также
[ редактировать ]- Смешанная модель
- Модель с фиксированными эффектами
- Обобщенная линейная смешанная модель
- Линейная регрессия
- Дисперсионный анализ смешанного плана
- Многоуровневая модель
- Модель случайных эффектов
- Проектирование повторяющихся мер
Ссылки
[ редактировать ]- ^ Jump up to: а б Пиньейру, Дж; Бейтс, DM (2006). Модели со смешанными эффектами в цветах S и S-PLUS . Статистика и вычисления. Нью-Йорк: Springer Science & Business Media. дои : 10.1007/b98882 . ISBN 0-387-98957-9 .
- ^ Болкер, Б.М. (2008). Экологические модели и данные в R. Издательство Принстонского университета.
{{cite book}}
:|website=
игнорируется ( помогите ) - ^ Линдстрем, MJ; Бейтс, DM (1990). «Нелинейные модели смешанных эффектов для данных повторных измерений». Биометрия . 46 (3): 673–687. дои : 10.2307/2532087 . JSTOR 2532087 . ПМИД 2242409 .
- ^ Кун, Э; Лавиэль, М. (2005). «Оценка максимального правдоподобия в нелинейных моделях смешанных эффектов». Вычислительная статистика и анализ данных . 49 (4): 1020–1038. дои : 10.1016/j.csda.2004.07.002 .
- ^ Jump up to: а б Ракет, LL (2020). «Статистическое моделирование прогрессирования болезни Альцгеймера» . Границы больших данных . 3 : 24. doi : 10.3389/fdata.2020.00024 . ПМК 7931952 . ПМИД 33693397 . S2CID 221105601 .
- ^ Jump up to: а б Ракет Л.Л., Соммер С., Маркуссен Б. (2014). «Нелинейная модель смешанных эффектов для одновременного сглаживания и регистрации функциональных данных». Буквы для распознавания образов . 38 : 1–7. дои : 10.1016/j.patrec.2013.10.018 .
- ^ Коул Т.Дж., Дональдсон, доктор медицинских наук, Бен-Шломо Ю. (2010). «SITAR — полезный инструмент для анализа кривой роста» . Международный журнал эпидемиологии . 39 (6): 1558–66. дои : 10.1093/ije/dyq115 . ПМК 2992626 . ПМИД 20647267 . S2CID 17816715 .
- ^ Йонссон, EN; Карлссон, Миссури; Уэйд, младший (2000). «Обнаружение нелинейности: преимущества нелинейного моделирования смешанными эффектами» . AAPS PharmSci . 2 (3): Е32. дои : 10.1208/ps020332 . ПМК 2761142 . ПМИД 11741248 .
- ^ Ли, Се Юн; Лей, Боуэн; Маллик, Бани (2020). «Оценка кривых распространения COVID-19 с использованием глобальных данных и заимствованной информации» . ПЛОС ОДИН . 15 (7): e0236860. arXiv : 2005.00662 . дои : 10.1371/journal.pone.0236860 . ПМК 7390340 . ПМИД 32726361 .
- ^ Ли, Се Юн; Маллик, Бани (2021). «Байесовское иерархическое моделирование: применение к результатам добычи в сланцах Игл Форд в Южном Техасе». Санкхья Б. 84 : 1–43. дои : 10.1007/s13571-020-00245-8 .
- ^ Ли, Се Юн (2022). «Байесовские нелинейные модели для данных повторяющихся измерений: обзор, реализация и приложения» . Математика . 10 (6): 898. arXiv : 2201.12430 . дои : 10.3390/math10060898 .
- ^ Ли, Се Юн (2022). «Байесовские нелинейные модели для данных повторяющихся измерений: обзор, реализация и приложения» . Математика . 10 (6): 898. arXiv : 2201.12430 . дои : 10.3390/math10060898 .