Изотоническая регрессия
Часть серии о |
Регрессионный анализ |
---|
Модели |
Оценка |
Фон |
В статистике и анализе численном изотоническая регрессия или монотонная регрессия — это метод подгонки линии произвольной формы к последовательности наблюдений так, чтобы подобранная линия не убывала (или не возрастала) повсюду и лежала как можно ближе к наблюдениям. насколько это возможно.
Приложения [ править ]
Изотоническая регрессия имеет применение в статистических выводах . Например, его можно использовать для подгонки изотонической кривой к средним значениям некоторого набора экспериментальных результатов, когда ожидается увеличение этих средних в соответствии с некоторым конкретным порядком. Преимущество изотонической регрессии заключается в том, что она не ограничена какой-либо функциональной формой, такой как линейность, налагаемая линейной регрессией , пока функция монотонно возрастает.
Другое применение — неметрическое многомерное масштабирование . [1] низкоразмерное вложение где ищется для точек данных, чтобы порядок расстояний между точками во вложении соответствовал порядку несходства между точками. Изотоническая регрессия используется итеративно для подбора идеальных расстояний и сохранения порядка относительного несходства.
Изотоническая регрессия также используется в вероятностной классификации для калибровки прогнозируемых вероятностей моделей машинного обучения с учителем . [2]
Изотоническая регрессия для просто упорядоченного случая с одномерной был применен для оценки непрерывной зависимости «доза-реакция» в таких областях, как анестезиология и токсикология. Строго говоря, изотоническая регрессия дает только точечные оценки при наблюдаемых значениях Оценка полной кривой «доза-реакция» без каких-либо дополнительных предположений обычно выполняется посредством линейной интерполяции между точечными оценками. [3]
разработано программное обеспечение для расчета изотонной (монотонной) регрессии Для R . [4] [5] [6] Стата и Питон . [7]
Постановка задачи и алгоритмы [ править ]
Позволять быть заданным набором наблюдений, где и попадают в некоторое частично упорядоченное множество . Для общности каждое наблюдение может быть присвоен вес , хотя обычно для всех .
Изотоническая регрессия ищет взвешенную методом наименьших квадратов. аппроксимацию для всех , при условии, что в любое время . Это дает следующую квадратичную программу (QP) в переменных :
- при условии
где определяет частичный порядок наблюдаемых входных данных (и может рассматриваться как множество ребер некоторого ориентированного ациклического графа (dag) с вершинами ). Проблемы этой формы могут быть решены с помощью общих методов квадратичного программирования.
В обычной обстановке, когда значения попадают в полностью упорядоченный набор, такой как , мы можем предположить, что WLOG , что наблюдения были отсортированы так, что , и возьми . В этом случае простым итерационным алгоритмом решения квадратичной программы является алгоритм соседнего пула нарушителей . И наоборот, Бест и Чакраварти. [8] изучил проблему как проблему идентификации активного множества и предложил простой алгоритм. Эти два алгоритма можно рассматривать как двойственные друг другу, и оба имеют вычислительную сложность на уже отсортированных данных. [8]
Чтобы выполнить задачу изотонической регрессии, мы можем выбрать любую неубывающую функцию. такой, что для всех я. Любая такая функция, очевидно, решает
- при условии будучи неубывающим
и может быть использован для прогнозирования значения для новых значений . Обычный выбор, когда было бы линейно интерполировать между точками , как показано на рисунке, что дает непрерывную кусочно-линейную функцию:
Центрированная изотоническая регрессия
Как показывает первый рисунок статьи, при наличии нарушений монотонности результирующая интерполированная кривая будет иметь пологие (постоянные) интервалы. В приложениях дозозависимого реагирования обычно известно, что не только монотонно, но и гладко . Плоские интервалы несовместимы с принимает предполагаемую форму и может оказаться предвзятым. Простое усовершенствование для таких приложений, названное центрированной изотонической регрессией (CIR), было разработано Ороном и Флурнуа и показало, что оно существенно уменьшает ошибку оценки как для приложений, связанных с ответом на дозу, так и для приложений по определению дозы. [9] И CIR, и стандартная изотоническая регрессия для одномерного, просто упорядоченного случая реализованы в пакете R «cir». [4] Этот пакет также предоставляет аналитические оценки доверительного интервала.
Ссылки [ править ]
- ^ Краскал, Дж. Б. (1964). «Неметрическое многомерное масштабирование: численный метод». Психометрика . 29 (2): 115–129. дои : 10.1007/BF02289694 . S2CID 11709679 .
- ^ «Прогнозирование хороших вероятностей с помощью контролируемого обучения | Материалы 22-й международной конференции по машинному обучению» . dl.acm.org . дои : 10.1145/1102351.1102430 . S2CID 207158152 . Проверено 7 июля 2020 г.
- ^ Стилиану, член парламента; Флурной, Н. (2002). «Определение дозы с использованием смещенной модели монеты вверх и вниз и изотонической регрессии». Биометрия . 58 (1): 171–177. дои : 10.1111/j.0006-341x.2002.00171.x . ПМИД 11890313 . S2CID 8743090 .
- ^ Перейти обратно: а б Орон, Ассаф. «Пакет 'цир' » . КРАН . R Фонд статистических вычислений . Проверено 26 декабря 2020 г.
- ^ Леув, Ян де; Хорник, Курт; Майр, Патрик (2009). «Оптимизация изотонов в R: алгоритм нарушений соседнего пула (PAVA) и методы активного набора» . Журнал статистического программного обеспечения . 32 (5): 1–24. дои : 10.18637/jss.v032.i05 . ISSN 1548-7660 .
- ^ Сюй, Чжипен; Сунь, Ченкай; Карунакаран, Аман. «Пакет UniIsoReгрессия» (PDF) . КРАН . R Фонд статистических вычислений . Проверено 29 октября 2021 г.
- ^ Педрегоса, Фабиан; и др. (2011). «Scikit-learn: Машинное обучение на Python». Журнал исследований машинного обучения . 12 : 28:25–28:30. arXiv : 1201.0490 . Бибкод : 2011JMLR...12.2825P .
- ^ Перейти обратно: а б Бест, Майкл Дж.; Чакраварти, Нилотпал (1990). «Алгоритмы активного набора для изотонической регрессии; объединяющая структура» . Математическое программирование . 47 (1–3): 425–439. дои : 10.1007/bf01580873 . ISSN 0025-5610 . S2CID 31879613 .
- ^ Орон, АП; Флурнуа, Н. (2017). «Центрированная изотоническая регрессия: точечная и интервальная оценка для исследований зависимости доза-эффект». Статистика биофармацевтических исследований . 9 (3): 258–267. arXiv : 1701.05964 . дои : 10.1080/19466315.2017.1286256 . S2CID 88521189 .
Дальнейшее чтение [ править ]
- Робертсон, Т.; Райт, FT; Дикстра, Р.Л. (1988). Заказать ограниченный статистический вывод . Нью-Йорк: Уайли. ISBN 978-0-471-91787-8 .
- Барлоу, RE; Варфоломей, диджей; Бремнер, Дж. М.; Бранк, HD (1972). Статистический вывод при ограничениях порядка; теория и применение изотонической регрессии . Нью-Йорк: Уайли. ISBN 978-0-471-04970-8 .
- Шайвли Т.С., Сагер Т.В., Уокер С.Г. (2009). «Байесовский подход к оценке непараметрической монотонной функции». Журнал Королевского статистического общества, серия B. 71 (1): 159–175. CiteSeerX 10.1.1.338.3846 . дои : 10.1111/j.1467-9868.2008.00677.x . S2CID 119761196 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - Ву, ВБ ; Вудруф, М .; Ментц, Г. (2001). «Изотоническая регрессия: еще один взгляд на проблему точек перехода». Биометрика . 88 (3): 793–804. дои : 10.1093/biomet/88.3.793 .