Изотоническая регрессия

Пример изотонической регрессии (сплошная красная линия) по сравнению с линейной регрессией на тех же данных, оба подходят для минимизации среднеквадратической ошибки . Свойство изотонической регрессии в свободной форме означает, что линия может быть круче там, где данные круче; ограничение изотоничности означает, что линия не уменьшается.

В статистике и анализе численном изотоническая регрессия или монотонная регрессия — это метод подгонки линии произвольной формы к последовательности наблюдений так, чтобы подобранная линия не убывала (или не возрастала) повсюду и лежала как можно ближе к наблюдениям. насколько это возможно.

Приложения [ править ]

Изотоническая регрессия имеет применение в статистических выводах . Например, его можно использовать для подгонки изотонической кривой к средним значениям некоторого набора экспериментальных результатов, когда ожидается увеличение этих средних в соответствии с некоторым конкретным порядком. Преимущество изотонической регрессии заключается в том, что она не ограничена какой-либо функциональной формой, такой как линейность, налагаемая линейной регрессией , пока функция монотонно возрастает.

Другое применение — неметрическое многомерное масштабирование . [1] низкоразмерное вложение где ищется для точек данных, чтобы порядок расстояний между точками во вложении соответствовал порядку несходства между точками. Изотоническая регрессия используется итеративно для подбора идеальных расстояний и сохранения порядка относительного несходства.

Изотоническая регрессия также используется в вероятностной классификации для калибровки прогнозируемых вероятностей моделей машинного обучения с учителем . [2]

Изотоническая регрессия для просто упорядоченного случая с одномерной был применен для оценки непрерывной зависимости «доза-реакция» в таких областях, как анестезиология и токсикология. Строго говоря, изотоническая регрессия дает только точечные оценки при наблюдаемых значениях Оценка полной кривой «доза-реакция» без каких-либо дополнительных предположений обычно выполняется посредством линейной интерполяции между точечными оценками. [3]

разработано программное обеспечение для расчета изотонной (монотонной) регрессии Для R . [4] [5] [6] Стата и Питон . [7]

Постановка задачи и алгоритмы [ править ]

Позволять быть заданным набором наблюдений, где и попадают в некоторое частично упорядоченное множество . Для общности каждое наблюдение может быть присвоен вес , хотя обычно для всех .

Изотоническая регрессия ищет взвешенную методом наименьших квадратов. аппроксимацию для всех , при условии, что в любое время . Это дает следующую квадратичную программу (QP) в переменных :

при условии

где определяет частичный порядок наблюдаемых входных данных (и может рассматриваться как множество ребер некоторого ориентированного ациклического графа (dag) с вершинами ). Проблемы этой формы могут быть решены с помощью общих методов квадратичного программирования.

В обычной обстановке, когда значения попадают в полностью упорядоченный набор, такой как , мы можем предположить, что WLOG , что наблюдения были отсортированы так, что , и возьми . В этом случае простым итерационным алгоритмом решения квадратичной программы является алгоритм соседнего пула нарушителей . И наоборот, Бест и Чакраварти. [8] изучил проблему как проблему идентификации активного множества и предложил простой алгоритм. Эти два алгоритма можно рассматривать как двойственные друг другу, и оба имеют вычислительную сложность на уже отсортированных данных. [8]

Чтобы выполнить задачу изотонической регрессии, мы можем выбрать любую неубывающую функцию. такой, что для всех я. Любая такая функция, очевидно, решает

при условии будучи неубывающим

и может быть использован для прогнозирования значения для новых значений . Обычный выбор, когда было бы линейно интерполировать между точками , как показано на рисунке, что дает непрерывную кусочно-линейную функцию:

Центрированная изотоническая регрессия

Как показывает первый рисунок статьи, при наличии нарушений монотонности результирующая интерполированная кривая будет иметь пологие (постоянные) интервалы. В приложениях дозозависимого реагирования обычно известно, что не только монотонно, но и гладко . Плоские интервалы несовместимы с принимает предполагаемую форму и может оказаться предвзятым. Простое усовершенствование для таких приложений, названное центрированной изотонической регрессией (CIR), было разработано Ороном и Флурнуа и показало, что оно существенно уменьшает ошибку оценки как для приложений, связанных с ответом на дозу, так и для приложений по определению дозы. [9] И CIR, и стандартная изотоническая регрессия для одномерного, просто упорядоченного случая реализованы в пакете R «cir». [4] Этот пакет также предоставляет аналитические оценки доверительного интервала.

Ссылки [ править ]

  1. ^ Краскал, Дж. Б. (1964). «Неметрическое многомерное масштабирование: численный метод». Психометрика . 29 (2): 115–129. дои : 10.1007/BF02289694 . S2CID   11709679 .
  2. ^ «Прогнозирование хороших вероятностей с помощью контролируемого обучения | Материалы 22-й международной конференции по машинному обучению» . dl.acm.org . дои : 10.1145/1102351.1102430 . S2CID   207158152 . Проверено 7 июля 2020 г.
  3. ^ Стилиану, член парламента; Флурной, Н. (2002). «Определение дозы с использованием смещенной модели монеты вверх и вниз и изотонической регрессии». Биометрия . 58 (1): 171–177. дои : 10.1111/j.0006-341x.2002.00171.x . ПМИД   11890313 . S2CID   8743090 .
  4. ^ Перейти обратно: а б Орон, Ассаф. «Пакет 'цир' » . КРАН . R Фонд статистических вычислений . Проверено 26 декабря 2020 г.
  5. ^ Леув, Ян де; Хорник, Курт; Майр, Патрик (2009). «Оптимизация изотонов в R: алгоритм нарушений соседнего пула (PAVA) и методы активного набора» . Журнал статистического программного обеспечения . 32 (5): 1–24. дои : 10.18637/jss.v032.i05 . ISSN   1548-7660 .
  6. ^ Сюй, Чжипен; Сунь, Ченкай; Карунакаран, Аман. «Пакет UniIsoReгрессия» (PDF) . КРАН . R Фонд статистических вычислений . Проверено 29 октября 2021 г.
  7. ^ Педрегоса, Фабиан; и др. (2011). «Scikit-learn: Машинное обучение на Python». Журнал исследований машинного обучения . 12 : 28:25–28:30. arXiv : 1201.0490 . Бибкод : 2011JMLR...12.2825P .
  8. ^ Перейти обратно: а б Бест, Майкл Дж.; Чакраварти, Нилотпал (1990). «Алгоритмы активного набора для изотонической регрессии; объединяющая структура» . Математическое программирование . 47 (1–3): 425–439. дои : 10.1007/bf01580873 . ISSN   0025-5610 . S2CID   31879613 .
  9. ^ Орон, АП; Флурнуа, Н. (2017). «Центрированная изотоническая регрессия: точечная и интервальная оценка для исследований зависимости доза-эффект». Статистика биофармацевтических исследований . 9 (3): 258–267. arXiv : 1701.05964 . дои : 10.1080/19466315.2017.1286256 . S2CID   88521189 .

Дальнейшее чтение [ править ]

  • Робертсон, Т.; Райт, FT; Дикстра, Р.Л. (1988). Заказать ограниченный статистический вывод . Нью-Йорк: Уайли. ISBN  978-0-471-91787-8 .
  • Барлоу, RE; Варфоломей, диджей; Бремнер, Дж. М.; Бранк, HD (1972). Статистический вывод при ограничениях порядка; теория и применение изотонической регрессии . Нью-Йорк: Уайли. ISBN  978-0-471-04970-8 .
  • Шайвли Т.С., Сагер Т.В., Уокер С.Г. (2009). «Байесовский подход к оценке непараметрической монотонной функции». Журнал Королевского статистического общества, серия B. 71 (1): 159–175. CiteSeerX   10.1.1.338.3846 . дои : 10.1111/j.1467-9868.2008.00677.x . S2CID   119761196 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  • Ву, ВБ ; Вудруф, М .; Ментц, Г. (2001). «Изотоническая регрессия: еще один взгляд на проблему точек перехода». Биометрика . 88 (3): 793–804. дои : 10.1093/biomet/88.3.793 .