Рекурсивное секционирование
Рекурсивное секционирование — это статистический метод многопараметрического анализа . [1] Рекурсивное разделение создает дерево решений , которое стремится правильно классифицировать членов популяции путем разделения ее на подгруппы на основе нескольких дихотомических независимых переменных . Этот процесс называется рекурсивным, поскольку каждая подгруппа, в свою очередь, может быть разделена неопределенное количество раз, пока процесс разделения не завершится после достижения определенного критерия остановки.
Рекурсивные методы секционирования разрабатываются с 1980-х годов. Росса Куинлана Хорошо известные методы рекурсивного разделения включают алгоритм ID3 и его преемники, C4.5 и C5.0 , а также деревья классификации и регрессии (CART). Методы ансамблевого обучения, такие как случайные леса, помогают преодолеть распространенную критику этих методов — их уязвимость к переобучению данных — за счет использования различных алгоритмов и каким-либо образом комбинируя их результаты.
В этой статье основное внимание уделяется рекурсивному секционированию медицинских диагностических тестов.но эта техника имеет гораздо более широкое применение.См. дерево решений .
По сравнению с регрессионным анализом, который создает формулу, которую поставщики медицинских услуг могут использовать для расчета вероятности того, что у пациента есть заболевание, рекурсивное разделение создает такое правило, как «Если у пациента обнаружены x, y или z, у него, вероятно, есть заболевание». д'.
Вариантом является «линейно-рекурсивное разделение Кокса». [2]
Преимущества и недостатки
[ редактировать ]По сравнению с другими методами с несколькими переменными рекурсивное секционирование имеет преимущества и недостатки.
- Преимущества:
- Создает клинически более интуитивные модели, которые не требуют от пользователя выполнения расчетов. [3]
- Позволяет изменять приоритетность неправильных классификаций, чтобы создать правило принятия решения, обладающее большей чувствительностью или специфичностью . [2]
- Может быть точнее. [4]
- Недостатками являются:
- Не работает для непрерывных переменных [5]
- Возможно переобучение данных.
Примеры
[ редактировать ]Доступны примеры использования рекурсивного разделения при исследовании диагностических тестов. [6] [7] [8] [9] [10] [11] Голдман использовал рекурсивное разделение для определения приоритета чувствительности при диагностике инфаркта миокарда среди пациентов с болью в груди в отделении неотложной помощи. [11]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Брейман, Лео (1984). Деревья классификации и регрессии . Бока-Ратон: Чепмен и Холл/CRC. ISBN 978-0-412-04841-8 .
- ^ Перейти обратно: а б Кук Э.Ф., Голдман Л. (1984). «Эмпирическое сравнение методов многомерного анализа: преимущества и недостатки рекурсивного анализа секционирования». Журнал хронических болезней . 37 (9–10): 721–31. дои : 10.1016/0021-9681(84)90041-9 . ПМИД 6501544 .
- ^ Джеймс К.Е., Уайт РФ, Кремер ХК (2005). «Повторная проверка разделенной выборки для оценки логистической регрессии и рекурсивного разделения: применение для прогнозирования когнитивных нарушений». Статистика в медицине . 24 (19): 3019–35. дои : 10.1002/сим.2154 . ПМИД 16149128 .
- ^ Каттан М.В., Хесс К.Р., Бек-младший (1998). «Эксперименты по определению того, преодолевает ли рекурсивное разделение (CART) или искусственная нейронная сеть теоретические ограничения регрессии пропорциональных рисков Кокса». Вычислить. Биомед. Рез . 31 (5): 363–73. дои : 10.1006/cbmr.1998.1488 . ПМИД 9790741 .
- ^ Ли Дж.В., Ум Ш., Ли Дж.Б., Мун Дж., Чо Х (2006). «Системы оценки и постановки с использованием моделирования линейной регрессии Кокса и рекурсивного разделения». Методы информации в медицине . 45 (1): 37–43. дои : 10.1055/s-0038-1634034 . ПМИД 16482368 .
- ^ Фонаров Г.К., Адамс К.Ф., Абрахам В.Т., Янси К.В., Боскардин В.Дж. (2005). «Стратификация риска внутрибольничной смертности при острой декомпенсации сердечной недостаточности: классификация и анализ дерева регрессии» . ДЖАМА . 293 (5): 572–80. дои : 10.1001/jama.293.5.572 . ПМИД 15687312 .
- ^ Стилл И.Г., Уэллс Г.А., Вандемхин К.Л. и др. (2001). «Канадские правила проведения рентгенографии позвоночника у пациентов с травмами в состоянии готовности и в стабильном состоянии» . ДЖАМА . 286 (15): 1841–8. дои : 10.1001/jama.286.15.1841 . ПМИД 11597285 .
- ^ Хейдел М.Дж., Престон К.А., Миллс Т.Дж., Любер С., Блодо Э., ДеБли П.М. (2000). «Показания к компьютерной томографии у больных с легкой черепно-мозговой травмой» . Н. англ. Дж. Мед . 343 (2): 100–5. дои : 10.1056/NEJM200007133430204 . ПМИД 10891517 .
- ^ Эдворти С.М., Затарайн Э., МакШейн DJ, Блох Д.А. (1988). «Анализ набора данных критериев волчанки ARA 1982 года с использованием методологии рекурсивного разделения: новое понимание относительной ценности отдельных критериев». Дж. Ревматол . 15 (10): 1493–8. ПМИД 3060613 .
- ^ Стилл И.Г., Гринберг Г.Х., Уэллс Г.А. и др. (1996). «Перспективная валидация правила принятия решения по использованию рентгенографии при острых травмах колена». ДЖАМА . 275 (8): 611–5. дои : 10.1001/jama.275.8.611 . ПМИД 8594242 .
- ^ Перейти обратно: а б Гольдман Л., Вайнберг М., Вайсберг М. и др. (1982). «Компьютерный протокол для помощи в диагностике пациентов отделения неотложной помощи с острой болью в груди». Н. англ. Дж. Мед . 307 (10): 588–96. дои : 10.1056/NEJM198209023071004 . ПМИД 7110205 .