Решение тупик

Пень решения — это модель машинного обучения, состоящая из одноуровневого дерева решений . [1] То есть это дерево решений с одним внутренним узлом (корнем), который непосредственно связан с конечными узлами (его листьями). Пень решения делает прогноз на основе значения только одного входного признака. Иногда их еще называют 1-правилами . [2]
В зависимости от типа входного объекта возможны несколько вариантов. Для номинальных признаков можно построить пень, содержащий лист для каждого возможного значения признака. [3] [4] или пень с двумя листьями, один из которых соответствует какой-то выбранной категории, а другой — всем остальным категориям. [5] Для бинарных функций эти две схемы идентичны. Отсутствующее значение можно рассматривать как еще одну категорию. [5]
Для непрерывных признаков обычно выбирается какое-то пороговое значение признака, а пень содержит два листа — для значений ниже и выше порога. Однако в редких случаях можно выбрать несколько порогов, и поэтому пень содержит три или более листьев.
Часто возникают тупики в принятии решений [6] используются в качестве компонентов (называемых «слабыми учащимися» или «базовыми учащимися») в методах ансамбля машинного обучения, таких как пакетирование и повышение . Например, Виолы-Джонса алгоритм обнаружения лиц использует AdaBoost , принимая решения как слабые ученики. [7]
Термин «пень решения» был придуман в статье ICML 1992 года Уэйном Ибой и Пэтом Лэнгли. [1] [8]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Иба, Уэйн; Лэнгли, Пэт (1992). «Индукция одноуровневых деревьев решений» (PDF) . ML92: Материалы девятой Международной конференции по машинному обучению, Абердин, Шотландия, 1–3 июля 1992 г. Морган Кауфманн. стр. 233–240. дои : 10.1016/B978-1-55860-247-2.50035-8 . ISBN 978-1-55860-247-2 .
- ^ Холте, Роберт К. (1993). «Очень простые правила классификации хорошо работают с наиболее часто используемыми наборами данных» (PDF) . Машинное обучение . 11 (1): 63–90. дои : 10.1023/A:1022631118932 . S2CID 6596 .
- ^ Лопер, Эдвард Л.; Берд, Стивен; Кляйн, Юэн (2009). Обработка естественного языка с помощью Python . Севастополь, Калифорния: О'Рейли . ISBN 978-0-596-51649-9 . Архивировано из оригинала 18 июня 2010 г. Проверено 10 июня 2010 г.
- ^ Этот классификатор реализован в Weka под названием
OneR
(для «1-правила»). - ^ Перейти обратно: а б что было реализовано в Weka Это то ,
DecisionStump
классификатор. - ^ Рейзин, Лев; Шапире, Роберт Э. (2006). «Как увеличение маржи может также повысить сложность классификатора» (PDF) . ICML'06: Материалы 23-й международной конференции по машинному обучению . стр. 753–760. дои : 10.1145/1143844.1143939 . ISBN 978-1-59593-383-6 . S2CID 2483269 .
- ^ Виола, Пол; Джонс, Майкл Дж. (2004). «Надежное распознавание лиц в реальном времени» (PDF) . Международный журнал компьютерного зрения . 57 (2): 137–154. doi : 10.1023/B:VISI.0000013087.49260.fb . S2CID 2796017 .
- ^ Оливер, Джонатан Дж.; Хэнд, Дэвид (1994). «Усреднение ошибок при принятии решений». Машинное обучение: ECML-94, Европейская конференция по машинному обучению, Катания, Италия, 6–8 апреля 1994 г., Материалы . Конспекты лекций по информатике. Том. 784. Спрингер. стр. 231–241. дои : 10.1007/3-540-57868-4_61 . ISBN 3-540-57868-4 .
Эти простые правила, по сути, представляют собой сильно сокращенные деревья решений и получили название «пни решений» ( Iba & Langley, 1992).