Грубый подход, основанный на доминировании
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Подход грубого множества, основанный на доминировании ( DRSA ), является расширением теории грубых множеств для многокритериального анализа решений (MCDA), представленной Греко, Матараццо и Словиньски. [1] [2] [3] Основным изменением по сравнению с классическими грубыми множествами является замена отношения неразличимости отношением доминирования, что позволяет иметь дело с несоответствиями, типичными для рассмотрения критериев и классов решений, упорядоченных по предпочтениям .
Многокритериальная классификация (сортировка)
[ редактировать ]Многокритериальная классификация ( сортировка ) является одной из задач, рассматриваемых в рамках MCDA , и ее можно сформулировать следующим образом: учитывая набор объектов, оцениваемых по набору критериев (признаков с областями порядка предпочтения), отнесите эти объекты к некоторым заранее определенным и предпочтениям. -упорядоченные классы решений, так что каждый объект относится ровно к одному классу. Благодаря упорядочиванию предпочтений улучшение оценок объекта по критериям не должно ухудшать присвоение ему класса. Задача сортировки очень похожа на задачу классификации , однако в последней объекты оцениваются по обычным атрибутам и классы решений не обязательно упорядочены по предпочтениям. Задача многокритериальной классификации также называется задачей порядковой классификации с ограничениями монотонности и часто возникает в реальных приложениях, когда порядковые и монотонные свойства следуют из знаний предметной области о проблеме.
В качестве наглядного примера рассмотрим проблему оценивания в старшей школе. Директор школы хочет распределить учеников ( объекты ) по трем классам: плохим , средним и хорошим класс (обратите внимание, что хороший предпочтительнее среднего , а средний — плохому ). Каждый ученик описывается по трем критериям: уровень по физике, математике и литературе, каждый из которых принимает одно из трех возможных значений: плохое , среднее и хорошее . Критерии упорядочены по предпочтениям, и повышение уровня одного из предметов не должно приводить к ухудшению общей оценки (класса).
В качестве более серьезного примера рассмотрим классификацию клиентов банков с точки зрения риска банкротства на классы безопасных и рискованных . Это может включать такие характеристики, как « рентабельность капитала (ROE)», « рентабельность инвестиций (ROI)» и « рентабельность продаж (ROS)». Области этих атрибутов не просто упорядочены, а включают порядок предпочтений, поскольку, с точки зрения банковских менеджеров, более высокие значения ROE, ROI или ROS лучше подходят для клиентов, анализируемых на предмет риска банкротства. Таким образом, эти атрибуты являются критериями. Игнорирование этой информации при открытии знаний может привести к неверным выводам.
Представление данных
[ редактировать ]Таблица решений
[ редактировать ]В DRSA данные часто представляются с использованием определенной формы таблицы решений . Формально таблица решений DRSA представляет собой четырехкортежную таблицу. , где представляет собой конечное множество объектов, представляет собой конечный набор критериев, где является областью действия критерия и – информационная функция такая, что для каждого . Набор делится на критерии состояния (набор ) и критерий решения ( класс ) . Обратите внимание, что это оценка объекта по критерию , пока — это присвоение класса (значение решения) объекта. Пример таблицы решений показан в Таблице 1 ниже.
Отношение превосходства
[ редактировать ]Предполагается, что область определения критерия полностью предупорядочен по отношению опережающего ранжирования ; означает, что по крайней мере так же хорош, как (превосходит) по критерию . Без ограничения общности будем считать, что область является подмножеством вещественных чисел , и что отношение превосходства представляет собой простой порядок между действительными числами такая, что имеет место следующее соотношение: . Это соотношение является простым для критерия типа прибыли («чем больше, тем лучше»), например прибыли компании . Для критерия типа затрат («чем меньше, тем лучше»), например цены продукта , это соотношение может быть удовлетворено путем отрицания значений из .
Классы решений и объединения классов
[ редактировать ]Позволять . Область критерия решения, состоять из элементы (без ограничения общности полагаем ) и индуцирует разбиение в занятия , где . Каждый объект отнесен к одному и только одному классу . Классы упорядочены по предпочтениям в соответствии с возрастающим порядком индексов классов, т.е. для всех такой, что , объекты из строго предпочтительнее предметов из . По этой причине мы можем рассматривать восходящие и нисходящие объединения классов , определяемые соответственно как:
Основные понятия
[ редактировать ]Доминирование
[ редактировать ]Мы говорим, что доминирует относительно , обозначенный , если лучше, чем по каждому критерию от , . Для каждого , отношение доминирования является рефлексивным и транзитивным , т. е. представляет собой частичный предварительный порядок . Данный и , позволять
представляют P -доминирующее множество и P -доминирующее множество относительно , соответственно.
Грубые приближения
[ редактировать ]Ключевая идея философии грубого множества — аппроксимация одного знания другим знанием. В DRSA аппроксимируемые знания представляют собой совокупность восходящих и нисходящих объединений классов решений, а «гранулы знаний», используемые для аппроксимации, представляют собой множества с P -доминированием и P -доминированием.
P -нижнее и P -верхнее приближение относительно , обозначенный как и соответственно, определяются как:
Аналогично P -нижнее и P -верхнее приближение относительно , обозначенный как и соответственно, определяются как:
Нижние приближения группируют объекты, которые заведомо принадлежат к объединению классов. (соответственно ). Эта уверенность исходит из того факта, что объект принадлежит нижнему приближению (соответственно ), если в противоречит этому утверждению, т.е. каждый объект какой P- доминирует , также принадлежат классовому союзу (соответственно ). Верхние приближения группируют объекты, которые могли бы принадлежать (соответственно ), поскольку объект принадлежит верхнему приближению (соответственно ), если существует другой объект П - преобладают из классового союза (соответственно ).
P -верхнее приближения , -нижнее и P определенные выше, удовлетворяют следующим свойствам для всех и для любого :
P - границы ( P-сомнительные области ) и определяются как:
Качество аппроксимации и редукции
[ редактировать ]Соотношение
определяет качество аппроксимации разбиения на классы по набору критериев . Это соотношение выражает связь между всеми P -правильно классифицированными объектами и всеми объектами таблицы.
Каждое минимальное подмножество такой, что называется редукцией и обозначается . Таблица решений может иметь более одного сокращения. Пересечение всех редуктов известно как ядро .
Правила принятия решений
[ редактировать ]На основе аппроксимаций, полученных с помощью отношений доминирования, можно вывести обобщенное описание предпочтительной информации, содержащейся в таблице решений, в терминах правил принятия решений . Правила принятия решений представляют собой выражения вида if [условие], затем [последствия], которые представляют собой форму зависимости между критериями условия и критериями решения. Процедуры создания правил принятия решений из таблицы решений используют принцип индуктивного обучения. Можно выделить три типа правил: достоверные, возможные и приблизительные. Некоторые правила порождаются нижними аппроксимациями объединений классов; возможные правила генерируются из верхних приближений объединений классов, а приближенные правила генерируются из граничных областей.
Некоторые правила имеют следующий вид:
если и и затем
если и и затем
Возможные правила имеют аналогичный синтаксис, однако консеквентная часть правила имеет вид: мог принадлежать или форма: мог принадлежать .
Наконец, приблизительные правила имеют синтаксис:
если и и и и и затем
Определенные, возможные и приблизительные правила представляют собой определенные, возможные и неоднозначные знания, извлеченные из таблицы решений.
Каждое решающее правило должно быть минимальным. Поскольку решающее правило является импликацией, под минимальным решающим правилом мы понимаем такую импликацию, при которой не существует другой импликации с антецедентом хотя бы такой же слабости (другими словами, правило, использующее подмножество элементарных условий или/или более слабые элементарные условия). условиях) и консеквент, по крайней мере, одинаковой силы (другими словами, правило, относящее объекты к одному и тому же объединению или подобъединению классов).
Набор правил принятия решений является полным, если он способен охватить все объекты из таблицы решений таким образом, что согласованные объекты переклассифицируются в свои исходные классы, а несогласованные объекты классифицируются по кластерам классов, ссылающихся на эту несогласованность. мы называем Минимальным каждый набор решающих правил, который является полным и неизбыточным, т.е. исключение какого-либо правила из этого набора делает его неполным.Для получения набора правил принятия решений можно использовать одну из трех стратегий индукции: [4]
- генерация минимального описания, т.е. минимального набора правил,
- создание исчерпывающего описания, т.е. всех правил для данной матрицы данных,
- формирование характеристического описания, т.е. набора правил, охватывающих относительно много объектов каждый, однако все вместе не обязательно все объекты из таблицы решений
Самый популярный алгоритм индукции правил для подхода грубого набора, основанного на доминировании, - это DOMLEM, [5] который генерирует минимальный набор правил.
Пример
[ редактировать ]Рассмотрим следующую проблему оценивания старшеклассников:
Таблица 1. Пример: оценки средней школы объект (ученик)
(Математика)
(Физика)
(Литература)
(глобальный рейтинг)середина середина плохой плохой хороший середина плохой середина середина хороший плохой середина плохой середина хороший плохой плохой плохой середина плохой плохой середина середина середина хороший хороший плохой хороший хороший середина середина середина середина середина хороший хороший хороший середина хороший хороший
Каждый объект (ученик) описывается тремя критериями , относящиеся к уровням математики, физики и литературы соответственно. По признаку решения учащиеся делятся на три класса в порядке предпочтения: , и . Таким образом, были аппроксимированы следующие объединения классов:
- то есть класс (максимум) плохих учеников,
- т. е. класс, состоящий не более чем из средних учеников,
- т.е. класс как минимум средних учеников,
- т.е. класс (по крайней мере) хороших учеников.
Обратите внимание, что оценки объектов и противоречивы, потому что имеет лучшие оценки по всем трем критериям, чем но хуже глобальный результат.
Таким образом, нижние приближения объединений классов состоят из следующих объектов:
Таким образом, только классы и не может быть точно оценено. Их верхние приближения таковы:
в то время как их граничные регионы:
Конечно, поскольку и аппроксимируются точно, мы имеем , и
Из таблицы решений можно получить следующий минимальный набор из 10 правил:
- если затем
- если и и затем
- если затем
- если и затем
- если и затем
- если и затем
- если и затем
- если затем
- если затем
- если и затем
Последнее правило приблизительное, а остальные точные.
Расширения
[ редактировать ]Многокритериальный выбор и проблемы ранжирования
[ редактировать ]Две другие проблемы, рассматриваемые в рамках многокритериального анализа решений , многокритериального выбора и ранжирования , также могут быть решены с использованием подхода грубого множества, основанного на доминировании. Это делается путем преобразования таблицы решений в таблицу парного сравнения (PCT). [1]
DRSA с переменной согласованностью
[ редактировать ]Определения грубых приближений основаны на строгом применении принципа доминирования. Однако при определении однозначных объектов разумно принять ограниченную долю отрицательных примеров, особенно для больших таблиц решений. Такая расширенная версия DRSA называется моделью DRSA с переменной согласованностью (VC-DRSA). [6]
Стохастический DRSA
[ редактировать ]В реальных данных, особенно для больших наборов данных, понятия грубых приближений оказались чрезмерно ограничительными. расширение DRSA, основанное на стохастической модели ( Stochastic DRSA ), которое допускает в некоторой степени несогласованности. Поэтому было введено [7] Сформулировав вероятностную модель для задач порядковой классификации с ограничениями монотонности, понятия нижних приближений распространяются настохастический случай. Метод основан на оценке условных вероятностей с использованием непараметрического метода максимального правдоподобия, который приводитк проблеме изотонической регрессии .
Грубые наборы, основанные на стохастическом доминировании, также можно рассматривать как своего рода модель переменной согласованности.
Программное обеспечение
[ редактировать ]4eMka2. Архивировано 9 сентября 2007 г. в Wayback Machine. Это система поддержки принятия решений для задач классификации по множеству критериев, основанная на грубых наборах на основе доминирования (DRSA). JAMM, архивировано 19 июля 2007 г. в Wayback Machine, является гораздо более продвинутым преемником 4eMka2. Обе системы находятся в свободном доступе для некоммерческих целей на веб-сайте Лаборатории интеллектуальных систем поддержки принятия решений (IDSS) .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Греко С., Матараццо Б., Словинский Р.: Грубая теория множеств для многокритериального анализа решений. Европейский журнал операционных исследований, 129 , 1 (2001) 1–47.
- ^ Греко С., Матараццо Б., Словинский Р.: Многокритериальная классификация поподход, основанный на доминировании. В: В.Клёсген и Дж.Зитков (ред.), Справочник по интеллектуальному анализу данных и открытию знаний, Oxford University Press, Нью-Йорк, 2002 г.
- ^ Словинский Р., Греко С., Матараццо Б.: Поддержка принятия решений на основе грубых наборов. Глава 16 [в]: Э. К. Берк и Г. Кендалл (ред.), Методологии поиска: вводные уроки по методам оптимизации и поддержки принятия решений, Springer-Verlag, Нью-Йорк (2005) 475–527.
- ^ Стефановский, Дж.: О грубом подходе к индукции правил принятия решений, основанном на множестве. В Скоурон А., Полковски Л. (ред.): Грубый набор в открытии знаний , Physica Verlag, Гейдельберг (1998) 500–529.
- ^ Греко С., Матараццо Б., Словинский Р., Стефановски Дж.: Алгоритм индукции правил принятия решений, соответствующих принципу доминирования. В. Зиарко, Ю. Яо (ред.): Грубые наборы и текущие тенденции в области вычислений. Конспекты лекций по искусственному интеллекту 2005 (2001) 304–313. Шпрингер-Верлаг
- ^ Греко, С., Б. Матараццо, Р. Словински и Дж. Стефановски: Модель переменной согласованности подхода грубого набора, основанного на доминировании. В. Зиарко, Ю. Яо (ред.): Грубые наборы и текущие тенденции в области вычислений. Конспекты лекций по искусственному интеллекту 2005 (2001) 170–181. Шпрингер-Верлаг
- ^ Дембчинский, К., Греко, С., Котловски, В., Словинский, Р.: Статистическая модель для грубого подхода к многокритериальной классификации. Ин Кок, Дж.Н., Коронацкий, Дж., де Мантарас, Р.Л., Матвин, С., Младенич Д., Сковрон А. (ред.): Обнаружение знаний в базах данных: PKDD 2007, Варшава, Польша. Конспекты лекций по информатике 4702 (2007) 164–175.
- Чахар С., Ишизака А., Лабиб А., Саад И. (2016). Грубый подход к групповым решениям, основанный на доминировании, European Journal of Operational Research, 251(1): 206-224.
- Ли С., Ли Т. Чжан З., Чен Х., Чжан Дж. (2015). Параллельное вычисление аппроксимаций в подходе грубых множеств, основанном на доминировании, Системы, основанные на знаниях, 87: 102-111
- Ли С., Ли Т. (2015). Постепенное обновление аппроксимаций в подходе грубых множеств, основанном на доминировании, при изменении значений атрибутов, Информационные науки, 294: 348-361
- Ли С., Ли Т., Лю Д. (2013). Динамическое поддержание аппроксимаций в подходе грубого набора, основанном на доминировании, при изменении набора объектов, Международный журнал интеллектуальных систем, 28 (8): 729-751
Внешние ссылки
[ редактировать ]- Международное общество грубого монтажа
- Лаборатория интеллектуальных систем поддержки принятия решений (IDSS) Познанского технологического университета .
- Обширный список ссылок DRSA на домашней странице Романа Словиньского .