Анализ охвата данных
Анализ охвата данных ( DEA ) – это непараметрический метод исследования операций и экономики для оценки производственных границ . [1] DEA применяется в широком спектре областей, включая международное банковское дело, экономическую устойчивость, операции полицейских отделений и логистические приложения. [2] [3] [4] Кроме того, DEA использовался для оценки производительности моделей обработки естественного языка и нашел другие применения в машинном обучении. [5] [6] [7]
Описание [ править ]
DEA используется для эмпирического измерения производственной эффективности подразделений принятия решений (DMU). Хотя DEA имеет тесную связь с теорией производства в экономике, этот метод также используется для сравнительного анализа в управлении операциями , в результате чего выбирается набор показателей для оценки эффективности производственных и сервисных операций. [8] В бенчмаркинге эффективные DMU, по определению DEA, не обязательно образуют «производственную границу», а скорее приводят к «границе передовой практики». [1] [9] : 243–285
В отличие от параметрических методов, которые требуют предварительного определения производственной функции или функции затрат, непараметрические подходы сравнивают возможные комбинации ввода и вывода только на основе имеющихся данных . [10] DEA, один из наиболее часто используемых непараметрических методов, обязан своим названием свойству охватывать эффективные DMU набора данных, где эмпирически наблюдаемые наиболее эффективные DMU составляют производственную границу, с которой сравниваются все DMU. Популярность DEA проистекает из относительного отсутствия предположений, способности сравнивать многомерные входные и выходные данные, а также из-за простоты вычислений, поскольку ее можно выразить в виде линейной программы , несмотря на ее задачу расчета коэффициентов эффективности . [11]
История [ править ]
Опираясь на идеи Фаррелла, [12] «Измерение эффективности подразделений, принимающих решения» 1978 года. работа Чарнса , Купера и Роудса [1] впервые применил линейное программирование для оценки эмпирической границы производственных технологий. В Германии процедура ранее использовалась для оценки предельной производительности НИОКР эта и других факторов производства. С тех пор было написано большое количество книг и журнальных статей о DEA или о применении DEA для решения различных задач.
Начиная с модели CCR, названной в честь Чарнса, Купера и Роудса, [1] В литературе было предложено множество расширений DEA. Они варьируются от адаптации неявных допущений модели, таких как ориентация на ввод и вывод, различение технической и распределительной эффективности, [13] добавление ограниченной возможности одноразового использования [14] входов/выходов или различной отдачи от масштаба [15] к методам, которые используют результаты DEA и расширяют их для более сложного анализа, такого как стохастический DEA. [16] или анализ перекрестной эффективности. [17]
Техники [ править ]
В сценарии с одним входом и одним выходом эффективность — это просто отношение выхода к входу, которое может быть произведено, тогда как сравнение нескольких объектов/DMU на основе этого тривиально. Однако при добавлении большего количества входов или выходов расчет эффективности становится более сложным. Чарнс, Купер и Роудс (1978) [1] в своей базовой модели DEA (CCR) определяют целевую функцию, чтобы найти эффективность как:
где известный результаты умножаются на соответствующие веса и разделен на входы умноженные на их соответствующие веса .
Оценка эффективности стремится быть максимизированным при ограничениях, заключающихся в том, что использование этих весов для каждого , ни один показатель эффективности не превышает единицы:
и все входные, выходные данные и веса должны быть неотрицательными. Чтобы обеспечить линейную оптимизацию, обычно либо сумму выходных данных, либо сумму входных данных ограничивают фиксированным значением (обычно 1. Пример см. ниже).
Поскольку размерность этой задачи оптимизации равна сумме ее входов и выходов, решающее значение имеет выбор наименьшего количества входов/выходов, которые в совокупности точно отражают процесс, который вы пытаетесь охарактеризовать. А поскольку охват производственных границ осуществляется эмпирическим путем, существует несколько рекомендаций относительно минимально необходимого количества DMU для хорошей дискриминационной силы анализа, учитывая однородность выборки. Это минимальное количество DMU варьируется в пределах удвоенной суммы входов и выходов ( ) и удвоенное произведение входов и выходов ( ).
Некоторые преимущества подхода DEA:
- нет необходимости явно указывать математическую форму производственной функции
- возможность обработки нескольких входов и выходов
- можно использовать при любом измерении ввода-вывода, хотя порядковые переменные остаются сложными
- источники неэффективности могут быть проанализированы и количественно определены для каждой оцениваемой единицы
- использование двойственной задачи оптимизации определяет, какой DMU оценивает себя по отношению к каким другим DMU
Некоторые недостатки DEA:
- результаты чувствительны к выбору входов и выходов
- Высокоэффективные значения могут быть достигнуты за счет действительной эффективности или наличия нишевой комбинации входов/выходов.
- количество эффективных фирм на границе увеличивается с увеличением количества входных и выходных переменных.
- Оценки эффективности DMU могут быть получены путем использования неуникальных комбинаций весов входных и/или выходных факторов.
Пример [ править ]
Предположим, что у нас есть следующие данные:
- Установка 1 производит 100 изделий в день, а затраты на единицу составляют 10 долларов за материалы и 2 человеко-часа.
- Установка 2 производит 80 изделий в день, затраты составляют 8 долларов за материалы и 4 человеко-часа.
- Блок 3 производит 120 изделий в день, затраты составляют 12 долларов за материалы и 1,5 человеко-часа.
Для расчета эффективности агрегата 1 определим целевую функцию (ЦФ) как
на который распространяется (ST) весь КПД других агрегатов (КПД не может быть больше 1):
- КПД агрегата 1:
- КПД энергоблока 2:
- КПД блока 3:
и неотрицательность:
Дробь с решающими переменными в числителе и знаменателе является нелинейной. Поскольку мы используем технику линейного программирования, нам необходимо линеаризовать формулировку так, чтобы знаменатель целевой функции был постоянным (в данном случае 1), а затем максимизировать числитель.
Новая формулировка будет такой:
- ИЗ
- СТ
- КПД агрегата 1:
- КПД энергоблока 2:
- КПД блока 3:
- Знаменатель нелинейного OF :
- Неотрицательность:
Расширения [ править ]
Желание улучшить DEA за счет уменьшения его недостатков или усиления его преимуществ стало основной причиной открытий в недавней литературе. В настоящее время наиболее часто используемый метод получения уникальных рейтингов эффективности на основе DEA называется «перекрестной эффективностью». Первоначально разработанный Секстоном и др. в 1986 году, [17] он нашел широкое применение после публикации Дойла и Грина в 1994 году. [18] Перекрестная эффективность основана на первоначальных результатах DEA, но реализует второстепенную цель, когда каждый DMU оценивает все остальные DMU со своими собственными весами факторов. Среднее значение этих оценок коллег затем используется для расчета показателя перекрестной эффективности DMU. Этот подход позволяет избежать недостатков DEA, связанных с наличием нескольких эффективных DMU и потенциально неуникальных весов. [19] Другой подход к устранению некоторых недостатков DEA — Stochastic DEA. [16] который синтезирует DEA и стохастический пограничный анализ (SFA). [20]
Сноски [ править ]
- ^ Jump up to: Перейти обратно: а б с д и Чарнс и др. (1978)
- ^ Чарнс и др. (1995)
- ^ Эмрузнежад и др. (2016)
- ^ Танасулис (1995)
- ^ Коронакос и Сотиропулос (2020)
- ^ Чжоу и др. (2022)
- ^ Герреро и др. (2022)
- ^ Махмуди и др. (2021)
- ^ Сиклс и др. (2019)
- ^ Купер и др. (2007)
- ^ Купер и др. (2011)
- ^ Фаррелл (1957)
- ^ Фрид и др. (2008)
- ^ Купер и др. (2000)
- ^ Банкер и др. (1984)
- ^ Jump up to: Перейти обратно: а б Олесен (2016)
- ^ Jump up to: Перейти обратно: а б Секстон (1986)
- ^ Дойл (1994)
- ^ Дайсон (2001)
- ^ Олесен и др. (2016)
Ссылки [ править ]
- Чарнс, Авраам ; Купер, Уильям Вейгер ; Роудс, Э. (1978). «Измерение эффективности подразделений, принимающих решения» (PDF) . Европейский журнал операционных исследований . 2 (6): 429–444. дои : 10.1016/0377-2217(78)90138-8 . Проверено 27 января 2022 г.
- Чарнс, Авраам; Купер, Уильям; Левин, Ари; Сейфорд, Лоуренс (1995). Анализ оболочки данных: теория, методология и приложения . Springer Science & Business Media. ISBN 9780792394808 .
- Махмуди, Амин; Аббаси, Мехди; Дэн, Сяопэн (2021). «Оценка эффективности работы поставщиков с использованием гибридной модели DEA-OPA: перспектива устойчивого развития» . Групповое решение и переговоры . 31 (2): 335–362. дои : 10.1007/s10726-021-09770-x . ISSN 0926-2644 . S2CID 254498857 .
- Банкир, доктор медицинских наук; Чарнс, А.; Купер, Уильям Вейгер (сентябрь 1984 г.). «Некоторые модели для оценки технической и масштабной неэффективности анализа оболочки данных» (PDF) . Наука управления . 30 (9): 1078–1092. дои : 10.1287/mnsc.30.9.1078 . S2CID 51901687 . Проверено 27 января 2022 г.
- Брокгоф К. (1970). «О количественной оценке предельной производительности промышленных исследований путем оценки производственной функции для отдельной фирмы». Немецкое экономическое обозрение . 8 : 202–229.
- Банкир, доктор медицинских наук; Чарнс, А.; Купер, Уильям Вейгер (сентябрь 1984 г.). «Некоторые модели для оценки технической и масштабной неэффективности анализа оболочки данных» (PDF) . Наука управления . 30 (9): 1078–1092. дои : 10.1287/mnsc.30.9.1078 . S2CID 51901687 . Проверено 27 января 2022 г.
- Кук, Уэйд Д.; Хабабу, Моэз; Туэнтер, Ханс Дж. Х. (ноябрь 2000 г.). «Многокомпонентное измерение эффективности и общие входные данные в анализе объема данных: применение к эффективности продаж и обслуживания в филиалах банка». Журнал анализа производительности . 14 (3): 209–224. дои : 10.1023/А:1026598803764 . JSTOR 41781515 .
- Кук, Уэйд Д.; Тоне, Каору; Чжу, Джо (апрель 2014 г.). «Анализ оболочки данных: перед выбором модели». Омега . 44 (С): 1–4. дои : 10.1016/j.omega.2013.09.004 .
- Купер, Уильям Вейгер ; Сейфорд, Лоуренс; Чжу, Джо (2000). «Единый подход к аддитивной модели для оценки неэффективности и перегруженности с соответствующими мерами в DEA». Науки о социально-экономическом планировании . 34 (1): 1–25. дои : 10.1016/S0038-0121(99)00010-5 .
- Купер, Уильям Вейгер ; Сейфорд, Лоуренс; Чжу, Джо (2000). «Единый подход к аддитивной модели для оценки неэффективности и перегруженности с соответствующими мерами в DEA». Науки о социально-экономическом планировании . 34 (1): 1–25. дои : 10.1016/S0038-0121(99)00010-5 .
- Купер, Уильям Вейгер; Сейфорд, Лоуренс М.; Тоне, Каору (2007). Анализ оболочки данных: подробный текст с моделями, приложениями, ссылками и программным обеспечением DEA-Solver (2-е изд.). Издательство Спрингер .
- Купер, Уильям Вейджер; Сейфорд, Лоуренс М.; Чжу, Джо, ред. (2011). Справочник по анализу оболочки данных . Международная серия по исследованию операций и науке управления. Том. 164 (2-е изд.). Издательство Спрингер. ISBN 978-1441961501 .
- Дайсон, Р.Г.; Аллен, Р.; Каманью, А.С.; Подиновский В.В.; Саррико, CS; Шейл, Е.А. (16 июля 2001 г.). «Подводные камни и протоколы в DEA». Европейский журнал операционных исследований . Анализ оболочки данных. 132 (2): 245–259. дои : 10.1016/S0377-2217(00)00149-1 .
- Дойл, Джон; Грин, Родни (1994). «Эффективность и перекрестная эффективность в DEA: выводы, значения и использование». Журнал Общества операционных исследований . 45 (5): 567–578. дои : 10.1057/jors.1994.84 . ISSN 0160-5682 . S2CID 122161456 .
- Эмрузнежад, Али; Банкир, Раджив; Рэй, Субхаш; Чен, Лэй (2016). «Последние применения анализа оболочки данных». Материалы 14-й Международной конференции по анализу оболочек данных.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - Фаррелл, Майкл Джеймс (1957). «Измерение производственной эффективности». Журнал Королевского статистического общества . 120 (3): 253–290. дои : 10.2307/2343100 . JSTOR 2343100 .
- Фрид, Гарольд О.; Ловелл, Калифорния, Нокс; Шмидт, Шелтон С. (2008). Измерение производственной эффективности и роста производительности . Издательство Оксфордского университета . ISBN 978-0-19-804050-7 .
- Герреро, Надя; Апарисио, Хуан; Валеро-Каррерас, Даниэль (2022). «Объединение анализа оболочки данных и машинного обучения» . Математика . 10 (6): 909. doi : 10.3390/math10060909 .
- Ловелл, К.Э.Л. и П. Шмидт (1988) «Сравнение альтернативных подходов к измерению эффективности производства», в Дограмачи, А. и Р. Фэре (ред.) « Приложения современной теории производства: эффективность и производительность» , Клювер: Бостон.
- Олесен, Оле Б.; Петерсен, Нильс Кристиан (2016). «Анализ стохастического охвата данных — обзор». Европейский журнал операционных исследований . 251 (1): 2–21. дои : 10.1016/j.ejor.2015.07.058 . ISSN 0377-2217 .
- Раманатан, Р. (2003). Введение в анализ охвата данных: инструмент для измерения производительности . Н.Дели: Издательство SAGE .
- Секстон, Томас Р. (1986). «Анализ оболочки данных: критика и расширение». Новые направления оценки программ . 1986 (32): 73–105. дои : 10.1002/ев.1441 .
- Сиклс, Робин ; Зеленюк, Валентин (2019). Измерение производительности и эффективности - теория и практика (PDF) . Издательство Кембриджского университета . ISBN 978-1-107-68765-3 . Проверено 27 января 2022 г.
- Танасулис, Эммануэль (1995). «Оценка полицейских сил в Англии и Уэльсе с использованием анализа охвата данных». Европейский журнал операционных исследований . 87 (3): 641–657. дои : 10.1016/0377-2217(95)00236-7 .
- Чжоу, Закари; Захария, Алиша; Конатан, Девин; Клайн, Джеффри (2022). «Оценка соотношения ресурсов и производительности моделей естественного языка с использованием анализа оболочки данных». Материалы 3-го семинара по оценке и сравнению систем НЛП . Ассоциация компьютерной лингвистики: 11–20. arXiv : 2211.01486 .
- Коронакос, Грегори; Сотиропулос, Дионисий (2020). «Нейросетевой подход для непараметрической оценки производительности» . 11-я Международная конференция по информации, разведке, системам и приложениям, 2020 г. (IISA . IEEE. стр. 1–8. doi : 10.1109/IISA50023.2020.9284346 . ISBN 978-1-6654-2228-4 . S2CID 228097834 .
Дальнейшее чтение [ править ]
- Сан, Шинн (2002). «Измерение относительной эффективности полицейских участков с использованием анализа охвата данных» . Науки о социально-экономическом планировании . 36 (1): 51–71. дои : 10.1016/s0038-0121(01)00010-6 . Проверено 27 января 2022 г.
- Тофаллис, Крис (2001). «Объединение двух подходов к оценке эффективности» . Журнал Общества операционных исследований . 52 (11): 1225–1231. дои : 10.1057/palgrave.jors.2601231 . hdl : 2299/917 . S2CID 15258094 . ССНН 1353122 . Проверено 27 января 2022 г.
Внешние ссылки [ править ]
- Data Envelopment Analysis Официальный сайт
- журнала анализа производительности Официальный сайт