Jump to content

Одновременное алгоритм еды

Одновременный алгоритм еды (SE) [ 1 ] является алгоритмом распределения делимых объектов среди агентов с порядковыми предпочтениями . «Порядки предпочтения» означает, что каждый агент может оценить элементы от лучших до худшего, но не может (или не хочет) указать числовое значение для каждого элемента. Распределение SE удовлетворяет эффективности SD- слабый ординальный вариант поэффективности парето (это означает, что распределение является эффективным парето как минимум для одного вектора аддитивных функций, соответствующих рейтингу предметов агентов).

SE параметризован «скоростью питания» каждого агента. Если всем агентам получают одинаковую скорость питания, то распределение SE удовлетворяет SD-Envy-Freensy -сильный ординальный вариант зависти (это означает, что распределение не является завистью для всех векторов функций аддитивной полезности, соответствующих агентам 'Рейтинги предметов). Этот конкретный вариант SE называется вероятностным последовательным правилом (PS). [ 1 ]

SE был разработан Hervé Moulin и Anna Bogomolnaia в качестве решения для справедливой проблемы случайного назначения , где доля, которую каждый агент получает от каждого элемента, интерпретируется как вероятность. Если интеграл скорости питания всех агентов составляет 1, то сумма фракций, назначенных каждому агенту, составляет 1, поэтому матрица фракций может быть разложена в лотерею по сравнению с назначениями, в которых каждый агент получает ровно один элемент. С равными скоростями питания лотерея не является завистью в ожидании ( бывшая ANTE ) для всех векторов коммунальных функций, соответствующих рейтингу предметов агентов.

Вариант SE был применен также к вырезанию тортов , где распределение является детерминированным (не случайным). [ 2 ]

Описание

[ редактировать ]

Каждый предмет представлен как буханка хлеба (или другую еду). Первоначально каждый агент идет на свой любимый предмет и начинает его есть. Возможно, что несколько агентов едят один и тот же предмет одновременно.

Всякий раз, когда предмет полностью съеден, каждый из агентов, которые съели, он идет на свой любимый оставшийся предмет и начинает есть его одинаково, пока все предметы не будут потреблены.

Для каждого предмета записывается доля этого предмета, съеденный каждым агентом. В контексте случайных назначений эти фракции рассматриваются как вероятности. Основываясь на этих вероятностях, готовится лотерея. Тип лотереи зависит от проблемы:

  • Если каждому агенту разрешено получать любое количество предметов, то для каждого элемента может быть сделана отдельная лотерея. Каждый элемент дается одному из агентов, которые ели его часть, выбранным случайным образом в соответствии с распределением вероятностей для этого элемента.
  • Если каждый агент будет получать ровно один элемент, то должна быть одна лотерея, которая выбирает назначение с помощью некоторого распределения вероятностей в наборе детерминированных назначений. Чтобы сделать это, n -by -n -матрица вероятностей должна быть разложена в выпуклую комбинацию матриц перестановки . Это может быть сделано алгоритмом Биркхоффа . Это гарантированно найдет комбинацию, в которой количество матриц перестановки не больше n 2 -2 N +2.

Важным параметром для SE является скорость питания каждого агента. В простейшем случае, когда все агенты имеют одинаковые права, имеет смысл позволить всем агентам все время есть на одинаковой скорости. Однако, когда агенты имеют разные права, можно дать более привилегированным агентам более высокую скорость питания. Более того, можно позволить скорости питания измениться со временем. Важно то, что интеграл скорости питания каждого агента равняется общему количеству элементов, которые должен получать агент (в настройках назначения каждый агент должен получить ровно 1 элемент, поэтому интеграл всех функций скорости питания должен быть 1).

Есть четыре агента и четыре предмета (обозначены W, X, Y, Z). Предпочтения агентов:

  • Алиса и Боб предпочитают w до x до y до z.
  • Чана и Дана предпочитают x до z до y.

Агенты имеют равные права, поэтому мы применяем SE с равной и равномерной скоростью питания 1 единицы в минуту.

Первоначально Алиса и Боб отправляются в W, а Хана и Дана отправляются в X. Каждая пара ест свой предмет одновременно. Через 1/2 минуты у Алисы и Боба есть 1/2 W, в то время как у Чана и Даны есть 1/2 x.

Затем Алиса и Боб идут на Y (их любимый оставшийся предмет), а Чана и Дана идут в Z (их любимый оставшийся предмет). Через 1/2 минуты у Алисы и Боба есть 1/2 y, а Chana и Dana имеют 1/2 z.

Матрица фракций сейчас:

Алиса: 1/2 0 1/2 0

Боб: 1/2 0 1/2 0

Чана: 0 1/2 0 1/2

Дни: 0 1/2 0 1/2

Основываясь на съеденных фракциях, предмет W дается либо Алисе, либо с боб с одинаковой вероятностью, и то же самое делается с элементом y; Пункт x дается Chana или Dana с одинаковой вероятностью, и то же самое делается с элементом z. Если требуется дать ровно 1 элемент на агент, то матрица вероятностей разлагается на следующие два матрицы назначения:

1 0 0 0 ||| 0 0 1 0

0 0 1 0 ||| 1 0 0 0

0 1 0 0 ||| 0 0 0 1

0 0 0 1 ||| 0 1 0 0

Одно из этих назначений выбирается случайным образом с вероятностью 1/2.

Другие примеры могут быть сгенерированы на веб -сайте Matchu.ai .

Характеристики

[ редактировать ]

Приведенное ниже описание предполагает, что все агенты имеют нейтральные предпочтения , то есть их полезность из лотереи равна ожидаемой стоимости их полезности от результатов.

Эффективность

[ редактировать ]

SE с любым вектором скорости питания удовлетворяет свойство эффективности, называемую SD-эффективностью (также называемой порядковой эффективностью). Неофициально это означает, что, учитывая полученную матрицу вероятности, нет другой матрицы, которую все агенты слабо-SD-предъявления и, по крайней мере, один агент строго-SD-предварительные.

В контексте случайных назначений SD-эффективность подразумевает эффективность EX-POST: каждое детерминированное назначение, выбранное лотереей, является эффективным парето .

Фракционное назначение является SD-эффективным, если и только-если это является результатом SE для некоторых векторов функций скорости пищевой пищевой промышленности. [ 1 ] : Thm.1

Справедливость

[ редактировать ]

SE с равными скоростями питания (называется PS) удовлетворяет справедливости, называемой бывшей стохастической доминанкой -завистью к справедливости (без SD-Envy). Неофициально это означает, что каждый агент, учитывая полученную матрицу вероятности, слабо предпочитает его/ее собственную строку вероятностей в строку любого другого агента. Формально, на каждые два агента I и J :

  • Агент У меня есть слабо более высокая вероятность получить свой лучший предмет в ряду I, чем в строке J ;
  • Агент У меня есть слабо более высокая вероятность получить один из двух его лучших предметов в ряду I, чем в ряду J ;
  • ...
  • Для любого k ≥ 1 агент I обладает слабо более высокой вероятностью получить один из его лучших предметов в ряд I, в ряд J. чем

Обратите внимание, что SD-Envy-Freense гарантирована бывшая Ante : это справедливо только до того, как начнется лотерея. Алгоритм, конечно, не бывшая ярмарка пост: после того, как лотерея произойдет, несчастливые агенты могут завидовать счастливчикам. Это неизбежно при распределении неделимых объектов.

PS удовлетворяет другому имуществу справедливости, в дополнение к зависти. Учитывая какое -либо дробное распределение, для любого агента I и положительного целого числа K определяйте t ( i , k ) как общую долю, которую агент, который я получает от его самых качественных классов безразличия. Этот T является вектором размера в большинстве N * M , где n - количество агентов, а M - это количество предметов. Указно -эгалитарное распределение-это то, что максимизирует вектор T в порядке лексина. PS-это уникальное правило, которое возвращает упорядоченное распределение. [ 3 ]

Стратегия

[ редактировать ]

SE не является правдивым механизмом : агент, который знает, что его наиболее предпочтительный предмет не разыскивается каким-либо другим агентом, может манипулировать алгоритмом, съев свой второй наиболее предпочтительный предмет, зная, что его лучший предмет останется нетронутым. Следующее известно о стратегических манипуляциях с PS:

  • PS правдив, когда агенты сравнивают пучки, используя нисходящую лексикографическую связь. [ 3 ]
  • Агент может вычислить в полиномиальное время наиболее отвечающим вниз по нисходящей лексикографической связи. Когда есть два агента, каждый агент может вычислить в полиномиальное время лучшую отклик WRT ожидаемой полезности. Когда количество агентов может варьироваться, вычисление наилучшего ответа wrt eu является NP-Hard. [ 4 ]
  • Лучшие ответы, которые ожидаемая утилита, может ездить на велосипеде. Тем не менее, равновесие чистого Нэша существует для любого количества агентов и предметов. Когда есть два агента, существуют алгоритмы линейного времени, чтобы вычислять предварительный профиль, который находится в равновесии NASH, исходные предпочтения. В некоторых эмпирических условиях PS менее подвержен манипуляциям. Когда агент не склонен к риску и не имеет информации о стратегиях других агентов, его стратегия максимина -быть правдивой. [ 4 ]
  • Манипулирующий агент может увеличить свою полезность не более 3/2. Сначала это наблюдалось эмпирически в случайных случаях, [ 5 ] а затем доказано формально. [ 6 ]

Обратите внимание, что правило случайного приоритета , которое решает ту же проблему, что и PS, является правдивым.

Расширения

[ редактировать ]

Алгоритм SE был расширен во многих отношениях.

  • Катта и Сетвураман [ 7 ] Присутствует расширенный PS (EPS), который допускает слабые порядковые предпочтения (рейтинги с равнодушными). Алгоритм основан на многократном решении экземпляров параметрического потока сети .
  • Богомольная [ 3 ] представил более простое определение правила PS для слабых предпочтений, основанного на порядок лексина .
  • Йилмаз [ 8 ] позволяет как безразличия, так и пожертвования.
  • Athanassoglout и Sethuraman [ 9 ] Представьте правило контролируемого потребления (CC) , которое допускает безразличность и дробные пожертвования любого количества.
  • Будиш, Че, Кодзима и Милгром [ 10 ] Представляют обобщенные PS , которые позволяют нескольким единицам на элемент, больше элементов, чем агентов, каждый агент может получить несколько единиц, верхние квоты и двуирархические ограничения на возможные ассигнования.
  • Эшлаги, Сабери и Шамели [ 11 ] Представьте еще один обобщенный PS , который допускает нижние и верхние квоты, а также ограничения распределения (ограничения на распределение вероятностей, а не только окончательное распределение).
  • Азиз и Стурсберг [ 12 ] Присутствует эгалитарное одновременное резервирование (ESR) , которая допускает не только справедливое распределение предметов, но и общие проблемы с социальным выбором , с возможными безразличиями.
  • Азиз и Брандл [ 13 ] Настоящее бдительное питание (VE) , которое допускает еще более общие ограничения.

Гарантирование бывшей пост приблизительной справедливости

[ редактировать ]

Как объяснено выше, распределение, определяемое PS, является справедливым только бывшей Анте, но не экс-пост. Более того, когда каждый агент может получить любое количество предметов, бывшая пост несправедливость может быть произвольно плохой: теоретически возможно, что один агент получит все элементы, в то время как другие агенты не получат их. В последнее время было предложено несколько алгоритмов, которые гарантируют как справедливость бывшей, так и бывшую примерную борьбу.

Фриман, Шах и Вайш [ 14 ] показывать:

  • Алгоритм рекурсивной вероятностной серийной (RECPS), который возвращает распределение вероятностей по поводу распределений, которые все являются без зависания-за исключением одного элемента (EF1). Распределение является бывшим EF, а ассигнование-EX-POST EF1. Наивная версия этого алгоритма дает распределение по возможному экспоненциальному количеству детерминированных ассигнований, достаточно полинома опорного размера по количеству агентов и товаров, и, следовательно, алгоритм работает во время полинома. Алгоритм использует отдельные ораки .
  • Другой алгоритм, основанный на распределении бывшего максимального продукта, который достигает бывшей энтузиазмом группы Ex-Ante (GEF; он подразумевает как EF, так и PO), и Ex-Post Prop1+EF 1 1 Полем Это единственное правило распределения, которое достигает всех этих свойств. Это не может быть разложено на распределения EF1.
  • Эти комбинации свойств наилучшим образом возможны: невозможно гарантировать одновременно экс-эф (даже опора) и бывшего PO вместе с бывшим Post EF1; или бывший ante ef (даже опора) вместе с эксплуатацией EF1 и фракционированием.
  • RECP могут быть изменены, чтобы достичь аналогичных гарантий (Ex-Ante EF и Ex-Post EF1) для плохих.

Азиз [ 15 ] шоу:

  • Алгоритм PS-Lottery , в котором ассигнование является бывшим SD-EF, а лотерея выполняется только среди детерминированных ассигнований, которые являются SD-EF1, то есть гарантия EF и EF1 удерживает для любых кардинальных утилит. Полем Более того, результатом является SD-PO Ex-Ante и Ex-Post. Алгоритм использует в качестве подпрограммы как алгоритм PS, так и алгоритм Birkhoff . Распределение бывшего ANTE эквивалентно тому, что возвращается PS; Это показывает, что результат PS может быть разложено на распределения EF1.
  • Благодаря бинарным утилитам алгоритм PS-Lottery является групповой стратегии-защитой , бывшая ANTE PO, EX-ANTE EF и EX-POST EF1.
  • Эти комбинации свойств наилучшим образом возможны: невозможно гарантировать одновременно экс-ANTE SD-EF, EX-POST EF1 и EX-POST PO; или бывший Анте По и бывший SD-EF.
  • Проверка, может ли данное случайное распределение быть реализовано лотереей по сравнению с EF1 и PO-распределением, является NP-Hard.

Babaioff, Ezra и Feige [ 16 ] показывать:

  • Алгоритм полиномиального времени для вычислений распределения, которые являются бывшими пропорциональными, и эксплуатируйте как ProP1, так и 1/2 максимина 1/2 фракции -фракции (а также усеченная пропорциональная доля ).
  • Эти свойства почти оптимальны-невозможно гарантировать больше, чем Ex-Ante, и более N /(2 N -1) усеченная пропорциональная доля.

Hoefer, Schmalhofer и Varricchio [ 17 ] Расширить понятие лотереи «Лучшие в мире» на агенты с различными правами .

Смотрите также

[ редактировать ]

Страница на справедливом случайном назначении сравнивает PS с другими процедурами для решения той же проблемы, таких как правило случайного приоритета .

  1. ^ Jump up to: а беременный в Богомольна, Анна ; Мулен, Херве (2001). «Новое решение проблемы случайного назначения». Журнал экономической теории . 100 (2): 295. doi : 10.1006/jeth.2000.2710 .
  2. ^ Азиз, Харис; Йе, Чун (2014). «Алгоритмы вырезания торта для кусочно -качественных и кусочно -равномерных оценок» . В Лю, галстук-янь; Ци, ци; Ye, Yinyu (ред.). Веб и интернет -экономика . Заметки лекции в информатике. Тол. 8877. Cham: Springer International Publishing. С. 1–14. doi : 10.1007/978-3-319-13129-0_1 . ISBN  978-3-319-13129-0 Полем S2CID   18365892 .
  3. ^ Jump up to: а беременный в Богомольна, Анна (2015-07-01). «Случайное назначение: переопределение последовательного правила» . Журнал экономической теории . 158 : 308–318. doi : 10.1016/j.jet.2015.04.008 . ISSN   0022-0531 .
  4. ^ Jump up to: а беременный Азиз, Харис; Газперс, Серж; Маккензи, Саймон; Маттей, Николас; Народицка, Нина; Уолш, Тоби (2015-05-04). Материалы Международной конференции 2015 года по автономным агентам и многоагентным системам . Стамбул, Турция: Международный фонд автономных агентов и многоагентных систем. С. 1451–1459. ISBN  978-1-4503-3413-6 Полем Полем Старый технический отчет: https://arxiv.org/abs/1401.6523 .
  5. ^ Хоссейни, Хади; Ларсон, Кейт; Коэн, Робин (2018-07-01). «Исследование характеристик односторонних механизмов сопоставления в различных предпочтениях и отношениях риска» . Автономные агенты и многоагентные системы . 32 (4): 534–567. Arxiv : 1703.00320 . doi : 10.1007/s10458-018-9387-y . ISSN   1573-7454 . S2CID   14041902 .
  6. ^ Ван, Зихе; Вэй, Жид; Чжан, Цзе (2020-04-03). «Ограниченные стимулы в манипулировании вероятностным серийным правилом» . Труды конференции АААИ по искусственному интеллекту . 34 (2): 2276–2283. Arxiv : 2001.10640 . doi : 10.1609/aaai.v34i02.5605 . ISSN   2374-3468 . S2CID   210943079 .
  7. ^ Катта, Акшай-Кумар; Сетураман, Джей (2006). «Решение проблемы случайного назначения в домене полного предпочтения». Журнал экономической теории . 131 : 231–250. doi : 10.1016/j.jet.2005.05.001 .
  8. ^ Йылмаз, Озгюр (2009). «Случайное назначение под слабыми предпочтениями» . Игры и экономическое поведение . 66 : 546–558. doi : 10.1016/j.geb.2008.04.017 .
  9. ^ Athanassoglou, Stergios; Сетураман, Джей (2011-08-01). «Распределение дома с дробными фондами» . Международный журнал теории игр . 40 (3): 481–513. doi : 10.1007/s00182-010-0251-9 . ISSN   1432-1270 . S2CID   15909570 .
  10. ^ Будиш, Эрик; Че, йон-ку; Кодзима, Фухито; Милгром, Пол (2013-04-01). «Проектирование механизмов случайного распределения: теория и приложения» . Американский экономический обзор . 103 (2): 585–623. doi : 10.1257/aer.103.2.585 . ISSN   0002-8282 .
  11. ^ Эшли, Итаи; Сабери, Амин; Шамели, Али (2020-03-01). «Механизмы назначения в рамках ограничений распределения» . Операционные исследования . 68 (2): 467–479. Arxiv : 1810.04331 . doi : 10.1287/opre.2019.1887 . ISSN   0030-364X .
  12. ^ Азиз, Харис; Stursberg, Paul (2014-06-20). «Обобщение вероятностного сериала или рандомизированного социального выбора» . Труды конференции АААИ по искусственному интеллекту . 28 (1). doi : 10.1609/aaai.v28i1.8796 . ISSN   2374-3468 . S2CID   16265016 .
  13. ^ Азиз, Харис; Брандл, Флориан (2022-09-01). «Правило бдительного питания: общий подход к вероятностному экономическому дизайну с ограничениями» . Игры и экономическое поведение . 135 : 168–187. Arxiv : 2008.08991 . doi : 10.1016/j.geb.2022.06.002 . ISSN   0899-8256 . S2CID   221186811 .
  14. ^ Фриман, Руперт; Шах, Нисарг; Вайш, Рохит (2020-07-13). «Лучший из обоих миров: бывшая справедливость и бывшая пост в распределении ресурсов» . Материалы 21 -й конференции ACM по экономике и вычислениям . EC '20. Виртуальное событие, Венгрия: Ассоциация вычислительной техники. С. 21–22. Arxiv : 2005.14122 . doi : 10.1145/3391403.3399537 . ISBN  978-1-4503-7975-5 Полем S2CID   211141200 .
  15. ^ Азиз, Харис (2020-12-07). «Одновременно достигая справедливости бывшей Анты и бывшей пост» . Веб и интернет -экономика . Заметки лекции в информатике. Тол. 12495. Берлин, Гейдельберг: Springer-Verlag. С. 341–355. Arxiv : 2004.02554 . doi : 10.1007/978-3-030-64946-3_24 . ISBN  978-3-030-64945-6 Полем S2CID   214802174 .
  16. ^ Бабайофф, Моше; Эзра, Томер; Фейдж, Уриэль (2021-02-09). «Лучшие вульдоры в мире распределения ярмарки». arxiv : 2102.04909 [ Cs.gt ].
  17. ^ Хофер, Мартин; Шмалхофер, Марко; Варриккио, Джованна (2022-09-08). «Лучший из обоих миров: агенты с правами». arxiv : 2209.03908 [ Cs.gt ].
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d4194cb4357fb727fe5b8c350e374e2e__1712153760
URL1:https://arc.ask3.ru/arc/aa/d4/2e/d4194cb4357fb727fe5b8c350e374e2e.html
Заголовок, (Title) документа по адресу, URL1:
Simultaneous eating algorithm - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)