Jump to content

Алгоритм одновременного приема пищи

Алгоритм одновременного приема пищи (SE) [1] — это алгоритм распределения делимых объектов между агентами с порядковыми предпочтениями . «Порядковые предпочтения» означают, что каждый агент может ранжировать элементы от лучшего к худшему, но не может (или не хочет) указывать числовое значение для каждого элемента. Распределение SE удовлетворяет SD-эффективности - слабому порядковому варианту Парето-эффективности (это означает, что распределение является Парето-эффективным по крайней мере для одного вектора аддитивных функций полезности, согласующихся с рейтингом элементов агентов).

SE параметризуется «скоростью потребления» каждого агента. Если всем агентам дана одинаковая скорость поедания, то распределение SE удовлетворяет SD-свободе от зависти — сильному порядковому варианту отсутствия зависти (это означает, что распределение свободно от зависти для всех векторов аддитивных функций полезности, совместимых с агентами 'рейтинг предметов). Этот конкретный вариант SE называется правилом вероятностной последовательности (PS). [1]

SE был разработан Эрве Муленом и Анной Богомолной как решение проблемы справедливого случайного назначения , где доля, которую каждый агент получает от каждого предмета, интерпретируется как вероятность. Если интеграл скорости поедания всех агентов равен 1, то сумма фракций, назначенных каждому агенту, равна 1, поэтому матрицу фракций можно разложить на лотерею по заданиям, в которой каждый агент получает ровно один предмет. При равных скоростях поедания лотерея не вызывает зависти в ожидании ( ex-ante ) для всех векторов функций полезности, соответствующих рейтингу элементов агентов.

Вариант SE применялся также к разрезанию торта , где распределение является детерминированным (не случайным). [2]

Описание

[ редактировать ]

Каждый предмет представлен в виде буханки хлеба (или другой еды). Вначале каждый агент подходит к своему любимому предмету и начинает его есть. Вполне возможно, что несколько агентов съедают один и тот же предмет одновременно.

Всякий раз, когда предмет съедается полностью, каждый из съевших его агентов переходит к своему любимому оставшемуся предмету и начинает есть его таким же образом, пока все предметы не будут израсходованы.

Для каждого предмета записывается доля этого предмета, съеденная каждым агентом. В контексте случайных назначений эти дроби рассматриваются как вероятности. На основе этих вероятностей проводится лотерея. Тип лотереи зависит от задачи:

  • Если каждому агенту разрешено получить любое количество предметов, то для каждого предмета можно провести отдельную лотерею. Каждый предмет передается одному из агентов, съевших его часть, выбранному случайным образом в соответствии с распределением вероятностей для этого предмета.
  • Если каждый агент должен получить ровно один предмет, то должна существовать единственная лотерея, в которой задание выбирается по некоторому распределению вероятностей из набора детерминированных заданий. Для этого размером n × n матрицу вероятностей следует разложить на выпуклую комбинацию перестановок матриц . Это можно сделать с помощью алгоритма Биркгофа . Гарантированно находится комбинация, в которой число матриц перестановок не превосходит n 2 -2 н +2.

Важным параметром SE является скорость поедания каждого агента. В простейшем случае, когда все агенты имеют одинаковые права, имеет смысл позволить всем агентам постоянно питаться с одинаковой скоростью. Однако, когда у агентов разные права, можно предоставить более привилегированным агентам более высокую скорость приема пищи. Более того, можно позволить скорости еды меняться со временем. Важно то, что интеграл скорости еды каждого агента равен общему количеству предметов, которые агент должен получить (в настройке назначения каждый агент должен получить ровно 1 предмет, поэтому интеграл всех функций скорости еды должен быть равен 1).

Имеется четыре агента и четыре предмета (обозначенные w, x, y, z). Предпочтения агентов:

  • Алиса и Боб предпочитают w, а не x, y, а не z.
  • Чана и Дана предпочитают x вместо w, а не z и y.

Агенты имеют равные права, поэтому мы применяем SE с одинаковой и одинаковой скоростью приема пищи 1 единица в минуту.

Первоначально Алиса и Боб идут в w, а Хана и Дана идут в x. Каждая пара съедает свой предмет одновременно. Через полминуты у Алисы и Боба будет по 1/2 w, а у Ханы и Даны — по 1/2 x.

Затем Алиса и Боб переходят к y (их любимый оставшийся предмет), а Хана и Дана переходят к z (их любимый оставшийся предмет). Через полминуты у Алисы и Боба будет по 1/2 y, а у Ханы и Даны — по 1/2 z.

Матрица дробей теперь такая:

Алиса: 1/2 0 1/2 0

Боб: 1/2 0 1/2 0

Хана: 0 1/2 0 1/2

Дни: 0 1/2 0 1/2

В зависимости от съеденных дробей предмет w с равной вероятностью передается либо Алисе, либо Бобу, и то же самое делается с предметом y; предмет x дается либо Хане, либо Дане с равной вероятностью, и то же самое делается с предметом z. Если требуется выдать ровно 1 предмет на каждого агента, то матрица вероятностей разбивается на следующие две матрицы назначений:

1 0 0 0 ||| 0 0 1 0

0 0 1 0 ||| 1 0 0 0

0 1 0 0 ||| 0 0 0 1

0 0 0 1 ||| 0 1 0 0

Одно из этих заданий выбирается случайным образом с вероятностью 1/2.

Другие примеры можно сгенерировать на сайте MatchU.ai .

Характеристики

[ редактировать ]

В приведенном ниже описании предполагается, что все агенты имеют нейтральные к риску предпочтения , то есть их полезность от лотереи равна ожидаемому значению их полезности от результатов.

Эффективность

[ редактировать ]

SE с любым вектором скоростей питания удовлетворяет свойству эффективности, называемому SD-эффективностью (также называемой порядковой эффективностью). Неформально это означает, что, учитывая результирующую матрицу вероятностей, не существует другой матрицы, которую все агенты предпочитают слабо-sd и хотя бы один агент предпочитает строго-sd.

В контексте случайных назначений SD-эффективность подразумевает эффективность постфактум: каждое детерминированное назначение, выбранное в ходе лотереи, является эффективным по Парето .

Дробное присвоение является SD-эффективным тогда и только тогда, когда оно является результатом SE для некоторого вектора функций скорости еды. [1] : Thm.1

Справедливость

[ редактировать ]

с ожидаемым стохастическим доминированием SE с равными скоростями еды (называемый PS) удовлетворяет свойству справедливости, называемому отсутствием зависти (sd-зависть). Неформально это означает, что каждый агент, рассматривая полученную матрицу вероятностей, слабо предпочитает свой собственный ряд вероятностей ряду любого другого агента. Формально для каждых двух агентов i и j :

  • Агент i имеет немного более высокую вероятность получить свой лучший предмет в строке i, чем в строке j ;
  • Агент i имеет немного более высокую вероятность получить один из двух своих лучших предметов в строке i, чем в строке j ;
  • ...
  • Для любого k ≥ 1 агент i вероятность того, что получит один из своих k лучших предметов в строке i, немного выше, чем в строке j .

Обратите внимание, что отсутствие зависти гарантируется заранее : это справедливо только до проведения лотереи. Алгоритм, конечно, не является справедливым постфактум : после проведения лотереи невезучие агенты могут позавидовать счастливчикам. Это неизбежно при выделении неделимых объектов.

PS помимо отсутствия зависти удовлетворяет еще одному свойству справедливости. При любом дробном распределении для любого агента i и положительного целого числа k определите t ( i , k ) как общую долю, которую агент i получает от своих k самых верхних классов безразличия. Это t — вектор размера не более n * m , где n — количество агентов, а m — количество элементов. Порядково -эгалитарное распределение — это распределение, которое максимизирует вектор t в порядке лексиминов. PS — это уникальное правило, которое возвращает обыкновенно-эгалитарное распределение. [3]

Стратегия

[ редактировать ]

SE не является правдивым механизмом : агент, который знает, что его наиболее предпочтительный предмет не востребован ни одним другим агентом, может манипулировать алгоритмом, съедая свой второй по предпочтительности предмет, зная, что его лучший предмет останется нетронутым. О стратегическом манипулировании ПС известно следующее:

  • PS правдив, когда агенты сравнивают пакеты, используя нисходящее лексикографическое отношение. [3]
  • Агент может вычислить за полиномиальное время лучший ответ относительно нисходящего лексикографического отношения. Когда есть два агента, каждый агент может вычислить за полиномиальное время лучший ответ относительно ожидаемой полезности. Когда количество агентов может варьироваться, вычисление наилучшего ответа относительно ЕС является NP-трудным. [4]
  • Лучшие ответы относительно ожидаемой полезности могут циклически изменяться. Однако чистое равновесие Нэша существует для любого количества агентов и предметов. Когда есть два агента, существуют алгоритмы с линейным временем для вычисления профиля предпочтений, который находится в равновесии по Нэшу относительно исходных предпочтений. В некоторых эмпирических условиях PS менее подвержен манипуляциям. Когда агент не склонен к риску и не имеет информации о стратегиях других агентов, его максиминная стратегия должна быть правдивой. [4]
  • Агент-манипулятор может увеличить свою полезность не более чем в 3/2 раза. Впервые это наблюдалось эмпирически в случайных случаях. [5] и затем доказал формально. [6]

Обратите внимание, что правило случайного приоритета , которое решает ту же проблему, что и PS, является правдивым.

Расширения

[ редактировать ]

Алгоритм SE был расширен во многих отношениях.

  • Катта и Сетураман [7] присутствует расширенная PS (EPS), которая допускает слабые порядковые предпочтения (ранжирование с безразличием). Алгоритм основан на многократном решении примеров параметрического сетевого потока .
  • Богомольная [3] представил более простое определение правила PS для слабых предпочтений, основанное на порядке лексиминов .
  • Йылмаз [8] допускает как безразличие, так и одаренность.
  • Атанассоглут и Сетураман [9] представить правило контролируемого потребления (CC) , которое допускает безразличие и дробные пожертвования в любом количестве.
  • Будиш, Че, Кодзима и Милгром [10] присутствует Обобщенный PS , который позволяет использовать несколько единиц на единицу, больше элементов, чем агентов, каждый агент может получить несколько единиц, верхние квоты и бииерархические ограничения на возможные распределения.
  • Ашлаги, Сабери и Шамели [11] представить еще один Обобщенный PS , который допускает более низкие и верхние квоты, а также ограничения распределения (ограничения на распределение вероятностей, а не только на окончательное распределение).
  • Азиз и Штурсберг [12] представить эгалитарную одновременную резервацию (ESR) , которая позволяет не только справедливо распределять предметы, но и решать общие проблемы социального выбора с возможным безразличием.
  • Азиз и Брандл [13] представить бдительное питание (VE) , которое допускает еще более общие ограничения.

Гарантия приблизительной справедливости постфактум

[ редактировать ]

Как пояснялось выше, распределение, определенное PS, является справедливым только заранее, но не постфактум. Более того, когда каждый агент может получить любое количество предметов, несправедливость ex-post может быть сколь угодно плохой: теоретически возможно, что один агент получит все предметы, а другие агенты не получат ни одного. Недавно было предложено несколько алгоритмов, которые гарантируют как предварительную справедливость, так и приблизительную справедливость постфактум.

Фриман, Шах и Вайш [14] показывать:

  • Алгоритм рекурсивного вероятностного последовательного анализа (RecPS), который возвращает распределение вероятностей по распределениям, которые не вызывают зависти, кроме одного элемента (EF1). Распределение осуществляется по факту EF, а распределение – по факту EF1. Наивная версия этого алгоритма дает распределение по возможно экспоненциальному числу детерминированных распределений, достаточно полиномиального размера поддержки от количества агентов и товаров, и, таким образом, алгоритм работает за полиномиальное время. Алгоритм использует оракул разделения .
  • Другой алгоритм, основанный на прогнозируемом распределении максимального продукта, который обеспечивает ожидаемую групповую свободу от зависти (GEF; он подразумевает как EF, так и PO), а пост-PROP1+EF 1 1 . Это единственное правило распределения, которое обеспечивает все эти свойства. Его нельзя разложить на распределения EF1.
  • Эти комбинации свойств являются наилучшими из возможных: невозможно гарантировать одновременно ex-ante EF (даже PROP) и ex-ante PO вместе с ex-post EF1; или ex-ante EF (даже PROP) вместе с ex-post EF1 и дробным PO.
  • RecPS может быть изменен для получения аналогичных гарантий (ex-ante EF и ex-post EF1) для плохих сделок.

Азиз [15] показывает:

  • Алгоритм PS-лотереи , в котором распределение осуществляется ex-ante sd-EF, а лотерея проводится только среди детерминированных распределений, которые являются sd-EF1, т. е. EF и EF1 гарантируют сохранение любых кардинальных полезностей, соответствующих порядковому рангу. . Более того, результат будет sd-PO как заранее, так и постфактум. Алгоритм использует в качестве подпрограмм как алгоритм PS, так и алгоритм Биркгофа . Предварительное распределение эквивалентно тому, которое возвращает PS; это показывает, что результат PS можно разложить на распределения EF1.
  • При использовании бинарных утилит алгоритм PS-лотереи устойчив к групповой стратегии : прогнозируемое PO, прогнозируемое EF и постфактум EF1.
  • Эти комбинации свойств являются наилучшими: невозможно гарантировать одновременно ex-ante sd-EF, ex-post EF1 и ex-post PO; или ex-ante PO и ex-ante sd-EF.
  • Проверка того, может ли данное случайное распределение быть реализовано посредством лотереи по распределениям EF1 и PO, является NP-сложной задачей.

Бабайофф, Эзра и Файги [16] показывать:

  • Алгоритм с полиномиальным временем для расчета распределений, которые являются пропорциональными заранее и фактическими как PROP1, так и 1/2-дробной максимин-долей (а также 1/2-дробной усеченно-пропорциональной долей ).
  • Эти свойства почти оптимальны - невозможно гарантировать больше, чем PROP ex-ante, и более n /(2 n -1) усеченно-пропорциональной доли ex-post.

Хофер, Шмальхофер и Варриккио [17] распространить понятие лотереи «Лучшее из обоих миров» на агентов с различными правами .

См. также

[ редактировать ]

На странице справедливого случайного назначения PS сравнивается с другими процедурами решения той же проблемы, такими как правило случайного приоритета .

  1. ^ Перейти обратно: а б с Богомольная, Анна ; Мулен, Эрве (2001). «Новое решение проблемы случайного назначения». Журнал экономической теории . 100 (2): 295. doi : 10.1006/jeth.2000.2710 .
  2. ^ Азиз, Харис; Йе, Чун (2014). «Алгоритмы разрезания торта для кусочно-постоянных и кусочно-равномерных оценок» . В Лю, Те-Янь; Ци, Ци; Йе, Иньюй (ред.). Экономика Интернета и Интернета . Конспекты лекций по информатике. Том. 8877. Чам: Springer International Publishing. стр. 1–14. дои : 10.1007/978-3-319-13129-0_1 . ISBN  978-3-319-13129-0 . S2CID   18365892 .
  3. ^ Перейти обратно: а б с Богомолная, Анна (01.07.2015). «Случайное задание: новое определение серийного правила» . Журнал экономической теории . 158 : 308–318. дои : 10.1016/j.jet.2015.04.008 . ISSN   0022-0531 .
  4. ^ Перейти обратно: а б Азиз, Харис; Гасперс, Серж; Маккензи, Саймон; Маттеи, Николас; Народицкая, Нина; Уолш, Тоби (04 мая 2015 г.). Материалы Международной конференции по автономным агентам и мультиагентным системам 2015 года . Стамбул, Турция: Международный фонд автономных агентов и мультиагентных систем. стр. 1451–1459. ISBN  978-1-4503-3413-6 . .Старый технический отчет: https://arxiv.org/abs/1401.6523 .
  5. ^ Хоссейни, Хади; Ларсон, Кейт; Коэн, Робин (01 июля 2018 г.). «Исследование особенностей механизмов одностороннего сопоставления при различных предпочтениях и отношениях к риску» . Автономные агенты и мультиагентные системы . 32 (4): 534–567. arXiv : 1703.00320 . дои : 10.1007/s10458-018-9387-y . ISSN   1573-7454 . S2CID   14041902 .
  6. ^ Ван, Цзихе; Вэй, Жидэ; Чжан, Цзе (3 апреля 2020 г.). «Ограниченные стимулы в манипулировании вероятностным последовательным правилом» . Материалы конференции AAAI по искусственному интеллекту . 34 (2): 2276–2283. arXiv : 2001.10640 . дои : 10.1609/aaai.v34i02.5605 . ISSN   2374-3468 . S2CID   210943079 .
  7. ^ Катта, Акшай-Кумар; Сетураман, Джей (2006). «Решение проблемы случайного назначения в области полных предпочтений». Журнал экономической теории . 131 : 231–250. дои : 10.1016/j.jet.2005.05.001 .
  8. ^ Йылмаз, Озгюр (2009). «Случайное назначение при слабых предпочтениях» . Игры и экономическое поведение . 66 : 546–558. дои : 10.1016/j.geb.2008.04.017 .
  9. ^ Атанассоглу, Стергиос; Сетураман, Джей (1 августа 2011 г.). «Выделение дома с долевым вкладом» . Международный журнал теории игр . 40 (3): 481–513. дои : 10.1007/s00182-010-0251-9 . ISSN   1432-1270 . S2CID   15909570 .
  10. ^ Будиш, Эрик; Че, Ён Ку; Кодзима, Фухито; Милгром, Пол (1 апреля 2013 г.). «Проектирование механизмов случайного распределения: теория и приложения» . Американский экономический обзор . 103 (2): 585–623. дои : 10.1257/aer.103.2.585 . ISSN   0002-8282 .
  11. ^ Ашлаги, Итай; Сабери, Амин; Шамели, Али (01 марта 2020 г.). «Механизмы назначения в условиях распределительных ограничений» . Исследование операций . 68 (2): 467–479. arXiv : 1810.04331 . дои : 10.1287/опре.2019.1887 . ISSN   0030-364X .
  12. ^ Азиз, Харис; Стурсберг, Пол (20 июня 2014 г.). «Обобщение вероятностного сериального анализа для рандомизированного социального выбора» . Материалы конференции AAAI по искусственному интеллекту . 28 (1). дои : 10.1609/aaai.v28i1.8796 . ISSN   2374-3468 . S2CID   16265016 .
  13. ^ Азиз, Харис; Брандл, Флориан (01 сентября 2022 г.). «Правило бдительного питания: общий подход к вероятностному экономическому проектированию с ограничениями» . Игры и экономическое поведение . 135 : 168–187. arXiv : 2008.08991 . дои : 10.1016/j.geb.2022.06.002 . ISSN   0899-8256 . S2CID   221186811 .
  14. ^ Фриман, Руперт; Шах, Нисарг; Вайш, Рохит (13 июля 2020 г.). «Лучшее из обоих миров: предварительная и фактическая справедливость в распределении ресурсов» . Материалы 21-й конференции ACM по экономике и вычислениям . ЕС '20. Виртуальное мероприятие, Венгрия: Ассоциация вычислительной техники. стр. 21–22. arXiv : 2005.14122 . дои : 10.1145/3391403.3399537 . ISBN  978-1-4503-7975-5 . S2CID   211141200 .
  15. ^ Азиз, Харис (07 декабря 2020 г.). «Одновременное достижение ожидаемой и фактической справедливости» . Экономика Интернета и Интернета . Конспекты лекций по информатике. Том. 12495. Берлин, Гейдельберг: Springer-Verlag. стр. 341–355. arXiv : 2004.02554 . дои : 10.1007/978-3-030-64946-3_24 . ISBN  978-3-030-64945-6 . S2CID   214802174 .
  16. ^ Бабаёв, Моше; Эзра, Томер; Файги, Уриэль (9 февраля 2021 г.). «Справедливое распределение акций по принципу «лучшее из обоих миров». arXiv : 2102.04909 [ cs.GT ].
  17. ^ Хофер, Мартин; Шмальхофер, Марко; Варриккио, Джованна (08 сентября 2022 г.). «Лучшее из обоих миров: агенты с правами». arXiv : 2209.03908 [ cs.GT ].
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ca0cbdf8c0cba6bcd2a981518ea5fd96__1712153760
URL1:https://arc.ask3.ru/arc/aa/ca/96/ca0cbdf8c0cba6bcd2a981518ea5fd96.html
Заголовок, (Title) документа по адресу, URL1:
Simultaneous eating algorithm - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)