Jump to content

Байесовский оптимальный механизм

Байесовский оптимальный механизм (BOM) — это механизм , в котором разработчик не знает оценок агентов, для которых этот механизм предназначен, но разработчик знает, что они являются случайными величинами , и знает распределение вероятностей этих переменных.

Типичное приложение — это продавец, который хочет продать некоторые товары потенциальным покупателям. Продавец хочет установить цену на товары таким образом, чтобы максимизировать свою прибыль. Оптимальные цены зависят от суммы, которую каждый покупатель готов заплатить за каждый товар. Продавец не знает этих сумм, но предполагает, что они взяты из некоторого известного распределения вероятностей . Фраза «байесовский оптимальный дизайн механизма» имеет следующий смысл: [1] : 335–338 

  • Байесовский означает, что мы знаем распределение вероятностей, из которого строятся оценки агентов (в отличие от конструкции механизма без априора , которая не предполагает какого-либо априорного распределения вероятностей).
  • Оптимальный означает, что мы хотим максимизировать ожидаемый доход аукциониста, когда ожидание превышает случайность в оценках агентов.
  • Механизм означает, что мы хотим разработать правила, определяющие правдивый механизм , в котором у каждого агента есть стимул сообщать о своей истинной ценности.

Продается один товар. Есть два потенциальных покупателя. Оценка каждого покупателя рассчитывается iid из равномерного распределения на [0,1].

Аукцион Викри — это правдивый механизм, и его ожидаемая прибыль в этом случае равна 1/3 ( аукцион с закрытыми предложениями по первой цене — это неправдивый механизм, и его ожидаемая прибыль такая же ).

Этот аукцион не является оптимальным. Можно получить большую прибыль, установив резервную цену . Аукцион Викри с резервной ценой 1/2 достигает ожидаемой прибыли 5/12, что в данном случае является оптимальным. [2]

Обозначения

[ редактировать ]

Мы предполагаем, что агенты имеют функции полезности с одним параметром , такие как аукцион одного предмета. Каждый агент имеет ценность которая представляет собой «выигрышную стоимость» агента (например, оценку агентом предмета). Мы не знаем этих значений, но знаем, что каждое извлекается iid из определенного распределения вероятностей. Обозначим через кумулятивная функция распределения :

и по функция распределения вероятностей :

Распределение это вектор , такой, что для каждого , равно 1, если агент выигрывает и 0 в противном случае. Каждое распределение может иметь издержки для аукциониста, .

Профицит : ассигнований определяется как

Это общая прибыль агентов за вычетом расходов аукциониста.

Излишек – это максимально возможная прибыль. Если каждый выигравший агент платит ровно свою стоимость , то прибыль аукциониста равна именно излишку ; это означает, что аукционист забирает все излишки себе и оставляет агентам нулевую полезность.

Эта максимальная прибыль не может быть достигнута, потому что, если аукционист попытается взимать с каждого выигравшего агента его стоимость, , агенты будут лгать и сообщать более низкую стоимость, чтобы платить меньше. Механизм Майерсона призван решить эту проблему.

Механизм Майерсона

[ редактировать ]

Роджер Майерсон разработал байесовский оптимальный механизм для однопараметрических служебных агентов. Ключевой трюк в механизме Майерсона — использование виртуальных оценок . Для каждого агента , определим его виртуальную оценку как:

Обратите внимание, что виртуальная оценка обычно меньше фактической. Возможно даже, что виртуальная оценка будет отрицательной, тогда как фактическая оценка положительна.

Определите виртуальный излишек распределения как:

Обратите внимание, что виртуальный профицит обычно меньше фактического профицита.

Ключевая теорема Майерсона гласит: [1] : 336  [3]

Ожидаемая прибыль любого правдивого механизма равна его ожидаемому виртуальному излишку.

(ожидание берется за случайность оценок агентов).

Эта теорема предполагает следующий механизм:

  • Спросите каждого агента сообщить об их оценке
  • На основании ответа и известных функций распределения , вычислить .
  • Вычислите распределение x, которое максимизирует виртуальный излишек. .

Для завершения описания механизма следует указать цену, которую должен заплатить каждый выигравший агент. Одним из способов расчета цены является использование механизма VCG для виртуальных оценок. . Механизм VCG возвращает как распределение, максимизирующее виртуальный излишек, так и вектор цен. Поскольку вектор цен соответствует виртуальным оценкам, мы должны преобразовать его обратно в пространство реальных оценок. Итак, последний шаг механизма:

  • Возьмите с каждого победившего агента цена , где — цена, определяемая механизмом VCG.

Правдивость

[ редактировать ]

Механизм Майерсона истинен, когда правило распределения удовлетворяет свойству слабой монотонности , т. е. функция распределения слабо возрастает в оценках агентов. Правило распределения VCG действительно слабо возрастает в оценках, но мы используем его с виртуальными оценками, а не с реальными оценками. Следовательно, механизм Майерсона верен, если виртуальные оценки слабо возрастают по сравнению с реальными оценками. Т.е. если для всех : является слабовозрастающей функцией .

Если не является слабовозрастающей функцией , то утюжок Myerson можно использовать .

Механизм Майерсона можно применять в различных условиях. Два примера представлены ниже.

Единичный аукцион

[ редактировать ]

Предположим, мы хотим продать один товар и знаем, что оценки всех агентов исходят из одного и того же распределения вероятностей с функциями . Тогда все участники торгов имеют одну и ту же функцию виртуальной оценки: . Предположим, что эта функция слабовозрастающая. В этом случае механизм VCG сводится к аукциону Викри : он передает лот агенту с наибольшей оценкой (самой высокой ставкой). Но механизм Майерсона использует VCG с виртуальными оценками, которые могут быть отрицательными. Следовательно, механизм Майерсона в данном случае сводится к аукциону Викри с резервированной ценой . Он назначает предмет агенту с наибольшей оценкой, но только если его виртуальная оценка равна как минимум 0 . Это означает, что резервационная цена механизма Майерсона равна ровно:

Итак, если мы знаем функции распределения вероятностей , мы можем вычислить функцию , и исходя из нее найдите оптимальную цену резервирования.

Аукцион цифровых товаров

[ редактировать ]

На аукционе цифровых товаров у нас есть неограниченное количество идентичных товаров. Каждому агенту нужен не более одного предмета. Оценки агентов на предмет происходят из одного и того же распределения вероятностей с функциями и функция виртуальной оценки . Механизм VCG распределяет предмет каждому агенту с неотрицательной виртуальной оценкой и взимает минимальную выигрышную цену, которая составляет:

Это в точности равно оптимальной цене продажи — цене, которая максимизирует ожидаемое значение прибыли продавца при условии распределения оценок:

Альтернативы

[ редактировать ]

Разработка байесовского оптимального механизма требует знания распределений, из которых строятся оценки агентов. Это требование не всегда осуществимо. Есть еще несколько альтернатив:

  1. ^ Jump up to: а б Вазирани, Виджай В .; Нисан, Ноам ; Рафгарден, Тим ; Тардос, Ева (2007). Алгоритмическая теория игр (PDF) . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN  0-521-87282-0 .
  2. ^ Серхио Паррейрас. «Ожидаемый доход, полученный на аукционе Викери с резервной ценой 1/2» . стекобмен .
  3. ^ Майерсон, Роджер Б. (1981). «Оптимальный аукционный дизайн». Математика исследования операций . 6 (1): 58–73. дои : 10.1287/moor.6.1.58 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 099fd72ba1af6e625f5a3536de01dea5__1700377620
URL1:https://arc.ask3.ru/arc/aa/09/a5/099fd72ba1af6e625f5a3536de01dea5.html
Заголовок, (Title) документа по адресу, URL1:
Bayesian-optimal mechanism - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)