Jump to content

Стохастическая транзитивность

стохастической транзитивности Модели [1] [2] [3] [4] являются стохастическими версиями свойства транзитивности бинарных отношений, изучаемых в математике . Существует несколько моделей стохастической транзитивности, которые использовались для описания вероятностей, задействованных в экспериментах по парным сравнениям , особенно в сценариях, где ожидается транзитивность, однако эмпирические наблюдения бинарного отношения являются вероятностными. Например, можно ожидать, что навыки игроков в каком-либо виде спорта будут транзитивными, т.е. «если игрок А лучше, чем B, а B лучше, чем C, то игрок A должен быть лучше, чем C»; однако в любом матче более слабый игрок все равно может выиграть с положительной вероятностью. У хорошо подобранных игроков может быть больше шансов наблюдать эту инверсию, в то время как игроки с большими различиями в своих навыках могут видеть, что такие инверсии случаются редко. Модели стохастической транзитивности формализуют такие отношения между вероятностями (например, исхода матча) и лежащим в их основе транзитивным отношением (например, навыками игроков).

Бинарное отношение на съемочной площадке называется транзитивным в стандартном нестохастическом смысле, если и подразумевает для всех участников из .

Стохастические версии транзитивности включают:

  1. Слабая стохастическая транзитивность (WST): и подразумевает , для всех ; [5] : 12  [6] : 43рг
  2. Сильная стохастическая транзитивность (SST): и подразумевает , для всех ; [5] : 12 
  3. Линейная стохастическая переходность (LST): , для всех , где является некоторой возрастающей и симметричной [ объяснить ] функция (называемая функцией сравнения ) и — некоторое отображение из множества альтернатив реальной линии (называемой функцией качества ).

Пример игрушки [ править ]

Игра с шариками . Предположим, двое детей, Билли и Габриэла, собирают шарики. Билли собирает синие шарики, а Габриэла — зеленые шарики. Когда они собираются вместе, они играют в игру, в которой смешивают все свои шарики в мешке и выбирают случайный образец. Если выбранный шарик зеленый, то побеждает Габриэла, а если синий, то побеждает Билли. Если количество синих шариков и - количество зеленых шариков в мешке, то вероятность победа Билли над Габриэлой

.

В этом примере игра в мрамор удовлетворяет линейной стохастической транзитивности, где функция сравнения дается и оценочная функция дается , где количество шариков игрока. Эта игра является примером модели Брэдли-Терри . [7]

Приложения [ править ]

  • Ранжирование и рейтинг . Модели стохастической транзитивности использовались в качестве основы для нескольких методов ранжирования и рейтинга. Примеры включают систему Elo-Rating, используемую в шахматах, го и других классических видах спорта, а также систему TrueSkill от Microsoft , используемую для игровой платформы Xbox.
  • Модели психологии и рациональности - модели Терстона [8] (см. случай 5 в праве сравнительного суждения ), модели Фехнера [3] а также аксиома выбора Люси [9] — это теории, основанные на математике стохастической транзитивности. Также модели теории рационального выбора основаны на предположении о транзитивности предпочтений (см. Полезность фон Неймана и Теоремы Дебре ), однако эти предпочтения часто выявляются с помощью шума стохастическим образом. [10] [11] [12]
  • Машинное обучение и искусственный интеллект (см. « Научитесь ранжировать ») . Хотя Elo и TrueSkill полагаются на конкретные модели LST, модели машинного обучения были разработаны для ранжирования без предварительного знания базовой модели стохастической транзитивности или при более слабых, чем обычно, предположениях о стохастической транзитивности. [13] [14] [15] Обучение на основе парных сравнений также представляет интерес, поскольку позволяет агентам ИИ изучать основные предпочтения других агентов.
  • Теория игр . Справедливость турниров со случайным выбыванием сильно зависит от базовой модели стохастической транзитивности. [16] [17] [18] Теория социального выбора также имеет основы, основанные на моделях стохастической транзитивности. [19]

Связи между моделями [ править ]

Положительные результаты:

  1. Каждая модель, удовлетворяющая линейной стохастической транзитивности, должна также удовлетворять сильной стохастической транзитивности, которая, в свою очередь, должна удовлетворять слабой стохастической транзитивности. Это представлено как: LST ССТ ВСТ ;
  2. Поскольку модели Брэдли-Терри и модель Case V Терстоуна [8] являются LST моделями , они также удовлетворяют требованиям SST и WST ;
  3. За счет удобства более структурированных моделей [ объяснить ] , несколько авторов [1] [2] [3] [4] [20] [21] определили аксиоматические обоснования [ объяснить ] линейной стохастической транзитивности (и других моделей), в первую очередь Жерар Дебре показал, что: [10] Четверное состояние [ объяснить ] + Непрерывность [ объяснить ] LST (см. также Теоремы Дебре );
  4. Две модели LST, заданные обратимыми функциями сравнения и эквивалентны [ объяснить ] тогда и только тогда, когда для некоторых [22]

Отрицательные результаты:

  1. Модели стохастической транзитивности эмпирически не поддаются проверке. [ объяснить ] , [4] однако они могут быть фальсифицируемы;
  2. Отличительный [ объяснить ] между LST функциями сравнения и может быть невозможным, даже если бесконечное количество данных предоставляется по конечному числу точек [ объяснить ] ; [23]
  3. Проблема оценки [ объяснить ] для моделей WST , SST и LST обычно применяется NP-Hard , [24] известны почти оптимальные полиномиально вычислимые процедуры оценки однако для моделей SST и LST . [13] [14] [15]

См. также [ править ]

Ссылки [ править ]

  1. ^ Jump up to: а б Фишберн, Питер К. (ноябрь 1973 г.). «Вероятности двоичного выбора: о разновидностях стохастической транзитивности». Журнал математической психологии . 10 (4): 327–352. дои : 10.1016/0022-2496(73)90021-7 . ISSN   0022-2496 .
  2. ^ Jump up to: а б Кларк, Стивен А. (март 1990 г.). «Концепция стохастической транзитивности случайной полезной модели». Журнал математической психологии . 34 (1): 95–108. дои : 10.1016/0022-2496(90)90015-2 .
  3. ^ Jump up to: а б с Райан, Мэтью (21 января 2017 г.). «Неопределенность и бинарный стохастический выбор». Экономическая теория . 65 (3): 629–662. дои : 10.1007/s00199-017-1033-4 . ISSN   0938-2259 . S2CID   125420775 .
  4. ^ Jump up to: а б с Оливейра, IFD; Зехави, С.; Давыдов, О. (август 2018 г.). «Стохастическая транзитивность: аксиомы и модели». Журнал математической психологии . 85 : 25–35. дои : 10.1016/j.jmp.2018.06.002 . ISSN   0022-2496 .
  5. ^ Jump up to: а б Дональд Дэвидсон и Джейкоб Маршак (июль 1958 г.). Экспериментальные испытания стохастической теории принятия решений (PDF) (Технический отчет). Стэнфордский университет.
  6. ^ Мишель Регенветтер, Джейсон Дана и Клинтин П. Дэвис-Стобер (2011). «Транзитивность предпочтений» (PDF) . Психологический обзор . 118 (1): 42–56. дои : 10.1037/a0021150 . ПМИД   21244185 .
  7. ^ Брэдли, Ральф Аллан; Терри, Милтон Э. (декабрь 1952 г.). «Ранговый анализ неполных блочных конструкций: I. Метод парных сравнений». Биометрика . 39 (3/4): 324. дои : 10.2307/2334029 . JSTOR   2334029 .
  8. ^ Jump up to: а б Терстон, LL (1994). «Закон сравнительного суждения». Психологический обзор . 101 (2): 266–270. дои : 10.1037/0033-295X.101.2.266 . ISSN   0033-295X .
  9. ^ Люс, Р. Дункан (Роберт Дункан) (2005). Поведение индивидуального выбора: теоретический анализ . Минеола, Нью-Йорк: Dover Publications. ISBN  0486441369 . OCLC   874031603 .
  10. ^ Jump up to: а б Дебре, Жерар (июль 1958 г.). «Стохастический выбор и кардинальная полезность» (PDF) . Эконометрика . 26 (3): 440–444. дои : 10.2307/1907622 . ISSN   0012-9682 . JSTOR   1907622 .
  11. ^ Регенветтер, Мишель; Дана, Джейсон; Дэвис-Стобер, Клинтин П. (2011). «Транзитивность предпочтений». Психологический обзор . 118 (1): 42–56. дои : 10.1037/a0021150 . ISSN   1939-1471 . ПМИД   21244185 .
  12. ^ Каваньяро, Дэниел Р.; Дэвис-Стобер, Клинтин П. (2014). «Транзитивен в наших предпочтениях, но транзитивен по-разному: анализ изменчивости выбора». Решение . 1 (2): 102–122. дои : 10.1037/dec0000011 . ISSN   2325-9973 .
  13. ^ Jump up to: а б Шах, Нихар Б.; Балакришнан, Шивараман; Гунтубойина, Адитьянанд; Уэйнрайт, Мартин Дж. (февраль 2017 г.). «Стохастически транзитивные модели для парных сравнений: статистические и вычислительные вопросы» . Транзакции IEEE по теории информации . 63 (2): 934–959. arXiv : 1510.05610 . дои : 10.1109/tit.2016.2634418 . ISSN   0018-9448 .
  14. ^ Jump up to: а б Чаттерджи, Сабьясачи; Мукерджи, Сумит (июнь 2019 г.). «Оценка в турнирах и графах при ограничениях монотонности». Транзакции IEEE по теории информации . 65 (6): 3525–3539. arXiv : 1603.04556 . дои : 10.1109/tit.2019.2893911 . ISSN   0018-9448 . S2CID   54740089 .
  15. ^ Jump up to: а б Оливейра, Иво, федеральный округ; Эйлон, Нир; Давыдов, Ори (2018). «Новый и гибкий подход к анализу данных парных сравнений» . Журнал исследований машинного обучения . 19 : 1–29.
  16. ^ Израиль, Роберт Б. (декабрь 1981 г.). «Сильным игрокам не обязательно выигрывать больше турниров на выбывание». Журнал Американской статистической ассоциации . 76 (376): 950–951. дои : 10.2307/2287594 . ISSN   0162-1459 . JSTOR   2287594 .
  17. ^ Чен, Роберт; Хван, ФК (декабрь 1988 г.). «Сильнее игроки выигрывают более сбалансированные турниры на выбывание». Графы и комбинаторика . 4 (1): 95–99. дои : 10.1007/bf01864157 . ISSN   0911-0119 . S2CID   44602228 .
  18. ^ Адлер, Илан; Цао, Ян; Карп, Ричард; Пекёз, Эрол А.; Росс, Шелдон М. (декабрь 2017 г.). «Турниры со случайным выбыванием». Исследование операций . 65 (6): 1589–1596. arXiv : 1612.04448 . дои : 10.1287/opre.2017.1657 . ISSN   0030-364X . S2CID   1041539 .
  19. ^ Сен, Амартия (январь 1977 г.). «Теория социального выбора: пересмотр». Эконометрика . 45 (1): 53–89. дои : 10.2307/1913287 . ISSN   0012-9682 . JSTOR   1913287 .
  20. ^ Блаватская, Павел Р. (2007). Теорема стохастической полезности . Инст. за эмпирические исследования в экономике. OCLC   255736997 .
  21. ^ Дагсвик, Джон К. (октябрь 2015 г.). «Стохастические модели рискованного выбора: сравнение различных аксиоматизаций». Журнал математической экономики . 60 : 81–88. дои : 10.1016/j.jmateco.2015.06.013 . ISSN   0304-4068 .
  22. ^ Йеллотт, Джон И. (апрель 1977 г.). «Взаимосвязь между аксиомой выбора Люси, теорией сравнительного суждения Терстона и двойным экспоненциальным распределением» . Журнал математической психологии . 15 (2): 109–144. дои : 10.1016/0022-2496(77)90026-8 . ISSN   0022-2496 .
  23. ^ Роквелл, Кристина; Йеллотт, Джон И. (февраль 1979 г.). «Примечание об эквивалентных моделях Thurstone» . Журнал математической психологии . 19 (1): 65–71. дои : 10.1016/0022-2496(79)90006-3 . ISSN   0022-2496 .
  24. ^ деКани, Джон С. (декабрь 1969 г.). «Рейтинг парных сравнений максимального правдоподобия с помощью линейного программирования». Биометрика . 56 (3): 537–545. дои : 10.2307/2334661 . ISSN   0006-3444 . JSTOR   2334661 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b0bfc3dbcd28417d2baa7a8082760a2d__1710858360
URL1:https://arc.ask3.ru/arc/aa/b0/2d/b0bfc3dbcd28417d2baa7a8082760a2d.html
Заголовок, (Title) документа по адресу, URL1:
Stochastic transitivity - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)