Стохастическая транзитивность
стохастической транзитивности Модели [1] [2] [3] [4] являются стохастическими версиями свойства транзитивности бинарных отношений, изучаемых в математике . Существует несколько моделей стохастической транзитивности, которые использовались для описания вероятностей, задействованных в экспериментах по парным сравнениям , особенно в сценариях, где ожидается транзитивность, однако эмпирические наблюдения бинарного отношения являются вероятностными. Например, можно ожидать, что навыки игроков в каком-либо виде спорта будут транзитивными, т.е. «если игрок А лучше, чем B, а B лучше, чем C, то игрок A должен быть лучше, чем C»; однако в любом матче более слабый игрок все равно может выиграть с положительной вероятностью. У хорошо подобранных игроков может быть больше шансов наблюдать эту инверсию, в то время как игроки с большими различиями в своих навыках могут видеть, что такие инверсии случаются редко. Модели стохастической транзитивности формализуют такие отношения между вероятностями (например, исхода матча) и лежащим в их основе транзитивным отношением (например, навыками игроков).
Бинарное отношение на съемочной площадке называется транзитивным в стандартном нестохастическом смысле, если и подразумевает для всех участников из .
Стохастические версии транзитивности включают:
- Слабая стохастическая транзитивность (WST): и подразумевает , для всех ; [5] : 12 [6] : 43рг
- Сильная стохастическая транзитивность (SST): и подразумевает , для всех ; [5] : 12
- Линейная стохастическая переходность (LST): , для всех , где является некоторой возрастающей и симметричной [ объяснить ] функция (называемая функцией сравнения ) и — некоторое отображение из множества альтернатив реальной линии (называемой функцией качества ).
Пример игрушки [ править ]
Игра с шариками . Предположим, двое детей, Билли и Габриэла, собирают шарики. Билли собирает синие шарики, а Габриэла — зеленые шарики. Когда они собираются вместе, они играют в игру, в которой смешивают все свои шарики в мешке и выбирают случайный образец. Если выбранный шарик зеленый, то побеждает Габриэла, а если синий, то побеждает Билли. Если количество синих шариков и - количество зеленых шариков в мешке, то вероятность победа Билли над Габриэлой
.
В этом примере игра в мрамор удовлетворяет линейной стохастической транзитивности, где функция сравнения дается и оценочная функция дается , где количество шариков игрока. Эта игра является примером модели Брэдли-Терри . [7]
Приложения [ править ]
- Ранжирование и рейтинг . Модели стохастической транзитивности использовались в качестве основы для нескольких методов ранжирования и рейтинга. Примеры включают систему Elo-Rating, используемую в шахматах, го и других классических видах спорта, а также систему TrueSkill от Microsoft , используемую для игровой платформы Xbox.
- Модели психологии и рациональности - модели Терстона [8] (см. случай 5 в праве сравнительного суждения ), модели Фехнера [3] а также аксиома выбора Люси [9] — это теории, основанные на математике стохастической транзитивности. Также модели теории рационального выбора основаны на предположении о транзитивности предпочтений (см. Полезность фон Неймана и Теоремы Дебре ), однако эти предпочтения часто выявляются с помощью шума стохастическим образом. [10] [11] [12]
- Машинное обучение и искусственный интеллект (см. « Научитесь ранжировать ») . Хотя Elo и TrueSkill полагаются на конкретные модели LST, модели машинного обучения были разработаны для ранжирования без предварительного знания базовой модели стохастической транзитивности или при более слабых, чем обычно, предположениях о стохастической транзитивности. [13] [14] [15] Обучение на основе парных сравнений также представляет интерес, поскольку позволяет агентам ИИ изучать основные предпочтения других агентов.
- Теория игр . Справедливость турниров со случайным выбыванием сильно зависит от базовой модели стохастической транзитивности. [16] [17] [18] Теория социального выбора также имеет основы, основанные на моделях стохастической транзитивности. [19]
Связи между моделями [ править ]
Положительные результаты:
- Каждая модель, удовлетворяющая линейной стохастической транзитивности, должна также удовлетворять сильной стохастической транзитивности, которая, в свою очередь, должна удовлетворять слабой стохастической транзитивности. Это представлено как: LST ССТ ВСТ ;
- Поскольку модели Брэдли-Терри и модель Case V Терстоуна [8] являются LST моделями , они также удовлетворяют требованиям SST и WST ;
- За счет удобства более структурированных моделей [ объяснить ] , несколько авторов [1] [2] [3] [4] [20] [21] определили аксиоматические обоснования [ объяснить ] линейной стохастической транзитивности (и других моделей), в первую очередь Жерар Дебре показал, что: [10] Четверное состояние [ объяснить ] + Непрерывность [ объяснить ] LST (см. также Теоремы Дебре );
- Две модели LST, заданные обратимыми функциями сравнения и эквивалентны [ объяснить ] тогда и только тогда, когда для некоторых [22]
Отрицательные результаты:
- Модели стохастической транзитивности эмпирически не поддаются проверке. [ объяснить ] , [4] однако они могут быть фальсифицируемы;
- Отличительный [ объяснить ] между LST функциями сравнения и может быть невозможным, даже если бесконечное количество данных предоставляется по конечному числу точек [ объяснить ] ; [23]
- Проблема оценки [ объяснить ] для моделей WST , SST и LST обычно применяется NP-Hard , [24] известны почти оптимальные полиномиально вычислимые процедуры оценки однако для моделей SST и LST . [13] [14] [15]
См. также [ править ]
Ссылки [ править ]
- ^ Jump up to: а б Фишберн, Питер К. (ноябрь 1973 г.). «Вероятности двоичного выбора: о разновидностях стохастической транзитивности». Журнал математической психологии . 10 (4): 327–352. дои : 10.1016/0022-2496(73)90021-7 . ISSN 0022-2496 .
- ^ Jump up to: а б Кларк, Стивен А. (март 1990 г.). «Концепция стохастической транзитивности случайной полезной модели». Журнал математической психологии . 34 (1): 95–108. дои : 10.1016/0022-2496(90)90015-2 .
- ^ Jump up to: а б с Райан, Мэтью (21 января 2017 г.). «Неопределенность и бинарный стохастический выбор». Экономическая теория . 65 (3): 629–662. дои : 10.1007/s00199-017-1033-4 . ISSN 0938-2259 . S2CID 125420775 .
- ^ Jump up to: а б с Оливейра, IFD; Зехави, С.; Давыдов, О. (август 2018 г.). «Стохастическая транзитивность: аксиомы и модели». Журнал математической психологии . 85 : 25–35. дои : 10.1016/j.jmp.2018.06.002 . ISSN 0022-2496 .
- ^ Jump up to: а б Дональд Дэвидсон и Джейкоб Маршак (июль 1958 г.). Экспериментальные испытания стохастической теории принятия решений (PDF) (Технический отчет). Стэнфордский университет.
- ^ Мишель Регенветтер, Джейсон Дана и Клинтин П. Дэвис-Стобер (2011). «Транзитивность предпочтений» (PDF) . Психологический обзор . 118 (1): 42–56. дои : 10.1037/a0021150 . ПМИД 21244185 .
- ^ Брэдли, Ральф Аллан; Терри, Милтон Э. (декабрь 1952 г.). «Ранговый анализ неполных блочных конструкций: I. Метод парных сравнений». Биометрика . 39 (3/4): 324. дои : 10.2307/2334029 . JSTOR 2334029 .
- ^ Jump up to: а б Терстон, LL (1994). «Закон сравнительного суждения». Психологический обзор . 101 (2): 266–270. дои : 10.1037/0033-295X.101.2.266 . ISSN 0033-295X .
- ^ Люс, Р. Дункан (Роберт Дункан) (2005). Поведение индивидуального выбора: теоретический анализ . Минеола, Нью-Йорк: Dover Publications. ISBN 0486441369 . OCLC 874031603 .
- ^ Jump up to: а б Дебре, Жерар (июль 1958 г.). «Стохастический выбор и кардинальная полезность» (PDF) . Эконометрика . 26 (3): 440–444. дои : 10.2307/1907622 . ISSN 0012-9682 . JSTOR 1907622 .
- ^ Регенветтер, Мишель; Дана, Джейсон; Дэвис-Стобер, Клинтин П. (2011). «Транзитивность предпочтений». Психологический обзор . 118 (1): 42–56. дои : 10.1037/a0021150 . ISSN 1939-1471 . ПМИД 21244185 .
- ^ Каваньяро, Дэниел Р.; Дэвис-Стобер, Клинтин П. (2014). «Транзитивен в наших предпочтениях, но транзитивен по-разному: анализ изменчивости выбора». Решение . 1 (2): 102–122. дои : 10.1037/dec0000011 . ISSN 2325-9973 .
- ^ Jump up to: а б Шах, Нихар Б.; Балакришнан, Шивараман; Гунтубойина, Адитьянанд; Уэйнрайт, Мартин Дж. (февраль 2017 г.). «Стохастически транзитивные модели для парных сравнений: статистические и вычислительные вопросы» . Транзакции IEEE по теории информации . 63 (2): 934–959. arXiv : 1510.05610 . дои : 10.1109/tit.2016.2634418 . ISSN 0018-9448 .
- ^ Jump up to: а б Чаттерджи, Сабьясачи; Мукерджи, Сумит (июнь 2019 г.). «Оценка в турнирах и графах при ограничениях монотонности». Транзакции IEEE по теории информации . 65 (6): 3525–3539. arXiv : 1603.04556 . дои : 10.1109/tit.2019.2893911 . ISSN 0018-9448 . S2CID 54740089 .
- ^ Jump up to: а б Оливейра, Иво, федеральный округ; Эйлон, Нир; Давыдов, Ори (2018). «Новый и гибкий подход к анализу данных парных сравнений» . Журнал исследований машинного обучения . 19 : 1–29.
- ^ Израиль, Роберт Б. (декабрь 1981 г.). «Сильным игрокам не обязательно выигрывать больше турниров на выбывание». Журнал Американской статистической ассоциации . 76 (376): 950–951. дои : 10.2307/2287594 . ISSN 0162-1459 . JSTOR 2287594 .
- ^ Чен, Роберт; Хван, ФК (декабрь 1988 г.). «Сильнее игроки выигрывают более сбалансированные турниры на выбывание». Графы и комбинаторика . 4 (1): 95–99. дои : 10.1007/bf01864157 . ISSN 0911-0119 . S2CID 44602228 .
- ^ Адлер, Илан; Цао, Ян; Карп, Ричард; Пекёз, Эрол А.; Росс, Шелдон М. (декабрь 2017 г.). «Турниры со случайным выбыванием». Исследование операций . 65 (6): 1589–1596. arXiv : 1612.04448 . дои : 10.1287/opre.2017.1657 . ISSN 0030-364X . S2CID 1041539 .
- ^ Сен, Амартия (январь 1977 г.). «Теория социального выбора: пересмотр». Эконометрика . 45 (1): 53–89. дои : 10.2307/1913287 . ISSN 0012-9682 . JSTOR 1913287 .
- ^ Блаватская, Павел Р. (2007). Теорема стохастической полезности . Инст. за эмпирические исследования в экономике. OCLC 255736997 .
- ^ Дагсвик, Джон К. (октябрь 2015 г.). «Стохастические модели рискованного выбора: сравнение различных аксиоматизаций». Журнал математической экономики . 60 : 81–88. дои : 10.1016/j.jmateco.2015.06.013 . ISSN 0304-4068 .
- ^ Йеллотт, Джон И. (апрель 1977 г.). «Взаимосвязь между аксиомой выбора Люси, теорией сравнительного суждения Терстона и двойным экспоненциальным распределением» . Журнал математической психологии . 15 (2): 109–144. дои : 10.1016/0022-2496(77)90026-8 . ISSN 0022-2496 .
- ^ Роквелл, Кристина; Йеллотт, Джон И. (февраль 1979 г.). «Примечание об эквивалентных моделях Thurstone» . Журнал математической психологии . 19 (1): 65–71. дои : 10.1016/0022-2496(79)90006-3 . ISSN 0022-2496 .
- ^ деКани, Джон С. (декабрь 1969 г.). «Рейтинг парных сравнений максимального правдоподобия с помощью линейного программирования». Биометрика . 56 (3): 537–545. дои : 10.2307/2334661 . ISSN 0006-3444 . JSTOR 2334661 .