ЭЛО РЕЙТИНГА СИСТЕМА

Эло [ А ] Рейтинговая система -это метод для расчета относительных уровней игроков в играх с нулевой суммой, таких как шахматы или киберспорт . Он назван в честь своего создателя Арпада Эло , венгерско-американского профессора физики.
Система ELO была изобретена в качестве улучшенной системы шахматной оценки по сравнению с ранее использованной системой Harkness , [ 1 ] но также используется в качестве рейтинговой системы в ассоциативном футболе (футбол) , американский футбол , бейсбол , баскетбол , бассейн , различные настольные игры и киберспортивные составы , а в последнее время, большие языковые модели .
Разница в рейтингах между двумя игроками служит предиктором результата матча. Ожидается, что два игрока с равными рейтингами, которые играют друг против друга, будут набрать равное количество побед. Игрок, чей рейтинг на 100 очков больше, чем ожидается, что их противник набрал 64%; Если разница составляет 200 баллов, то ожидаемый балл для более сильного игрока составляет 76%. [ 2 ]
Рейтинг ELO игрока - это число, которое может измениться в зависимости от результата сыгранных игр. После каждой игры победивший игрок принимает очки от проигрыша. Разница между рейтингами победителя и проигравшим определяет общее количество полученных или потерянных очков после игры. Если игрок с более высоким рейтингом выигрывает, то у игрока с более низким рейтингом будет взято лишь несколько рейтинговых точек. Однако, если игрок с более низким рейтингом оценивает расстроенную победу , многие рейтинговые очки будут переданы. Игрок с более низким рейтингом также получит несколько очков от игрока с более высоким рейтингом в случае розыгрыша. Это означает, что эта система рейтинга является самокорректирующей. Игроки, чьи рейтинги слишком низки или слишком высоки, должны в долгосрочной перспективе, будут лучше или хуже соответственно, чем предсказывает система рейтинга, и, таким образом, получить или потерять рейтинговые точки, пока рейтинги не отражают их истинную силу игры.
Рейтинги ELO являются сравнительными только и являются действительными только в рамках бассейна, в котором они были рассчитаны, а не являются абсолютной мерой силы игрока.
В то время как ELO-подобные системы широко используются в настройках с двумя игроками, вариации также были применены к многопользовательским соревнованиям. [ 3 ]
История
[ редактировать ]Arpad Elo был мастером шахмат и активным участником Шахматной федерации США (USCF) из своего основания в 1939 году. [ 4 ] USCF использовала систему численных рейтингов, разработанную Кеннетом Харкнессом, чтобы позволить участникам отслеживать свой индивидуальный прогресс в терминах, кроме побед и потерь турнира. Система Harkness была достаточно справедливой, но в некоторых обстоятельствах приводили к рейтингам, которые многие наблюдатели считали неточными.
От имени USCF ELO разработала новую систему с более звуковой [ нужно разъяснения ] статистическая основа. [ 5 ] Примерно в то же время Гирги Кароли и Роджер Кук независимо разработали систему, основанную на тех же принципах для Ассоциации шахмат Нового Южного Уэльса. [ 6 ]
Система ELO заменила более ранние системы конкурентных вознаграждений системой, основанной на статистической оценке. Системы рейтинга для многих спортивных баллов в соответствии с субъективными оценками «величия» определенных достижений. Например, выиграть важный турнир по гольфу может стоить произвольно выбранного в пять раз больше очков, чем выиграть меньший турнир.
Статистическое усилие, напротив, использует модель, которая связывает результаты игры с основными переменными, представляющими способность каждого игрока.
Центральным предположением ELO было то, что шахматная производительность каждого игрока в каждой игре является обычно распределенной случайной величиной . Хотя игрок может работать значительно лучше или хуже от одной игры к другой, Эло предположил, что средняя ценность выступлений любого данного игрока меняется только медленно с течением времени. Эло подумал о истинном навыке игрока как о средней случайной переменной производительности этого игрока.
Дальнейшее предположение необходимо, потому что характеристики шахмат в вышеупомянутом смысле все еще не измеримы. Нельзя смотреть на последовательность движений и получить число, чтобы представлять умение этого игрока. Производительность может быть выведена только из побед, рисунков и убытков. Поэтому, как предполагается, игрок, который выигрывает игру, выступил на более высоком уровне, чем противник для этой игры. И наоборот, предполагается, что проигравший игрок выступил на более низком уровне. Если игра заканчивается ничьей, предполагается, что два игрока выступили почти на одном уровне.
ELO не указал, насколько близко должны быть два выступления, чтобы привести к ничьей, а не к победе или потере. На самом деле, существует вероятность ничьей, которая зависит от дифференциала производительности, поэтому этот последний является скорее доверительным интервалом, чем любой детерминированной границей. И хотя он думал, что вероятно, что игроки могут иметь разные стандартные отклонения от их выступлений, он сделал упрощенное предположение об обратном.
Чтобы еще больше упростить вычисления, Эло предложил простой метод оценки переменных в своей модели (т.е. истинный навык каждого игрока). Можно было бы относительно легко рассчитывать из таблиц, сколько игр игроков ожидается выиграть, исходя из сравнения своих рейтингов с оценками своих противников. Рейтинги игрока, который выиграл больше игр, чем ожидалось, будут скорректированы вверх, в то время как оценки игрока, который выиграл меньше, чем ожидалось, будут скорректированы вниз. Более того, эта корректировка должна была быть линейной пропорцией к количеству побед, по которым игрок превышал или не упал до их ожидаемого числа. [ 7 ]
С современной точки зрения, упрощающие предположения ELO не являются необходимыми, потому что вычислительная мощность недорогая и широко доступная. Несколько человек, особенно Марк Гликман , предложили использовать более сложный статистический механизм для оценки тех же переменных. С другой стороны, вычислительная простота системы ELO оказалась одним из ее величайших активов. С помощью карманного калькулятора информированный шахматный конкурент может рассчитывать до одного пункта, каким будет их следующее официально опубликованное рейтинг, что помогает способствовать восприятию, что рейтинги справедливо.
Реализация схемы Эло
[ редактировать ]USCF внедрил предложения ELO в 1960 году, [ 8 ] И система быстро получила признание как более справедливую и более точную, чем система рейтинга Harkness . Система Эло была принята Всемирной федерацией шахмат (FIDE) в 1970 году. [ 9 ] Эло подробно описал свою работу в рейтинге шахматных игроков, прошлых и настоящих , впервые опубликованных в 1978 году. [ 10 ]
Последующие статистические тесты показали, что шахматная производительность почти наверняка не распределена как нормальное распределение , поскольку более слабые игроки имеют больше шансов на победу, чем прогнозирует модель Эло. [ 11 ] [ 12 ] В парных данных сравнения часто существует очень небольшая практическая разница в том, предполагается ли предположение, что различия в сильных сторонах игроков обычно или логистически распределены. Математически, однако, логистическая функция более удобна для работы, чем с нормальным распределением. [ 13 ] Fide продолжает использовать таблицу различий в рейтингах, как предложено ELO. [ 14 ] : Таблица 8.1B
Разработка таблицы процентной ожидаемой продолжительности (таблица 2.11) более подробно описана ELO следующим образом: [ 15 ]
Нормальные вероятности могут быть взяты непосредственно из стандарта таблицы областей под нормальной кривой, когда разница в рейтинге Выражается как AZ Score. Поскольку стандартное отклонение σ индивидуальных Выступления определяются как 200 баллов, стандартное отклонение σ ' Различия в результатах становятся σ√2 или 282.84. Значение z Разница тогда D / 282,84 . Это затем разделяет область под кривая в две части, чем больше, давая p для игрока с более высоким рейтингом и меньше дает P для нижнего рейтингового игрока.
Например, пусть D = 160 . Тогда z = 160 / 282,84 = .566 . Таблица дает 0,7143 и .2857 как области двух частей под кривой. Эти вероятности округлены до двух фигур в таблице 2.11.
Таблица фактически построена со стандартным отклонением 200 (10/7) в качестве приближения для 200ов . [ Цитация необходима ]
Нормальные и логистические распределения, в некотором смысле, являются произвольными точками в спектре распределений, которые будут работать хорошо. На практике оба этих распределения очень хорошо работают для ряда разных игр. [ Цитация необходима ]
Разные оценки систем
[ редактировать ]Фраза «рейтинг ELO» часто используется для значения шахматного рейтинга игрока, рассчитанного FIDE. Однако это использование может быть запутанным или вводящим в заблуждение, поскольку общие идеи ELO были приняты многими организациями, в том числе USCF (до FIDE), многие другие национальные федерации шахмат, недолговечную профессиональную ассоциацию шахмат (PCA) и онлайн-серверы, включая серверы, включая серверы, включая серверы, включая серверы, включая серверы, включая шахматные серверы онлайн Интернет -шахматный клуб (ICC), бесплатный интернет -шахматный сервер (FICS), Lichess , Chess.com и Yahoo! Игры Каждая организация имеет уникальную реализацию, и ни одна из них не следует точно точно.
Вместо этого можно обратиться к организации, предоставляющей рейтинг. Например: «По состоянию на апрель 2018 года у Татева Абрахамяна был рейтинг FIDE 2366 и рейтинг USCF 2473 года». Рейтинги ELO этих различных организаций не всегда напрямую сопоставимы, поскольку рейтинги ELO измеряют результаты в закрытом пуле игроков, а не абсолютных навыков.
Фиде
[ редактировать ]Для лучших игроков наиболее важным рейтингом является их рейтинг Fide . Fide выпустила следующие списки:
- С 1971 по 1980 год был выпущен один список в год.
- С 1981 по 2000 год были выпущены два списка в год в январе и июле.
- С июля 2000 года по июль 2009 года было выпущено четыре списка в год в начале января, апреля, июля и октября.
- С июля 2009 года по июль 2012 года в начале января, марта, май, июля, сентябрь и ноября было выпущено шесть списков в год.
- С июля 2012 года список обновляется ежемесячно.
Следующий анализ списка рейтинга Fide 2015 года дает грубое впечатление о том, что означает данный рейтинг Fide с точки зрения мирового ранжирования:
- 5323 игроков имели активный рейтинг в диапазоне от 2200 до 2299, что обычно связано с титулом «Кандидат» .
- 2869 игроков имели активный рейтинг в диапазоне от 2300 до 2399, что обычно связано с титулом Fide Master .
- 1420 игроков имели активный рейтинг между 2400 и 2499, большинство из которых имели либо международный мастер , либо международный титул гранда .
- 542 игрока имели активный рейтинг от 2500 до 2599, большинство из которых имели титул международного гроссмейстера .
- 187 игроков имели активный рейтинг между 2600 и 2699, у всех из которых был титул международного гроссмейстера .
- 40 игроков имели активный рейтинг между 2700 и 2799.
- 4 игрока имели активный рейтинг более 2800 ( Магнус Карлсен был оценен 2853, а 3 игрока были оценены между 2814 и 2816).
Самый высокий за всю историю рейтинг был 2882, который Магнус Карлсен имел в списке мая 2014 года. Список игроков с самым высоким рейтингом когда-либо сравнивает лучших шахматистов на протяжении всей истории .
Рейтинг производительности
[ редактировать ]1.00 | +800 |
0.99 | +677 |
0.9 | +366 |
0.8 | +240 |
0.7 | +149 |
0.6 | +72 |
0.5 | 0 |
0.4 | −72 |
0.3 | −149 |
0.2 | −240 |
0.1 | −366 |
0.01 | −677 |
0.00 | −800 |
Рейтинг производительности или специальный рейтинг - это гипотетический рейтинг, который будет результатом игр только одного события. Некоторые шахматные организации [ 16 ] : p. 8 Используйте «Алгоритм 400» для расчета рейтинга производительности. Согласно этому алгоритму, рейтинг производительности для события рассчитывается следующим образом:
- Для каждой победы добавьте рейтинг противника плюс 400,
- Для каждой потери добавьте рейтинг противника минус 400,
- И разделите эту сумму на количество игр.
Пример: 2 победы (противники W & X ), 2 поражения (противники Y & Z )
Это может быть выражено следующей формулой:
Пример: если вы победили игрока с рейтингом ELO 1000,
Если вы победите двух игроков с рейтингами ELO 1000,
Если вы нарисуете,
Это упрощение, но он предлагает простой способ получить оценку PR (рейтинг производительности).
Фиде , однако, вычисляет рейтинг производительности с помощью формулы Где "разница в рейтингах" основан на процентном результате турнира игрока , который затем используется в качестве ключа в таблице поиска, где это просто количество набранных очков, разделенных на количество играющих игр. Обратите внимание, что в случае идеального или нет счета 800.
Живые рейтинги
[ редактировать ]Fide обновляет свой список рейтингов в начале каждого месяца. Напротив, неофициальные «живые рейтинги» вычисляют изменение рейтингов игроков после каждой игры. Эти живые рейтинги основаны на ранее опубликованных рейтингах FIDE, поэтому живой рейтинг игрока предназначен для соответствия каким будет рейтинг FIDE, если FIDE выпустит новый список в тот день.
Хотя живые рейтинги неофициальны, в августе/сентябре 2008 года интерес возник интерес, когда пять разных игроков поступили в рейтинг «живой» № 1. [ 17 ]
Неофициальные живые рейтинги игроков старше 2700 были опубликованы и поддерживались Hans Arild Runde на веб -сайте Live Rating до августа 2011 года. Другой веб -сайт, 2700Chess.com , поддерживается с мая 2011 года Artiom Tsepotan , который также охватывает 100 лучших игроков. Как 50 лучших женщин -игроков.
Изменения рейтинга могут быть рассчитаны вручную с помощью калькулятора Fide Ratings. [ 18 ] Все лучшие игроки имеют K-фактор 10, что означает, что максимальное изменение рейтингов с одной игры составляет чуть менее 10 очков.
Рейтинги шахматной федерации США
[ редактировать ]( Шахматная федерация США USCF) использует свою собственную классификацию игроков: [ 19 ]
- 2400 и выше: старший мастер
- 2200–2399: национальный мастер
- 2200–2399 плюс 300 игр выше 2200: оригинальный мастер жизни [ 20 ]
- 2000–2199: эксперт или кандидат
- 1800–1999: класс а
- 1600–1799: класс б
- 1400–1599: класс с
- 1200–1399: класс d
- 1000–1199: класс E.
- 800–999: класс ф
- 600–799: класс G.
- 400–599: класс H.
- 200–399: класс i
- 100–199: класс J.
K-фактор, используемый USCF
[ редактировать ]K -фактор , в системе рейтинга USCF, можно оценить, разделяя 800 на эффективное количество игр, в которых рейтинг игрока основан на ( N E ) плюс количество игр, которые игрок завершил в турнире ( M ). [ 21 ]
Рейтинговые полы
[ редактировать ]USCF сохраняет абсолютный рейтинг пола 100 для всех рейтингов. Таким образом, ни один участник не может иметь рейтинг ниже 100, независимо от их выступления на санкционированных USCF событиях. Тем не менее, игроки могут иметь более высокие индивидуальные абсолютные рейтинговые этажи, рассчитанные с использованием следующей формулы:
где это количество выигранных рейтинговых игр, это количество рейтинговых игр, и это количество событий, в которых игрок завершил три или более рейтинговых игр.
Существуют более высокие рейтинговые этажи для опытных игроков, которые достигли значительных рейтингов. Такие более высокие рейтинговые этажи существуют, начиная с рейтингов 1200 с приращением 100 пунктов до 2100 (1200, 1300, 1400, ..., 2100). Рейтинговый этаж рассчитывается путем приема пикового рейтинга игрока, вычитая 200 очков, а затем вниз до ближайшего рейтингового этажа. Например, игрок, который достиг пикового рейтинга 1464 года, будет иметь рейтинг 1464 - 200 = 1264 , который будет окружен до 1200. В соответствии с этой схемой только игроки класса C и выше способны иметь более высокий рейтинг Пол, чем их абсолютный рейтинг игроков. У всех других игроков будет этаж не более 150.
Есть два способа достижения более высоких рейтинговых этажей, кроме как по стандартной схеме, представленной выше. Если игрок достиг рейтинга оригинального мастера жизни, их рейтинг пол установлен на 2200. Достижение этого названия уникально, поскольку ни один другой признанный название USCF не приведет к новому этажу. Для игроков с рейтингами ниже 2000 года, выиграв денежный приз в размере 2000 долларов или более, повышает рейтинговый этаж игрока до ближайшего уровня на 100 очков, который лишил бы игрока для участия в турнире. Например, если игрок выиграл 4000 долларов в турнире 1750 и под судом, у него теперь будет рейтинговый этаж 1800 года.
Теория
[ редактировать ]Парные сравнения составляют основу методологии рейтинга ELO. [ 22 ] Эло сделал ссылки на документы добрых [ 23 ] Дэйвид, [ 24 ] Травински и Дэвид, [ 25 ] и Булман и Хубер. [ 26 ]
Математические детали
[ редактировать ]Производительность не измеряется абсолютно; Это выводится из побед, потерь и вытягивает против других игроков. Рейтинги игроков зависят от рейтингов их противников и результатов, забитых против них. Разница в рейтинге между двумя игроками определяет оценку ожидаемой оценки между ними. Как среднее, так и распространение рейтингов могут быть произвольно выбраны. Первоначально USCF стремился к среднему клубному игроку иметь рейтинг 1500, а ELO предложил рейтинги масштабирования, так что разница в 200 точках оценки в шахматах означала, что более сильный игрок имеет ожидаемый балл приблизительно 0,75.
игрока Ожидаемая оценка - это вероятность победы плюс половина их вероятности рисования. Таким образом, ожидаемый балл в 0,75 может представлять собой 75% -ную вероятность победы, 25% вероятности проигрыша и 0% вероятности рисования. С другой стороны, он может представлять 50% шанс на победу, 0% вероятность проиграть и 50% вероятность рисования. Вероятность рисования, в отличие от получения решающего результата, не указана в системе ELO. Вместо этого ничья считается половиной победы и половины проигрыша. На практике, поскольку истинная сила каждого игрока неизвестна, ожидаемые оценки рассчитываются с использованием текущих рейтингов игрока следующим образом.
Если игрок А имеет рейтинг И игрок B рейтинг , точная формула (используя логистическую кривую с базой 10 ) [ 27 ] ожидаемого результата игрока А Для
Точно так же ожидаемый счет для B игрока
Это также может быть выражено
и
где и Обратите внимание, что в последнем случае один и тот же знаменатель применяется к обоим выражениям, и ясно, что Это означает, что, изучая только числители, мы обнаруживаем, что ожидаемый счет для игрока А - это Время ожидаемой оценки для игрока б . Из этого следует, что для каждого 400 рейтинговых точек преимущества по сравнению с противником ожидаемый балл увеличивается в десять раз по сравнению с ожидаемой оценкой противника.
Когда фактические результаты турнира игрока превышают их ожидаемые оценки, система ELO считает это доказательством того, что рейтинг игрока слишком низкий, и ее необходимо скорректировать вверх. Точно так же, когда фактические результаты турнира игрока не соответствуют ожидаемым результатам, рейтинг этого игрока регулируется вниз. Первоначальное предложение ELO, которое до сих пор широко используется, было простой линейной корректировкой, пропорциональной сумме, на которую игрок чрезмерно выполнил или недооценил их ожидаемый балл. Максимально возможная корректировка на игру, называемую K-фактором, была установлена на для мастеров и Для более слабых игроков.
Предположим, игрок А (снова с рейтингом ) ожидалось, что забит очки, но на самом деле забил точки Формула для обновления рейтинга этого игрока -
Это обновление может быть выполнено после каждой игры или каждого турнира или после любого подходящего периода оценки.
Пример может помочь уточнить:
Предположим, что игрок A имеет рейтинг 1613 и играет в турнире из пяти раундов. Они проигрывают игроку, рейтинг 1609, рисуют с рейтингом игрока 1477, победить игрока с рейтингом 1388, победить игрока с рейтингом 1586 и проиграть игроку, рейтинг 1720. Фактический счет игрока (0 + 0,5 + 1 + 1 + 0 ) = 2,5 . Ожидаемый балл, рассчитанная в соответствии с вышеупомянутой формулой, составляла (0,51 + 0,69 + 0,79 + 0,54 + 0,35) = 2,88 .
Следовательно, новый рейтинг игрока составляет [1613 + 32 · (2,5 -2,88)] = 1601 , предполагая, что k используется -фактор 32. Эквивалентно, каждая игра, которую игрок, можно сказать, вкладывала в кастрюлю в кастрюлю, противостоящий игрок, и победитель собирает полный горшок стоимости k ; В случае ничьей игроки разделили горшок и получают точки каждый.
Обратите внимание, что в то время как две победы, две потери и одна ничья может показаться оценкой PAR, это хуже, чем ожидалось для игрока A , потому что их противники были в среднем ниже. Следовательно, игрок А слегка оштрафован. Если бы игрок А забил две победы, одну проигрыш и две ничьи, на общий балл в три очка, это было бы немного лучше, чем ожидалось, и новый рейтинг игрока был бы [1613 + 32 · (3 - 2,88) ] = 1617 .
Эта процедура обновления лежит в основе рейтингов, используемых FIDE , USCF , Yahoo! Игры , интернет -шахматный клуб (ICC) и бесплатный интернет -шахматный сервер (FICS). Тем не менее, каждая организация придерживалась другого подхода к работе с неопределенностью, присущей рейтингам, в частности, оценки новичков, а также к решению проблемы инфляции/дефляции рейтингов. Новым игрокам присваиваются предварительные оценки, которые скорректируются более радикально, чем установленные рейтинги.
Принципы, используемые в этих системах рейтинга, могут использоваться для оценки других соревнований - например, международных футбольных матчей.
Рейтинги ELO также были применены к играм без возможности розыгрышей , и к играм, в которых результат также может иметь количество (малая/большая маржа) в дополнение к качеству (победа/проигрыш). Смотрите рейтинг Go с ELO для большего.
Предлагаемая модификация
[ редактировать ]В 2011 году, проанализировав 1,5 миллиона игр с рейтингом FIDE, Джефф Сонас продемонстрировал, согласно формуле ELO, два игрока, имеющие разницу в рейтингах, на самом деле имеют истинную разницу примерно X (5/6) . Аналогичным образом, можно оставить разницу в рейтинге в покое и разделить на 480 вместо 400. Поскольку формула ELO переоценивает вероятность победы более сильного игрока, более сильные игроки теряют очки против более слабых игроков, несмотря на игра в их истинной силе. Кроме того, более слабые игроки набирают очки против более сильных игроков. Когда модификация применяется, наблюдаемые показатели победы отклоняются менее чем на 0,1% от прогнозирования, в то время как традиционный ELO может составлять 4% от прогнозируемой скорости. [ 28 ]
Наиболее точная модель распределения
[ редактировать ]Первой математической проблемой, рассмотренной USCF, было использование нормального распределения . Они обнаружили, что это не точно отражало достигнутые результаты, особенно игроками с более низким рейтингом. Вместо этого они переключились на модель логистического распределения , которую обнаружил USCF, обеспечил лучшее соответствие для фактических достигнутых результатов. [ 29 ] [ Цитация необходима ] Fide также использует приближение к логистическому распределению. [ 14 ]
Самый точный K-фактор
[ редактировать ]Вторая серьезная проблема -это правильный « k -фактор». Шахматный статистик Джефф Сонас считает, что оригинал Стоимость (для игроков, оцененных выше 2400), неточна в работе ELO. Если коэффициент k -фактора устанавливается слишком большим, будет слишком много чувствительности только к нескольким недавним событиям, с точки зрения большого количества очков, обмениваемых в каждой игре. И если k-значение слишком низкое, чувствительность будет минимальной, и система не будет реагировать достаточно быстро на изменения фактического уровня производительности игрока.
-фактора ELO Первоначальная оценка K была сделана без пользы огромных баз данных и статистических данных. Sonas указывает, что K -фактор 24 (для игроков, оцененных выше 2400), может быть более точным в качестве прогнозирующего инструмента будущей производительности и быть более чувствительным к производительности. [ 30 ]
Некоторые интернет-шахматные сайты, похоже, избегают трехуровневого K-фактора, ошеломляющего на основе диапазона рейтинга. Например, ICC, похоже, принимает глобальный K = 32, за исключением случаев, когда играет против временно оцененных игроков.
USCF (который использует логистическое распределение , в отличие от нормального распределения ) ранее ошеломлял K-фактор в соответствии с тремя основными рейтингами:
K -фактор Используется для игроков с рейтингами ... ниже 2100 между 2100 и 2400 выше 2400
В настоящее время USCF использует формулу, которая рассчитывает K -фактор на основе факторов, включая количество играющих игр и рейтинг игрока. K-фактор также уменьшается для игроков с высоким рейтингом, если событие имеет более короткий контроль времени. [ 16 ]
Fide использует следующие диапазоны: [ 31 ]
K -фактор Используется для игроков с рейтингами ... Для игрока, нового в списке рейтингов до завершения событий с 30 играми, и для всех игроков до их 18 -летия, до тех пор, пока их рейтинг остается ниже 2300. Для игроков, которые всегда были оценены до 2400. Для игроков с любым опубликованным рейтингом не менее 2400 и не менее 30 игр, сыгранных на предыдущих мероприятиях. После этого он остается навсегда в 10.
Фиде использовал следующие диапазоны до июля 2014 года: [ 32 ]
K -фактор Используется для игроков с рейтингами ...
(было 25)Для игрока, нового в списке рейтинга до завершения событий с 30 играми. [ 33 ] Для игроков, которые всегда были оценены до 2400. Для игроков с любым опубликованным рейтингом не менее 2400 и не менее 30 игр, сыгранных на предыдущих мероприятиях. После этого он остается навсегда в 10.
Градация K -фактора уменьшает изменение рейтинга в верхнем конце диапазона рейтинга, снижая возможность быстрого повышения или падения рейтинга для тех, у кого достаточно высокий рейтинг, чтобы достичь низкого K -фактора.
Теоретически, это может в равной степени применить к онлайн-шахматам и игрокам, работающих на борту, поскольку всем игрокам все труднее повысить свой рейтинг после того, как их рейтинг стал высоким, а их K -фактор уменьшился. Однако, играя в Интернете, 2800+ игроков могут легче повысить свой рейтинг, просто выбрав противников с высокими оценками - на сайте ICC Grandmaster может сыграть ряд разных противников, которые оценили более 2700. [ 34 ] В чрезвычайных мероприятиях это будет только в очень высоких уровнях, которые игрок сможет задействовать это число 2700 противников. В обычном открытом швейцарском шахматном турнире часто будет много соперников, оцененных менее 2500, что снижает выгодные оценки, возможные из одного конкурса для игрока с высоким рейтингом.
Формальный вывод для игр побед/проигрыш
[ редактировать ]Вышеуказанные выражения теперь могут быть официально получены путем использования связи между рейтингом ELO и обновлением стохастического градиента в логистической регрессии. [ 35 ] [ 36 ]
Если мы предположим, что результаты игры являются двоичными , то есть только победа или потеря, проблема может быть решена с помощью логистической регрессии , где результаты игр являются зависимыми переменными , рейтинги игроков являются независимыми переменными , а также Модель, связанная с обоими, вероятностная: вероятность игрока Победа в игре смоделирована как
где
Обозначает разницу в рейтингах игроков, и мы используем коэффициент масштабирования и по закону общей вероятности
Потеря журнала затем рассчитывается как
и, используя стохастический градиент спуск, потеря журнала минимизируется следующим образом:
- ,
- .
где это шаг адаптации.
С , , и , адаптация написана следующим образом
который может быть компактно написан как
где это новый шаг адаптации, который поглощает и , если выигрывает и если выигрывает, и ожидаемый счет дается .
Аналогично, обновление для рейтинга является
- .
Формальный вывод для игр побед/розыгрыш/проигрыш
[ редактировать ]С самого начала рейтинг ELO также использовался в шахматах, где мы наблюдаем победа, потери или рисунки и, чтобы иметь дело с последним значением дробного балла, , введен. Мы отмечаем, однако, что результаты и являются просто показателями событий, когда игрок выигрывает или проигрывает игру. Следовательно, это не сразу ясно, в чем смысл фракционной оценки. Более того, поскольку мы не указываем явно модель, относящуюся к значениям рейтинга и К вероятности результата игры мы не можем сказать, какова вероятность победы, проигрыша или ничья.
Чтобы решить эти трудности и получить рейтинг ELO в тройных играх, мы определим явную вероятностную модель результатов. Далее мы сведем к минимуму потерю журнала с помощью стохастического градиента.
Поскольку потеря, ничья и победа являются порядковыми переменными , мы должны принять модель, которая учитывает их порядковой характер, и мы используем так называемую модель смежных категорий, которая может быть отслежена до работы Дэвидсона [ 37 ]
где
и это параметр. Введение свободного параметра не должно быть удивлением, поскольку у нас есть три возможных результата, и, таким образом, в модели должна появляться дополнительная степень свободы. В частности, с Мы восстанавливаем модель, лежащую в основе логистической регрессии
где .
Использование порядковой модели, определенной выше, потеря журнала теперь рассчитывается как
который может быть компактно написан как
где IFF выигрывает, IFF выигрывает, и IFF вытягивает.
Как и прежде, нам нужна производная который дается
- ,
где
Таким образом, производная потери журнала по отношению к рейтингу дано
где мы использовали отношения и .
Затем применен стохастический градиент спуск для минимизации потери журнала дает следующее обновление для рейтинга
где и Полем Конечно, если выигрывает, если рисует, и если проигрывает. Чтобы распознать происхождение в модели, предложенной Дэвидсоном, это обновление называется рейтингом Эло-Давидсона. [ 36 ]
Обновление для получено так же, как и
- ,
где .
Мы отмечаем, что
и, таким образом, мы получаем обновление рейтинга может быть написано как
- ,
где и мы получили практически то же уравнение, что и в рейтинге ELO, за исключением того, что ожидаемый балл определяется вместо .
Конечно, как отмечалось выше, для , у нас есть И, таким образом, рейтинг Elo-Davidson точно такой же, как и рейтинг ELO. Тем не менее, это не помогает понять случай, когда наблюдаются розыгрыш (мы не можем использовать что будет означать, что вероятность розыгрыша равна нулю). С другой стороны, если мы используем , у нас есть
что означает, что, используя , рейтинг Elo-Davidson точно такой же, как и рейтинг ELO. [ 36 ]
Практические проблемы
[ редактировать ]Игровая активность в зависимости от защиты своего рейтинга
[ редактировать ]В некоторых случаях система рейтинга может препятствовать игровой деятельности для игроков, которые хотят защитить свой рейтинг. [ 38 ] Чтобы отговорить игроков от сидения на высоком рейтинге, предложение британского гроссмейстера 2012 года Джона Нанна о выборе отборочных на чемпионате мира по шахматию включало бонус за деятельность, который должен сочетаться с рейтингом. [ 39 ]
Помимо шахматного мира, опасения по поводу игроков, избегающих конкурентных игр, чтобы защитить их рейтинги, заставили Волшебников побережья отказаться от системы ELO для магии: турниры по сбору в пользу системы их собственного разработки под названием «Planeswalker Points». [ 40 ] [ 41 ]
Селективное сочетание
[ редактировать ]Более тонкая проблема связана с сопряжением. Когда игроки могут выбрать своих собственных противников, они могут выбрать противников с минимальным риском проигрыша и максимальной наградой за победу. Особые примеры игроков оценили 2800+ выбора противников с минимальным риском и максимальной возможностью прибыли от рейтинга, включают в себя: выбор противников, которые, как они знают, они могут победить с определенной стратегией; Выбор противников, которые, по их мнению, переоценены; Или избегать игры сильных игроков, которые имеют оценку на несколько сотен очков ниже, но могут содержать шахматные титулы, такие как IM или GM. В категории выбора переоцененных оппонентов новые участники системы рейтинга, которые сыграли менее 50 игр, теоретически являются удобной целью, так как они могут быть переоценены в своем предварительном рейтинге. ICC компенсирует эту проблему, назначив более низкий K-фактор для известного игрока, если они выиграют против нового участника рейтинга. K-фактор на самом деле является функцией количества рейтинговых игр, сыгранных новым участником.
Таким образом, рейтинги ELO онлайн по -прежнему обеспечивают полезный механизм для обеспечения рейтинга, основанного на рейтинге противника. Однако его общий авторитет должен быть замечен в контексте, по крайней мере, двух вышеупомянутых описанных вопросов - злоупотребления инженером и селективное сочетание противников.
ICC также недавно ввел рейтинги «Автопапления», которые основаны на случайных парах, но с каждой победой подряд гарантируют статистически гораздо более сложный противник, который также выиграл X Games подряд. С потенциально сотнями игроков, это создает некоторые проблемы крупного большого швейцарского события, которое яростно оспаривается, а победители раунда встретятся с победителями. Такой подход к спариванию, безусловно, максимизирует риск рейтинга участников с более высоким рейтингом, которые могут столкнуться с очень жесткой оппозицией со стороны игроков ниже 3000. Это отдельный рейтинг сам по себе, и находится под категориями «1 минута» и «5-минутных». Максимальные оценки, достигнутые более 2500, являются исключительно редкими.
Рейтинги инфляция и дефляция
[ редактировать ]
Термин «инфляция», применяемый к рейтингам, предназначен для того, чтобы предположить, что уровень игры игр, продемонстрированный номинальным игроком, уменьшается с течением времени; И наоборот, «дефляция» предполагает, что уровень продвигается. Например, если есть инфляция, современный рейтинг 2500 означает меньше, чем исторический рейтинг 2500, в то время как обратное, если есть дефляция. Использование рейтингов для сравнения игроков между разными эпохами становится все более трудным, когда присутствует инфляция или дефляция. (См. Также сравнение главных шахматистов на протяжении всей истории .)
Анализируя списки рейтинга Fide с течением времени, Джефф Сонас предполагает, что инфляция могла произойти с 1985 года. [ 42 ] Сонас смотрит на игроков с самым высоким рейтингом, а не на всех рейтинговых игроков, и признает, что изменения в распределении рейтингов могли быть вызваны увеличением стандарта игры на самых высоких уровнях, но также ищет другие причины.
Число людей с рейтингами более 2700 увеличилось. Примерно в 1979 году был только один активный игрок ( Anatoly Karpov ) с рейтингом настолько высокой. В 1992 году Вишванатан Ананд был лишь 8 -м игроком в истории шахмат, чтобы достичь отметки 2700 в тот момент. [ 43 ] Это увеличилось до 15 игроков к 1994 году. 33 игрока имели рейтинг 2700+ в 2009 году и 44 по состоянию на сентябрь 2012 года. Только 14 игроков когда -либо сокращали рейтинг 2800.
Одной из возможных причин этой инфляции был рейтинг, который в течение долгого времени была на 2200, и если игрок упал ниже этого, он был поражен из списка рейтинга. Как следствие, игроки на уровне квалификации чуть ниже пола были бы в списке рейтингов только в том случае, если они будут переоценены, и это заставит их подавать точки в бассейн рейтинга. [ 42 ] В июле 2000 года средний рейтинг из 100 лучших составил 2644. К июлю 2012 года он увеличился до 2703. [ 43 ]
Используя сильный шахматный двигатель для оценки ходов, сыгранных в играх между рейтинговыми игроками, Риган и Хаворт анализируют наборы игр из турниров с рейтингом FIDE, и сделать вывод о том, что с 1976 по 2009 год было мало или нет инфляции. [ 44 ]
В системе Pure ELO каждая игра заканчивается равной транзакцией оценок. Если победитель набирает носительские очки, проигравшие зайдут в N Rating Points. Это предотвращает въезд или покинув системы, когда игры играют и оценены. Тем не менее, игроки, как правило, входят в систему в качестве новичков с низким рейтингом и выходят из системы из системы как опытных игроков с высоким рейтингом. Следовательно, в долгосрочной перспективе система со строго равными транзакциями имеет тенденцию привести к оценок дефляции. [ 45 ]
В 1995 году USCF признал, что несколько молодых схоластических игроков улучшаются быстрее, чем система рейтинга смогла отслеживать. В результате известные игроки со стабильными рейтингами начали терять рейтинговые очки молодым и недооцененным игрокам. Некоторые из старших игроков были разочарованы тем, что они считали несправедливым снижением рейтинга, а некоторые даже бросили шахматы над этим. [ 46 ]
Борьба с дефляцией
[ редактировать ]Из -за значительной разницы в сроках, когда возникает инфляция и дефляция, и для борьбы с дефляцией большинство реализаций рейтингов ELO имеют механизм для точек введения в систему, чтобы поддерживать относительные рейтинги с течением времени. Фиде имеет два инфляционных механизмах. Во -первых, выступления под «рейтинговым полом» не отслеживаются, поэтому игрок с истинным навыком под полом может быть только безрассудным или переоцененным, никогда не оценивается. Во-вторых, устоявшиеся и более высокие рейтинги игроки имеют более низкий K-фактор. Новые игроки имеют K = 40 , который падает до K = 20 после 30 игр, и до k = 10, когда игрок достигает 2400. [ 31 ] Нынешняя система в Соединенных Штатах включает в себя схему бонусных точек, которая подает рейтинговые точки в систему, чтобы отслеживать улучшение игроков и различные значения K для разных игроков. [ 46 ] Некоторые методы, используемые в Норвегии, например, различаются между юниорами и пожилыми людьми, и используют более крупный K-фактор для молодых игроков, даже повышая прогресс в рейтинге на 100% за то, что они набрали значительно выше своей прогнозируемой производительности. [ 47 ]
Рейтинг этажи в Соединенных Штатах работают, гарантируя, что игрок никогда не упадет ниже определенного предела. Это также борется с дефляцией, но председатель Комитета по рейтингу USCF критиковал этот метод, потому что он не питает дополнительные точки улучшающимся игрокам. Возможным мотивом для этих рейтинговых этажей является борьба с мешками с песком, то есть преднамеренное снижение рейтингов, чтобы иметь право на участие в срезах и призах с более низким рейтингом. [ 46 ]
Рейтинги компьютеров
[ редактировать ]Шахматные матчи человека с 1997 годами ( Deep Blue против Гарри Каспарова ) и 2006 года продемонстрировали, что шахматные компьютеры способны победить даже самых сильных человеческих игроков. Тем не менее, рейтинги шахматных двигателей трудно определить из -за переменных факторов, таких как контроль времени и оборудование, на котором работает программа, а также того факта, что шахматы не являются честной игрой. Существование и величина преимущества первого движения в шахматах становится очень важным на компьютерном уровне. Помимо некоторого порога навыков, двигатель с белым должен быть в состоянии привлечь выгоду по требованию исходной позиции даже против идеальной игры, просто потому, что белые начинаются с слишком большого преимущества, чтобы потерять по сравнению с небольшой величиной ошибок, он, вероятно, будет делать. Следовательно, такой двигатель более или менее гарантированно набрал не менее 25% даже против идеальной игры. Различия в навыках за пределами определенной точки могут быть подхвачены только в том случае, если кто -то не начинается с обычной стартовой позиции, а выбирает исходную позицию, которая едва лишь не теряется для одной стороны. Из -за этих факторов рейтинги зависят от пар и отобранных отверстий. [ 48 ] Опубликованные списки рейтинга двигателей, такие как CCRL, основаны на играх только для двигателей на стандартных конфигурациях аппаратного обеспечения и не имеют прямого сравнения с рейтингами Fide.
Для некоторых оценок рейтингов см. § Шахматный двигатель .
Использование вне шахмат
[ редактировать ]Другие игры и карточные игры
[ редактировать ]- GO : Европейская федерация GO приняла систему рейтинга ELO, первоначально впервые представленную Федерацией Чешской GO.
- Нарговая дата : популярный первый интернет -сервер задних камер (FIB) вычисляет рейтинги на основе модифицированной системы ELO. Новым игрокам назначается рейтинг 1500, с рейтингом «Лучшие люди и боты» в 2000 году. Та же формула была принята несколькими другими местами навыки, такими как Play65 , Dailygammon , Goldtoken и Vogclub . Vogclub устанавливает рейтинг нового игрока в 1600. Британская федерация навыков использует формулу Fibs для своих национальных рейтингов в Великобритании. [ 49 ]
- Scrabble : Национальные организации Scrabble вычислили обычно распределенные рейтинги ELO, за исключением Великобритании , где используется другая система. Североамериканская ассоциация игроков Scrabble имеет наибольшую оценку населения активных членов, насчитывающая около 2000 человек по состоянию на начало 2011 года. Lexulous также использует систему ELO.
- Несмотря на вопросы о целесообразности использования системы ELO для оценки игр, в которых удача является фактором, производители игровых игр часто используют рейтинги ELO для своих организованных усилий по игре. DCI игр « (ранее Duelist's Convocation International) использовал рейтинги ELO для турниров магии: собрания и других Волшебники побережья» . Тем не менее, DCI отказался от этой системы в 2012 году в пользу новой кумулятивной системы «Planeswalker Points», в основном из-за вышеупомянутой обеспокоенности, которую ELO призывает игроков с высоким рейтингом избегать игры, чтобы «защищать свой рейтинг». [ 40 ] [ 41 ] Pokémon USA использует систему ELO, чтобы ранжировать свои организованные конкуренты TCG. [ 50 ] Призы для лучших игроков в разных регионах включали праздники и чемпионаты мира до сезона 2011–2012 годов, где награды были основаны на системе очков чемпионата, их обоснование совпадает с DCI за магию: собрание . Аналогичным образом, Decipher, Inc. использовала систему ELO для своих рейтинговых игр, таких как настраиваемая карточная игра Star Trek и настраиваемая карточная игра Star Wars .
Спортивные виды спорта
[ редактировать ]Система рейтинга ELO используется в шахматной части шахматного бокса . Чтобы иметь право на профессиональную шахматную бокс, необходимо иметь рейтинг ELO не менее 1600, а также участвовать в 50 или более матчах любительского бокса или боевых искусств.
Американский футбол в колледже использовал метод ELO в качестве части своих Championship Series систем рейтинга с 1998 по 2013 год , после чего BCS был заменен плей -офф футбола колледжа . Джефф Сагарин из USA Today публикует командные рейтинги для большинства американских видов спорта, который включает в себя рейтинги систем ELO для футбола в колледже. Использование рейтинговых систем было эффективно отказано от создания плей -офф футбола колледжа в 2014 году.
В других видах спорта люди поддерживают рейтинг на основе алгоритма ELO. Они обычно неофициальны, не одобряются руководящим органом спорта. Ratings World Football Elo является примером метода, применяемого к мужскому футболу . [ 51 ] В 2006 году рейтинги ELO были адаптированы для бейсбольных команд Высшей лиги Нейтом Сильвер , а затем бейсбольного проспекта . [ 52 ] на базе ELO Основываясь на этой адаптации, оба также сделали моделирование Монте-Карло о вероятности того, пройдут ли команды в плей-офф. [ 53 ] В 2014 году, Beyond the Box Score, сайт SB Nation , представил систему рейтинга ELO для международного бейсбола. [ 54 ]
В теннисе, базирующийся в ELO универсальный рейтинг тенниса (UTR) оценивает игроков в глобальном масштабе, независимо от возраста, пола или национальности. Это официальная система оценки крупных организаций, таких как Межвузовская теннисная ассоциация и мировой команды, и часто используется в сегментах на теннисном канале . Алгоритм анализирует более 8 миллионов результатов матчей более 800 000 теннисистов по всему миру. 8 мая 2018 года Рафаэль Надаль -выиграл 46 последовательных наборов в матчах по глиняным судам-имел почти идеальную глиняную UTR 16,42. [ 55 ]
В Pool система ELO, называемая Fargo, используется для ранжирования игроков в организованных любительских и профессиональных соревнованиях. [ 56 ]
Одним из немногих рейтингов ELO, одобренным руководящим органом спорта, является мировой рейтинг FIFA , основанный на упрощенной версии алгоритма ELO, который FIFA использует в качестве официальной системы рейтинга для национальных команд в женском футболе .
Из первого списка рейтинга после чемпионата мира по футболу 2018 года FIFA использовала ELO для своих мировых рейтингов FIFA . [ 57 ]
В 2015 году Нейт Сильвер, главный редактор веб-сайта статистического комментария FiveThirtyEight , и Reuben Fischer-Baum выпустили рейтинги ELO для каждой команды Национальной баскетбольной ассоциации и сезона до сезона 2014 года. [ 58 ] [ 59 ] В 2014 году FiveThirtyEight создал рейтинги и победы в Американской профессиональной национальной футбольной лиге . [ 60 ]
Английская ассоциация Korfball оценила команды, основанные на рейтингах ELO, чтобы определить гандикапы для их соревнований кубка в сезоне 2011/12.
рейтинг игроков Национальной хоккейной лиги . Был разработан [ 61 ] Метрика хоккея оценивает общую двустороннюю игру игрока: забивание и защита как в даже силовых, так и в ситуациях силовой игры/пенальти.
RugbyLeaGueratings.com использует систему рейтинга ELO для ранжирования международных и клубных команд регби .
Hemaratings.com был запущен в 2017 году и использует алгоритм Glicko-2 для ранжирования отдельных исторических европейских боевых искусств по всему миру в различных категориях, таких как длинное меч , Rapier , Historical Sabre и Swork & Buckler . [ 62 ]
Видеоигры и онлайн -игры
[ редактировать ]Многие видеоигры используют модифицированные системы ELO в конкурентном игровом процессе. использовала легенд MOBA Лига . систему рейтинга ELO до второго сезона конкурентной игры [ 63 ] Esports Overwatch Game , основа уникальной League Overwatch League профессиональной спортивной организации , использует производную системы ELO для оценки конкурентоспособных игроков с различными корректировками между конкурентными сезонами. [ 64 ] World of Warcraft также ранее использовал систему Glicko-2 Microsoft для объединения и сравнения игроков Arena, но теперь использует систему, аналогичную TrueSkill . [ 65 ] Puzzle Puzzle использует систему рейтинга ELO, чтобы определить турнирные таблицы в различных головоломках. Эта система также используется в FIFA Mobile для режимов конкурентов дивизиона. Еще одна недавняя игра, которая начнет использовать систему рейтинга ELO, - Airmech , используя ELO [ 66 ] Рейтинги для 1V1, 2V2 и 3V3 случайного/команды. Runescape 3 использовала систему ELO в релеазе мини -игры Hunty Hunter в 2016 году. [ 67 ] Mechwarrior Online создал систему ELO для своего нового режима "Compue Queue", эффективного с патчем 20 июня 2017 года. [ 68 ] Эпоха Империй II DE и Age of Empires III DE используют систему ELO для своего таблицы лидеров и сватов, а новые игроки начинаются в ELO 1000. [ 69 ] Конкурентный классический Tetris ( Tetris играл в Nintendo Entertainment System ) получает свои оценки, используя комбинацию личных лучших результатов игроков и высоко измененной системы ELO. [ 70 ]
Немногие видеоигры используют оригинальную систему рейтинга ELO. По словам Lichess , онлайн-шахматного сервера, система ELO устарела, и Glick-2 теперь используется многими шахматными организациями. [ 71 ] Battle Grathlounds Playerunknown - одна из немногих видеоигр, в которых используется самая первая система ELO. В гильдийских войнах рейтинги ELO используются для записи рейтинга гильдии, полученных и проигрывающих в результате сражений гильдий и гильд. В 1998 году лестница онлайн -игр под названием Clanbase [ 72 ] был запущен, которая использовала систему оценки ELO для ранжирования команд. Первоначальное значение k было 30, но было изменено на 5 в январе 2007 года, а затем изменилось на 15 в июле 2009 года. [ 73 ] Позже сайт вышел в автономном режиме в 2013 году. [ 74 ] Аналогичный альтернативный сайт был запущен в 2016 году под названием Scrimbase , [ 75 ] который также использовал систему оценки ELO для ранжирования команд. С 2005 года Golden Tee Live оценивает игроков на основе системы ELO. Новые игроки начинаются в 2100, и лучшие игроки оценивают более 3000. [ 76 ]
Несмотря на многие видеоигры, использующие различные системы для подразделения , игроки в рейтинге видеоигр называют все рейтинги состава как ELO .
Другое использование
[ редактировать ]Система рейтинга ELO использовалась в мягкой биометрии , [ 77 ] который касается идентификации людей, использующих человеческие описания. Сравнительные описания использовались вместе с системой рейтинга ELO для обеспечения надежных и дискриминационных «относительных измерений», что позволяет точную идентификацию.
Система рейтинга ELO также использовалась в биологии для оценки иерархий доминирования мужчин, [ 78 ] и в автоматизации и компьютерном зрении для проверки ткани . [ 79 ]
Более того, сайты онлайн -судьи также используют систему рейтинга ELO или ее производные. Например, Topcoder использует модифицированную версию на основе нормального распределения, [ 80 ] в то время как CodeForces использует другую версию на основе логистического распределения. [ 81 ] [ 82 ] [ 83 ]
Система рейтинга ELO также была отмечена в приложениях для знакомств, таких как в приложении Tinder , в котором используется вариант системы рейтинга ELO. [ 84 ]
YouTuber Marques Brownlee и его команда использовали систему рейтинга ELO, когда они позволяют людям голосовать между цифровыми фотографиями, сделанными с различными моделями смартфонов , запущенных в 2022 году. [ 85 ]
Система рейтинга ELO также использовалась в США, выявленные рейтинги в колледже , например, с цифровой учетной фирмой пергаментом. [ 86 ] [ 87 ] [ 88 ]
Система рейтинга ELO также была принята для оценки моделей ИИ. В 2021 году в своих исследованиях Anpropic использовала систему ELO для ранжирования моделей ИИ. [ 89 ] В таблице лидеров LMSYS кратко использовалась рейтинговая система ELO для ранжирования моделей искусственного интеллекта [ 90 ] Перед переходом на модель Брэдли -Терри . [ 91 ]
Ссылки в СМИ
[ редактировать ]Система рейтинга ELO была представлена в социальной сети во время сцены алгоритма, где Марк Цукерберг выпустил FaceMash . В сцене Эдуардо Саверин пишет математические формулы для системы рейтинга ELO в окне общежития Цукерберга. За кулисами, как утверждается в фильме, система ELO используется для ранжирования девочек по их привлекательности. Уравнения, управляющие алгоритмом, показаны кратко, написаны в окне; [ 92 ] Однако они немного неверны. [ Цитация необходима ]
Смотрите также
[ редактировать ]- Теперь черт
- Индекс процентного уровня рейтинга (RPI), другая система, которая включает в себя прочность противников
Примечания
[ редактировать ]- ^ Это написано как «elo», а не «elo», и обычно произносится как / ˈ iː l oʊ / или / ˈ ɛ l oʊ / на английском языке. Оригинальное имя élő произносится [ˈeːløː] в венгерском.
Ссылки
[ редактировать ]Примечания
[ редактировать ]- ^ Jump up to: а беременный Эло, Арпад Э. (август 1967 г.). «Предлагаемая система оценки USCF, ее разработка, теория и приложения» (PDF) . Шахматная жизнь . XXII (8): 242–247.
- ^ Использование формулы 100% / (1 + 10 - D /400 ) для D равен 100 или 200.
- ^ Elo-mmr: система рейтинга для массовых многопользовательских соревнований
- ^ Редман, Тим (июль 2002 г.). «Запоминание Ричарда, часть II» (PDF) . Иллинойс шахматный бюллетень. Архивировано (PDF) из оригинала 2020-06-30 . Получено 2020-06-30 .
- ^ Эло, Арпад Э. (5 марта 1960 г.). «Система рейтинга USCF» (PDF) . Шахматная жизнь . XIV (13). USCF : 2.
- ^ Эло 1986, с. 4
- ^ Эло, Арпад Э. (июнь 1961 г.). «Оценка USCF - научное достижение» (PDF) . Шахматная жизнь . XVI (6). USCF : 160–161.
- ^ «О USCF» . Федерация шахмат США. Архивировано из оригинала 2008-09-26 . Получено 2008-11-10 .
- ^ Elo 1986, предисловие к первому изданию
- ^ Много 1986.
- ^ Эло 1986, гл. 8.73.
- ^ Glickman, Mark E. и Jones, Albyn C., «Оценка оценки шахматной системы» (1999), шанс, 12, 2, 21-28.
- ^ Glickman, Mark E. (1995), «Комплексное руководство по шахматным рейтингам». Последующая версия этой статьи появилась в American Chess Journal , 3, с. 59–102.
- ^ Jump up to: а беременный Правила рейтинга FIDE вступают в силу с 1 июля 2017 года . Fide Online (fide.com) (отчет). Фид . Архивировано из оригинала 2019-11-27 . Получено 2017-09-09 .
- ^ Сейчас 1986, P159.
- ^ Jump up to: а беременный Шахматная система США (PDF) (отчет). 24 апреля 2017 года. Архивировал (PDF) с оригинала 7 февраля 2020 года . Получено 16 февраля 2020 года - через Glicko.net.
- ^ Ананд проиграл № 1 Моросевичу ( шахматная база, 24 августа 2008 г. Архивировал 2008-09-10 на машине Wayback ), затем восстановил ее, затем Карлсен занял 1 ( шахматная база, 5 сентября 2008 г. Архивировал 2012-11 гг. Machine Wayback ), затем Ivanchuk ( Chessbase, 11 сентября 2008 г. Архивировал 2008-09-13 на машине Wayback ) и, наконец, Topalov ( , 13 сентября 2008 г. Chessbase 2008-09-15 на машине Wayback )
- ^ Администратор. «Калькуляторы шахмат Fide Chess Calculators: калькулятор изменений в шахматах» . ratings.fide.com . Архивировано из оригинала 2017-09-28 . Получено 2017-09-28 .
- ^ Американская шахматная федерация архив 2012-06-18 на машине Wayback
- ^ Uscf glossary Quote: «Игрок, который участвует в более чем 300 играх с рейтингом более 2200», архивировав 2013-03-08 на машине Wayback от Шахматной федерации Соединенных Штатов
- ^ «Приблизительные формулы для системы шахмат США» Архивировали 2019-11-04 в машине Wayback , Федерация шахмат США , Марк Гликман, апрель 2017 г.
- ^ Эло 1986, гл. 1.12.
- ^ Хорошо, IJ (1955). «На маркировке шахматных игроков». Математическая газета . 39 (330): 292–296. doi : 10.2307/3608567 . JSTOR 3608567 . S2CID 158885108 .
- ^ Дэвид, Ха (1959). «Турниры и парные сравнения». Биометрика . 46 (1/2): 139–149. doi : 10.2307/2332816 . JSTOR 2332816 .
- ^ Травинский, BJ; Дэвид, Ха (1963). «Выбор наилучшего лечения в эксперименте с парным боем» . Анналы математической статистики . 34 (1): 75–91. doi : 10.1214/AOMS/1177704243 .
- ^ Булманн, Ганс; Хубер, Питер Дж. (1963). «Парное сравнение и рейтинг в турнирах» . Анналы математической статистики . 34 (2): 501–510. doi : 10.1214/AOMS/1177704161 .
- ^ Эло 1986, с. 141, гл. 8.4 и логистическая вероятность в качестве оценки
- ^ «Система рейтинга ELO - корректирование таблиц ожидаемой продолжительности» . 30 марта 2011 года.
- ^ Эло 1986, гл. 8.73
- ^ Статья Key Sonas Сонас, Джефф. "Формула рейтинга Сонаса - лучше, чем Эло?" Полем schessbase.com . Архивировано из оригинала на 2005-03-05 . Получено 2005-05-01 .
- ^ Jump up to: а беременный Регламент о рейтингах FIDE вступает в силу с 1 июля 2014 года . Fide Online (fide.com) (отчет). Фид . 2014-07-01. Архивировано из оригинала 2014-07-01 . Получено 2014-07-01 .
- ^ Правила рейтинга FIDE действуют с 1 июля 2013 года по 1 июля 2014 года . Fide Online (fide.com) (отчет). 2013-07-01. Архивировано с оригинала 2014-07-15 . Получено 2014-07-01 .
- ^ «Изменения в правилах рейтинга» . Fide Online (fide.com) (пресс -релиз). Фид . 2011-07-21. Архивировано из оригинала 2012-05-13 . Получено 2012-02-19 .
- ^ " K -Factor" . Schessclub.com . Помощь в ICC. 2002-10-18. Архивировано из оригинала 2012-03-13 . Получено 2012-02-19 .
- ^ Кирали, Ф.; Цянь, З. (2017). «Моделирование соревновательных видов спорта: модели Брэдли-Терри-Эло для контролируемого и онлайн-изучения парных результатов конкуренции». arxiv : 1701.08055 [ stat.ml ].
- ^ Jump up to: а беременный в Zczecinski, Leszek; ДЖЕББИ, Аймен (2020-09-01). «Понимание рисует в алгоритме рейтинга Эло» . Журнал количественного анализа в спорте . 16 (3): 211–220. doi : 10.1515/jqas-2019-0102 . ISSN 1559-0410 . S2CID 219784913 .
- ^ Дэвидсон, Роджер Р. (1970). «О продлении модели Брэдли-Терри для размещения связей в парных экспериментах по сравнению» . Журнал Американской статистической ассоциации . 65 (329): 317–328. doi : 10.2307/2283595 . ISSN 0162-1459 . JSTOR 2283595 .
- ^ Руководство родителей по шахматным архивированию 2008-05-28 в The Wayback Machine Skittles , Don Heisman, Chesscafe.com, 4 августа 2002 г.
- ^ «Шахматные новости - план Nunn для мирового чемпионата по шахматам» . Schessbase.com. 8 июня 2005 года. Архивировано с оригинала 2011-11-19 . Получено 2012-02-19 .
- ^ Jump up to: а беременный «Представление точек Planeswalker» . 6 сентября 2011 года. Архивировано с оригинала 30 сентября 2011 года . Получено 9 сентября 2011 года .
- ^ Jump up to: а беременный «Достижение очков» . 9 сентября 2011 года. Архивировано с оригинала 18 октября 2016 года . Получено 9 сентября 2011 года .
- ^ Jump up to: а беременный Джефф Сонас (27 июля 2009 г.). «Оценка инфляции - его причины и возможные лекарства» . schessbase.com . Архивировано с оригинала 23 ноября 2013 года . Получено 27 августа 2009 года .
- ^ Jump up to: а беременный «Вишванатан Ананд» . Chessgames.com. Архивировано из оригинала 2013-03-28 . Получено 2012-08-14 .
- ^ Риган, Кеннет; Haworth, Guy (2011-08-04). «Внутренние шахматные рейтинги» . Труды конференции АААИ по искусственному интеллекту . 25 (1): 834–839. doi : 10.1609/aaai.v25i1.7951 . ISSN 2374-3468 . S2CID 15489049 . Архивировано из оригинала 2021-04-20 . Получено 2021-09-01 .
- ^ Bergersen, Per A. "elo-systemet" (на норвежском языке). Норвежская шахматная федерация. Архивировано из оригинала 8 марта 2013 года . Получено 21 октября 2013 года .
- ^ Jump up to: а беременный в Разговор с Марком Гликманом 1] 2011-08-07 на The Wayback Архивировал Machin [
- ^ «Система ELO» . Норвежская шахматная федерация . Архивировано из оригинала 5 декабря 2013 года . Получено 2009-08-23 .
- ^ Ларри Кауфман, Варианты шахматной доски (2021), с. 179
- ^ «Объясняется рейтинги навыки» . Results.ukbgf.com . Архивировано из оригинала 2019-11-14 . Получено 2020-06-01 .
- ^ «Играть! Покемон Глоссарий: Эло» . Архивировано с оригинала 15 января 2015 года . Получено 15 января 2015 года .
- ^ Лион, Кит (10 июня 2014 г.). "Каковы рейтинги World Football Elo?" Полем Разговор . Архивировано из оригинала 15 июня 2019 года . Получено 3 июля 2019 года .
- ^ Silver, Nate (2006-06-28). "Ложь, проклятая ложь: мы эло?" Полем Архивировано из оригинала 2006-08-22 . Получено 2023-01-13 .
- ^ «Шансы после сезона, эло версия» . BaseballProspectus.com. Архивировано с оригинала 2012-03-07 . Получено 2012-02-19 .
- ^ Коул, Брайан (15 августа 2014 г.). «Эло рейтинги для международного бейсбола» . За пределами коробки . SB Nation . Архивировано с оригинала 2 января 2016 года . Получено 4 ноября 2015 года .
- ^ "Рафа коза глины?" Полем 8 мая 2018 года. Архивировано с оригинала 27 февраля 2021 года . Получено 22 августа 2018 года .
- ^ «Скорость Фарго» . Получено 31 марта 2022 года .
- ^ «Пересмотр мирового рейтинга FIFA/Coca-Cola» (PDF) . ФИФА. Июнь 2018 года. Архивировано из оригинала (PDF) 2018-06-12 . Получено 2020-06-30 .
- ^ Серебро, Нейт; Фишер-Баум, Рувим (21 мая 2015 г.). «Как мы рассчитываем рейтинги NBA ELO» . FiveThirtyEight . Архивировано с оригинала 2015-05-23.
- ^ Nate Silver, «Полная история NBA», FiveThirtyEight, 21 мая 2015 . Baum и года Reuben Fischer -
- ^ Серебро, Нейт (4 сентября 2014 г.). «Представление рейтингов NFL ELO» . FiveThirtyEight. Архивировано с оригинала 12 сентября 2015 года. Пейн, Нил (10 сентября 2015 г.). «Рейтинги NFL ELO вернулись» . FiveThirtyEight. Архивировано из оригинала 11 сентября 2015 года .
- ^ "Революция по хоккею - как команды выбирают игроков?" Полем Хоккейная статистика революция . Архивировано с оригинала 2016-10-02 . Получено 2016-09-29 .
- ^ «О рейтингах - оценки HEMA» . Кропоталы . Получено 2024-01-30 .
- ^ «Заказ | LOL - Лига легенд» . NA.LeagueOflegends.com. 2010-07-06. Архивировано из оригинала 2012-02-26 . Получено 2012-02-19 .
- ^ «Добро пожаловать в 8 -й сезон соревновательной игры» . PlayoverWatch.com . Blizzard Entertainment. Архивировано с оригинала 12 марта 2018 года . Получено 11 марта 2018 года .
- ^ «World of Warcraft Europe -> арена» . Wow-europe.com. 2011-12-14. Архивировано из оригинала 2010-09-23 . Получено 2012-02-19 .
- ^ «Разработчик Airmech объясняет, почему они используют ELO» . Архивировано из оригинала 17 февраля 2015 года . Получено 15 января 2015 года .
- ^ [3] [ мертвая ссылка ]
- ^ "MWO: новости" . mwomercs.com . Архивировано с оригинала 2018-08-27 . Получено 2017-06-27 .
- ^ «Эпоха империй II: DE Leaderpards - Эпоха империй» . 14 ноября 2019 года. Архивировано с оригинала 27 января 2022 года . Получено 27 января 2022 года .
- ^ «Список лучших игроков тетриса в мире (NES NTSC)» . Получено 15 июля 2024 года .
- ^ «Часто задаваемые вопросы: рейтинги» . Lichess.org . Архивировано из оригинала 2019-04-02 . Получено 2020-11-11 .
- ^ «Wayback Machine Record of Clanbase.com» . Архивировано из оригинала 2017-11-05 . Получено 2017-10-29 .
- ^ "Гильдия Лестница" . Wiki.guildwars.com. Архивировано из оригинала 2012-03-01 . Получено 2012-02-19 .
- ^ «Прощальное сообщение Clanbase» . Архивировано из оригинала 2013-12-24 . Получено 2017-10-29 .
- ^ "Scrimbase Gaming Ladder" . Архивировано с оригинала 2017-10-30 . Получено 2017-10-29 .
- ^ «Страница рейтинга Golden Tee Fan Fan» . 26 декабря 2007 года. Архивировано с оригинала 2014-01-01 . Получено 2013-12-31 .
- ^ «Использование сравнительных человеческих описаний для мягкой биометрии», архивировавших 2013-03-08 в The Wayback Machine , Da Reid и MS Nixon, Международная совместная конференция по биометрии (IJCB), 2011
- ^ Пёршманн; и др. (2010). «Мужской репродуктивный успех и его поведенческий коррелирование в полигинозном млекопитающем, галапагос -морской лев (Zalophus wollebaeki)». Молекулярная экология . 19 (12): 2574–86. doi : 10.1111/j.1365-294x.2010.04665.x . PMID 20497325 . S2CID 19595719 .
- ^ Цанг; и др. (2016). «Проверка ткани на основе метода рейтинга ELO» . Распознавание образца . 51 : 378–394. Bibcode : 2016patre..51..378t . doi : 10.1016/j.patcog.2015.09.022 . HDL : 10722/229176 . Архивировано из оригинала 2020-11-05 . Получено 2020-05-05 .
- ^ "Система рейтинга конкуренции алгоритма" . 23 декабря 2009 г. Архивировано с оригинала 2 сентября 2011 года . Получено 16 сентября 2011 года .
- ^ "FAQ: Каковы рейтинг и подразделения?" Полем Архивировано с оригинала 25 сентября 2011 года . Получено 16 сентября 2011 года .
- ^ «Распределение рейтинга» . Архивировано из оригинала 13 октября 2011 года . Получено 16 сентября 2011 года .
- ^ «Относительно рейтинга: часть 2» . Архивировано из оригинала 13 октября 2011 года . Получено 16 сентября 2011 года .
- ^ «Матч Tinder больше похоже на Warcraft, чем вы думаете - убить экран» . Убить экран . 2016-01-14. Архивировано из оригинала 2017-08-19 . Получено 2017-08-19 .
- ^ "Лучшая камера смартфона 2022!" Полем YouTube . 2022-12-22 . Получено 2023-01-07 .
- ^ Эйвери, Кристофер Н .; Glickman, Mark E.; Хоксби, Кэролайн М.; Метрик, Эндрю (2013-02-01). «Раскрытый рейтинг предпочтений американских колледжей и университетов». Ежеквартальный журнал экономики . 128 (1): 425–467. doi : 10.1093/QJE/QJS043 .
- ^ Ирвин, Нил (4 сентября 2014 г.). «Почему колледжи с отчетливым фокусом имеют скрытое преимущество» . В результате . New York Times . Получено 9 мая 2023 года .
- ^ Селинго, Джеффри Дж. (23 сентября 2015 г.). «Когда у студентов есть выбор среди лучших колледжей, какой из них они выбирают?» Полем The Washington Post . Получено 9 мая 2023 года .
- ^ Аскелл, Аманда; Бай, Юнтао; Чен, Анна; Слить, рассвет; Гангули, глубокий; Хэниган, Том; Джонс, Энди; Джозеф, Николас; Манн, Бен (2021-12-09). «Общий помощник по языку в качестве лаборатории для выравнивания». Arxiv : 2112.00861 [ Cs.cl ].
- ^ «Чатботская арена, неделя лидеров 8: Представление Mt-Bench и Vicuna-33B | lmsys org» . lmsys.org . Получено 2024-02-28 .
- ^ "Чатбот -арена: новые модели и обновление системы ELO | lmsys org" . lmsys.org . Получено 2024-02-28 .
- ^ Сценарий для социальной сети , Sony Pictures Archived 2012-09-04 в The Wayback Machine , p. 16
Источники
[ редактировать ]- Elo, Arpad (1986) [1st Pub. 1978]. Рейтинг шахматных игроков, прошлого и настоящего (второе изд.). Нью -Йорк: Arco Publishing, Inc. ISBN 978-0-668-04721-0 .
Дальнейшее чтение
[ редактировать ]- Харкнесс, Кеннет (1967). Официальный шахматный справочник . Маккей.