Рейтинговая система Эло
Эло [а] Рейтинговая система — это метод расчета относительных уровней навыков игроков в играх с нулевой суммой, таких как шахматы или киберспорт . Он назван в честь своего создателя Арпада Эло , венгерско-американского профессора физики.
Система Эло была изобретена как улучшенная шахматная рейтинговая система по сравнению с ранее использовавшейся системой Харкнесса . [1] но также используется в качестве рейтинговой системы в футболе , американском футболе , бейсболе , баскетболе , бильярде , различных настольных играх и киберспорте , а в последнее время и в больших языковых моделях .
Разница в рейтингах двух игроков служит предсказателем исхода матча. Ожидается, что два игрока с равными рейтингами, играющие друг против друга, одержат равное количество побед. Ожидается, что игрок, чей рейтинг на 100 очков выше, чем у его противника, наберет 64%; если разница составляет 200 очков, то ожидаемый результат более сильного игрока составит 76%. [2]
Рейтинг Эло игрока — это число, которое может меняться в зависимости от исхода сыгранных рейтинговых игр. После каждой игры победивший игрок забирает очки у проигравшего. Разница рейтингов победителя и проигравшего определяет общее количество очков, полученных или потерянных после игры. Если победит игрок с более высоким рейтингом, то у игрока с более низким рейтингом будет отнято лишь несколько очков рейтинга. Однако если игрок с более низким рейтингом одержит досадную победу , многие рейтинговые очки будут переведены. Игрок с более низким рейтингом также получит несколько очков от игрока с более высоким рейтингом в случае ничьей. Это означает, что данная рейтинговая система является самокорректирующейся. Игроки, чьи рейтинги слишком низкие или слишком высокие, в конечном итоге должны показывать лучшие или худшие результаты соответственно, чем предсказывает рейтинговая система, и, таким образом, набирать или терять рейтинговые очки до тех пор, пока рейтинги не отразят их истинную игровую силу.
Рейтинги Эло являются только сравнительными и действительны только в пределах рейтингового пула, в котором они были рассчитаны, а не являются абсолютной мерой силы игрока.
Хотя системы, подобные Эло, широко используются в играх для двух игроков, их вариации также применяются в многопользовательских соревнованиях. [3]
История
[ редактировать ]Арпад Эло был шахматистом мастерского уровня и активным участником Шахматной федерации США (USCF) с момента ее основания в 1939 году. [4] USCF использовала систему числовых рейтингов, разработанную Кеннетом Харкнессом , чтобы позволить участникам отслеживать свой индивидуальный прогресс с точки зрения, отличной от турнирных побед и поражений. Система Харкнесса была достаточно справедливой, но в некоторых обстоятельствах приводила к рейтингам, которые многие наблюдатели считали неточными. По поручению USCF Эло разработал новую систему с более надежной статистической основой. [5] Примерно в то же время Дьердь Кароли и Роджер Кук независимо друг от друга разработали систему, основанную на тех же принципах, для Шахматной ассоциации Нового Южного Уэльса. [6]
Система Эло заменила более ранние системы конкурентных вознаграждений системой, основанной на статистической оценке. Системы рейтингов для многих видов спорта начисляют баллы в соответствии с субъективными оценками «величия» тех или иных достижений. Например, победа в важном турнире по гольфу может принести произвольно выбранное в пять раз больше очков, чем победа в менее значимом турнире.
В статистических исследованиях, напротив, используется модель, которая связывает результаты игры с базовыми переменными, отражающими способности каждого игрока.
Центральное предположение Эло заключалось в том, что шахматная результативность каждого игрока в каждой игре является нормально распределенной случайной величиной . Хотя игрок может выступать значительно лучше или хуже от одной игры к другой, Эло предположил, что средняя ценность результатов любого конкретного игрока меняется со временем очень медленно. Эло рассматривал истинное мастерство игрока как среднее значение случайной переменной производительности этого игрока.
Необходимо еще одно предположение, поскольку шахматная результативность в указанном выше смысле все еще не поддается измерению. Невозможно просмотреть последовательность ходов и получить число, отражающее мастерство игрока. Об эффективности можно судить только по победам, ничьим и поражениям. Следовательно, если игрок выигрывает игру, предполагается, что он выступил на более высоком уровне, чем его противник в этой игре. И наоборот, если игрок проигрывает, предполагается, что он выступил на более низком уровне. Если игра завершилась вничью, предполагается, что оба игрока выступили примерно на одном уровне.
Эло не уточнил, насколько близкими должны быть два выступления, чтобы привести к ничьей, а не к победе или поражению. На самом деле существует вероятность ничьей, которая зависит от разницы в производительности, поэтому последняя является скорее доверительным интервалом, чем любой детерминированной границей. И хотя он считал, что вполне вероятно, что у игроков могут быть разные стандартные отклонения в их выступлениях, он сделал упрощающее предположение об обратном.
Чтобы еще больше упростить вычисления, Эло предложил простой метод оценки переменных в своей модели (т. е. истинного мастерства каждого игрока). По таблицам можно относительно легко подсчитать, сколько игр игроки, как ожидается, выиграют, основываясь на сравнении их рейтингов с рейтингами их оппонентов. Рейтинги игрока, выигравшего больше игр, чем ожидалось, будут скорректированы в сторону повышения, а рейтинги игрока, выигравшего меньше, чем ожидалось, будут скорректированы в сторону понижения. Более того, эта корректировка должна была быть линейно пропорциональна количеству побед, на которое игрок превысил или не дотянул до ожидаемого числа. [7]
С современной точки зрения, в упрощающих предположениях Эло нет необходимости, поскольку вычислительная мощность недорога и широко доступна. Несколько человек, в первую очередь Марк Гликман , предложили использовать более сложные статистические методы для оценки тех же переменных. С другой стороны, вычислительная простота системы Эло оказалась одним из ее главных достоинств. С помощью карманного калькулятора информированный шахматист может с точностью до одного балла рассчитать, каким будет его следующий официально опубликованный рейтинг, что помогает создать впечатление, что рейтинги справедливы.
Реализация схемы Эло
[ редактировать ]USCF реализовал предложения Эло в 1960 году. [8] и система быстро получила признание как более справедливая и точная, чем рейтинговая система Харкнесса . Система Эло была принята Всемирной шахматной федерацией (ФИДЕ) в 1970 году. [9] Эло подробно описал свою работу в «Рейтинге шахматистов прошлого и настоящего» , впервые опубликованном в 1978 году. [10]
Последующие статистические тесты показали, что результаты в шахматах почти наверняка не распределяются по нормальному распределению , поскольку более слабые игроки имеют больше шансов на победу, чем предсказывает модель Эло. [11] [12] Часто в данных парных сравнений очень мало практической разницы в том, предполагается ли, что различия в сильных сторонах игроков распределены нормально или логистически . Однако с математической точки зрения работать с логистической функцией удобнее, чем с нормальным распределением. [13] ФИДЕ продолжает использовать таблицу разницы рейтингов, предложенную Эло. [14] : таблица 8.1б
Разработка Таблицы процентных ожиданий (таблица 2.11) более подробно описана Эло следующим образом: [15]
Нормальные вероятности могут быть взяты непосредственно из стандартныхтаблицы площадей под нормальной кривой при разнице в рейтингахвыражается как балл по az. Поскольку стандартное отклонение σ отдельныхпроизводительность определяется как 200 баллов, стандартное отклонение σ'разница в производительности становится σ√2 или 282,84. Значение z aтогда разница составит D /282,84 . Это позволит разделить область подкривую на две части: большая дает P для игрока с более высоким рейтингом именьший дает P для игрока с более низким рейтингом.
Например, пусть D = 160 . Тогда z = 160/282,84 = 0,566 . Столдает 0,7143 и 0,2857 как площади двух частей под кривой.Эти вероятности округлены до двух цифр в таблице 2.11.
На самом деле таблица построена со стандартным отклонением 200(10/7) как приближением для 200√2 . [ нужна ссылка ]
Нормальное и логистическое распределения — это в каком-то смысле произвольные точки в спектре распределений, которые хорошо работают. На практике оба этих дистрибутива очень хорошо работают для множества различных игр.
Различные системы рейтингов
[ редактировать ]Фраза «рейтинг Эло» часто используется для обозначения шахматного рейтинга игрока, рассчитанного ФИДЕ. Однако такое использование может сбивать с толку или вводить в заблуждение, поскольку общие идеи Эло были приняты многими организациями, включая USCF (до ФИДЕ), многие другие национальные шахматные федерации, недолговечную Профессиональную шахматную ассоциацию (PCA) и шахматные онлайн-серверы, включая Интернет -шахматный клуб (ICC), Бесплатный шахматный сервер в Интернете (FICS), Lichess , Chess.com и Yahoo! Игры. Каждая организация имеет уникальную реализацию, и ни одна из них не следует в точности оригинальным предложениям Эло.
Вместо этого можно обратиться к организации, присвоившей рейтинг. Например: «По состоянию на август 2002 года Григорий Кайданов имел рейтинг ФИДЕ 2638 и рейтинг USCF 2742». Рейтинги Эло этих различных организаций не всегда напрямую сопоставимы, поскольку рейтинги Эло измеряют результаты внутри закрытого пула игроков, а не абсолютное мастерство.
Рейтинги ФИДЕ
[ редактировать ]Для топ-игроков самым важным рейтингом является рейтинг ФИДЕ . ФИДЕ опубликовала следующие списки:
- С 1971 по 1980 год выпускался один список в год.
- С 1981 по 2000 год выпускалось два списка в год: в январе и июле.
- С июля 2000 г. по июль 2009 г. выпускалось четыре списка в год: в начале января, апреля, июля и октября.
- С июля 2009 года по июль 2012 года выпускалось шесть списков в год: в начале января, марта, мая, июля, сентября и ноября.
- С июля 2012 года список обновляется ежемесячно.
Следующий анализ рейтингового списка ФИДЕ за июль 2015 года дает приблизительное представление о том, что означает тот или иной рейтинг ФИДЕ с точки зрения мирового рейтинга:
- 5323 игрока имели активный рейтинг в диапазоне от 2200 до 2299, который обычно ассоциируется со званием Кандидат в мастера .
- 2869 игроков имели активный рейтинг в диапазоне от 2300 до 2399, что обычно ассоциируется со званием Мастера ФИДЕ .
- 1420 игроков имели активный рейтинг от 2400 до 2499, большинство из которых имели звание международного мастера или международного гроссмейстера .
- 542 игрока имели активный рейтинг от 2500 до 2599, большинство из них имели звание международного гроссмейстера .
- 187 игроков имели активный рейтинг от 2600 до 2699, все они имели звание международного гроссмейстера .
- 40 игроков имели активный рейтинг от 2700 до 2799.
- 4 игрока имели активный рейтинг выше 2800. ( Магнус Карлсен имел рейтинг 2853, а 3 игрока имели рейтинг между 2814 и 2816).
Самый высокий рейтинг ФИДЕ за всю историю составил 2882, он был у Магнуса Карлсена в списке мая 2014 года. Список игроков с самым высоким рейтингом за всю историю можно найти на сайте «Сравнение лучших шахматистов за всю историю» .
Рейтинг производительности
[ редактировать ]1.00 | +800 |
0.99 | +677 |
0.9 | +366 |
0.8 | +240 |
0.7 | +149 |
0.6 | +72 |
0.5 | 0 |
0.4 | −72 |
0.3 | −149 |
0.2 | −240 |
0.1 | −366 |
0.01 | −677 |
0.00 | −800 |
Рейтинг результативности или специальный рейтинг — это гипотетический рейтинг, который может быть получен только по результатам игр одного турнира. Некоторые шахматные организации [16] : с. 8 используйте «алгоритм 400» для расчета рейтинга производительности. Согласно этому алгоритму рейтинг результативности мероприятия рассчитывается следующим образом:
- За каждую победу прибавляйте рейтинг противника плюс 400,
- За каждое поражение прибавляйте рейтинг противника минус 400,
- И разделите эту сумму на количество сыгранных игр.
Пример: 2 победы (противники w и x ), 2 поражения (противники y и z ).
Это можно выразить следующей формулой:
Пример: Если вы победили игрока с рейтингом Эло 1000,
Если вы победите двух игроков с рейтингом Эло 1000,
Если ты рисуешь,
Это упрощение, но оно предлагает простой способ получить оценку PR (рейтинга производительности).
Однако ФИДЕ рассчитывает рейтинг результативности по формуле где "разница в рейтингах" основан на процентном результате игрока в турнире , который затем используется в качестве ключа в справочной таблице, где Это просто количество набранных очков, разделенное на количество сыгранных игр. Обратите внимание, что в случае идеального результата или его отсутствия это 800.
Живые рейтинги
[ редактировать ]ФИДЕ обновляет свой рейтинговый список в начале каждого месяца. Напротив, неофициальные «Живые рейтинги» рассчитывают изменение рейтингов игроков после каждой игры. Эти рейтинги в реальном времени основаны на ранее опубликованных рейтингах ФИДЕ, поэтому рейтинг игрока в реальном времени должен соответствовать тому, каким был бы рейтинг ФИДЕ, если бы ФИДЕ в тот же день опубликовала новый список.
Хотя рейтинги Live являются неофициальными, интерес к рейтингам Live возник в августе/сентябре 2008 года, когда пять разных игроков заняли первое место в рейтинге Live. [17]
Неофициальные живые рейтинги игроков более 2700 публиковались и поддерживались Гансом Арильдом Рунде на веб-сайте Live Rating до августа 2011 года. Другой веб-сайт, 2700chess.com , с мая 2011 года поддерживается Артемом Цепотаном , который также охватывает 100 лучших игроков. как 50 лучших игроков женского пола.
Изменения рейтингов можно рассчитать вручную с помощью калькулятора изменения рейтингов ФИДЕ. [18] У всех топ-игроков К-фактор равен 10, а это означает, что максимальное изменение рейтинга за одну игру составляет чуть менее 10 очков.
Рейтинги Шахматной федерации США
[ редактировать ]Федерация шахмат США (USCF) использует собственную классификацию игроков: [19]
- 2400 и выше: Старший Мастер
- 2200–2399: Национальный мастер.
- 2200–2399 плюс 300 игр выше 2200: Original Life Master [20]
- 2000–2199: Эксперт или кандидат в мастера.
- 1800–1999: Класс А.
- 1600–1799: Класс Б.
- 1400–1599: Класс С.
- 1200–1399: Класс D.
- 1000–1199: Класс Е
- 800–999: Класс F
- 600–799: Класс G
- 400–599: Класс H
- 200–399: Класс I.
- 100–199: Класс J
К-фактор, используемый USCF
[ редактировать ]К -фактор в рейтинговой системе USCF можно оценить, разделив 800 на эффективное количество игр, на которых основан рейтинг игрока ( N e ), плюс количество игр, завершенных игроком в турнире ( m ). [21]
Этажи рейтинга
[ редактировать ]USCF поддерживает абсолютный нижний предел рейтинга 100 для всех рейтингов. Таким образом, ни один участник не может иметь рейтинг ниже 100, независимо от его выступлений на мероприятиях, санкционированных USCF. Однако игроки могут иметь более высокие индивидуальные абсолютные рейтинги, рассчитываемые по следующей формуле:
где количество выигранных рейтинговых игр, - количество розыгрышей рейтинговых игр, и — количество событий, в которых игрок завершил три и более рейтинговых игры.
Более высокие уровни рейтинга существуют для опытных игроков, достигших значительных рейтингов. Существуют такие более высокие уровни рейтинга, начиная с рейтинга 1200 с шагом в 100 пунктов до 2100 (1200, 1300, 1400, ..., 2100). Нижний предел рейтинга рассчитывается путем вычитания максимального установленного рейтинга игрока из 200 очков и последующего округления до ближайшего нижнего уровня рейтинга. Например, игрок, достигший максимального рейтинга 1464, будет иметь минимальный рейтинг 1464 − 200 = 1264 , который будет округлен до 1200. Согласно этой схеме только игроки класса C и выше способны иметь более высокий рейтинг. этаже, чем их абсолютный рейтинг игрока. У всех остальных игроков будет не более 150 этажей.
Есть два способа достичь более высоких ступеней рейтинга, кроме стандартной схемы, представленной выше. Если игрок достиг рейтинга Original Life Master, его минимальный рейтинг устанавливается на уровне 2200. Достижение этого титула уникально тем, что ни один другой признанный титул USCF не приведет к новому уровню. Для игроков с рейтингом ниже 2000 выигрыш денежного приза в размере 2000 долларов США или более повышает нижний рейтинг этого игрока до ближайшего уровня в 100 очков, который дисквалифицирует игрока для участия в турнире. Например, если игрок выиграл $4000 в турнире среди игроков до 1750 человек и младше, его минимальный рейтинг теперь будет равен 1800.
Теория
[ редактировать ]Парные сравнения составляют основу методологии рейтинга Эло. [22] Эло ссылался на статьи Гуда, [23] Дэйвид, [24] Травински и Дэвид, [25] и Бюльман и Хубер. [26]
Математические детали
[ редактировать ]Производительность не измеряется абсолютно; он выводится из побед, поражений и ничьих против других игроков. Рейтинги игроков зависят от рейтингов их противников и результатов, набранных против них. Разница в рейтинге между двумя игроками определяет оценку ожидаемого результата между ними. Как среднее значение, так и разброс оценок могут быть выбраны произвольно. Первоначально USCF стремился к тому, чтобы средний клубный игрок имел рейтинг 1500, и Эло предложил масштабировать рейтинги таким образом, чтобы разница в 200 рейтинговых очков в шахматах означала, что более сильный игрок имеет ожидаемый результат примерно 0,75.
игрока Ожидаемый результат — это его вероятность выигрыша плюс половина вероятности выпадения ничьей. Таким образом, ожидаемый результат 0,75 может представлять собой 75% вероятность победы, 25% вероятность проигрыша и 0% вероятность ничьей. С другой стороны, это может представлять собой 50% вероятность выигрыша, 0% вероятность проигрыша и 50% вероятность ничьей. Вероятность выпадения, в отличие от решающего результата, не указана в системе Эло. Вместо этого ничья считается половиной победы и половиной поражения. На практике, поскольку истинная сила каждого игрока неизвестна, ожидаемые очки рассчитываются с использованием текущих рейтингов игрока следующим образом.
Если игрок А имеет рейтинг и игроку Б рейтинг , точная формула (с использованием логистической кривой с основанием 10 ) [27] ожидаемый результат игрока А равен
Аналогично, ожидаемый результат для игрока B равен
Это также может быть выражено через
и
где и Обратите внимание, что в последнем случае к обоим выражениям применяется один и тот же знаменатель, и ясно, что Это означает, что, изучая только числители, мы узнаем, что ожидаемый результат игрока А равен игрока B. умножить ожидаемый результат Отсюда следует, что на каждые 400 рейтинговых очков преимущества над противником ожидаемый результат увеличивается в десять раз по сравнению с ожидаемым результатом противника.
Когда фактические турнирные результаты игрока превышают ожидаемые результаты, система Эло воспринимает это как свидетельство того, что рейтинг игрока слишком низок и его необходимо повысить. Аналогичным образом, когда фактические турнирные результаты игрока не соответствуют ожидаемым, рейтинг этого игрока снижается. Первоначальное предложение Эло, которое до сих пор широко используется, представляло собой простую линейную корректировку, пропорциональную тому, насколько игрок превысил или не достиг ожидаемого результата. Максимально возможная корректировка за игру, называемая К-фактором, была установлена на уровне для мастеров и для более слабых игроков.
Предположим, игрок А (снова с рейтингом ) ожидалось, что он забьет очки, но на самом деле забил точки. Формула обновления рейтинга этого игрока:
Это обновление можно выполнять после каждой игры или каждого турнира или после любого подходящего рейтингового периода.
Пример может помочь прояснить:
Предположим, игрок А имеет рейтинг 1613 и участвует в турнире из пяти раундов. Они проигрывают игроку с рейтингом 1609, играют вничью с игроком с рейтингом 1477, побеждают игрока с рейтингом 1388, побеждают игрока с рейтингом 1586 и проигрывают игроку с рейтингом 1720. Фактический счет игрока равен (0 + 0,5 + 1 + 1 + 0 ) = 2,5 . Ожидаемый балл, рассчитанный по приведенной выше формуле, составил (0,51 + 0,69 + 0,79 + 0,54 + 0,35) = 2,88 .
Следовательно, новый рейтинг игрока равен [1613 + 32·(2,5 − 2,88)] = 1601 , предполагая, что К используется -фактор, равный 32. Аналогичным образом, можно сказать, что в каждой игре игрок вкладывает в банк ставку, равную K , умноженную на его ожидаемый результат в игре, противостоящий игрок делает то же самое, и победитель забирает полный банк стоимостью K ; в случае ничьей игроки делят банк и получают очков каждый.
Обратите внимание: хотя две победы, два поражения и одна ничья могут показаться номинальным результатом, для игрока А это хуже, чем ожидалось , поскольку его противники имели в среднем более низкий рейтинг. Следовательно, игрок А слегка оштрафован. Если бы игрок А одержал две победы, одно поражение и две ничьи, набрав в общей сложности три очка, это было бы немного лучше, чем ожидалось, и новый рейтинг игрока был бы [1613 + 32·(3 − 2,88) ] = 1617 .
Эта процедура обновления лежит в основе рейтингов, используемых ФИДЕ , USCF , Yahoo! Games , Интернет-шахматный клуб (ICC) и бесплатный шахматный сервер в Интернете (FICS). Однако каждая организация применяет свой подход к решению проблемы неопределенности, присущей рейтингам, особенно рейтингам новичков, а также к решению проблемы инфляции/дефляции рейтингов. Новым игрокам присваиваются предварительные рейтинги, которые корректируются более радикально, чем установленные рейтинги.
Принципы, используемые в этих рейтинговых системах, можно использовать для оценки других соревнований, например международных футбольных матчей.
Рейтинги Эло также применялись к играм без возможности ничьей , а также к играм, в которых результат может иметь не только качество (выигрыш/проигрыш), но и количественный (маленький/большой перевес). Дополнительную информацию см . в рейтинге Го с Эло .
Предлагаемая модификация
[ редактировать ]В 2011 году, проанализировав 1,5 миллиона игр с рейтингом ФИДЕ, Джефф Сонас продемонстрировал, согласно формуле Эло, что два игрока, имеющие разницу в рейтингах X, на самом деле имеют истинную разницу около X (5/6) . Точно так же можно оставить разницу в рейтингах и разделить ее на 480 вместо 400. Поскольку формула Эло переоценивает вероятность победы более сильного игрока, более сильные игроки теряют очки против более слабых игроков, несмотря на то, что играют в свою истинную силу. Аналогично, более слабые игроки получают очки против более сильных игроков. Когда применяется модификация, наблюдаемые проценты выигрышей отклоняются менее чем на 0,1% от прогнозируемого, в то время как традиционное Эло может отличаться от прогнозируемого на 4%. [28]
Самая точная модель распределения
[ редактировать ]Первой математической проблемой, решенной USCF, было использование нормального распределения . Они обнаружили, что это неточно отражает фактические результаты, достигнутые, особенно игроками с более низким рейтингом. Вместо этого они перешли на модель логистического распределения , которая, по мнению USCF, лучше соответствует фактически достигнутым результатам. [29] [ нужна ссылка ] ФИДЕ также использует приближение логистического распределения. [14]
Самый точный К-фактор
[ редактировать ]Второй основной проблемой является правильное использование « К -фактора». Шахматный статистик Джефф Сонас считает, что оригинал значение (для игроков с рейтингом выше 2400) в работе Эло неточно. Если коэффициент К -фактора установлен слишком большим, будет слишком большая чувствительность к нескольким недавним событиям с точки зрения большого количества очков, обмениваемых в каждой игре. А если значение K слишком низкое, чувствительность будет минимальной, и система не сможет достаточно быстро реагировать на изменения фактического уровня производительности игрока.
-фактора Эло Первоначальная оценка К была сделана без использования огромных баз данных и статистических данных. Сонас указывает, что К -фактор, равный 24 (для игроков с рейтингом выше 2400), может быть как более точным инструментом прогнозирования будущих результатов, так и более чувствительным к результатам. [30]
Некоторые шахматные сайты в Интернете, похоже, избегают трехуровневого К-фактора, основанного на диапазоне рейтингов. Например, ICC, похоже, принимает глобальное значение K = 32, за исключением случаев игры против игроков с предварительным рейтингом.
USCF (который использует логистическое распределение в отличие от нормального распределения ) ранее распределял К-фактор в соответствии с тремя основными рейтинговыми диапазонами:
К -фактор Используется для игроков с рейтингом... ниже 2100 между 21:00 и 24:00 выше 2400
В настоящее время USCF использует формулу, которая рассчитывает К -фактор на основе таких факторов, как количество сыгранных игр и рейтинг игрока. К-фактор также снижается для игроков с высоким рейтингом, если в соревновании предусмотрен более короткий контроль времени. [16]
ФИДЕ использует следующие диапазоны: [31]
К -фактор Используется для игроков с рейтингом... для игрока, впервые включенного в рейтинг-лист, до завершения событий с общим числом 30 игр, а также для всех игроков до достижения 18-летия, пока их рейтинг остается ниже 2300. для игроков, которые всегда имели рейтинг ниже 2400. для игроков с любым опубликованным рейтингом не менее 2400 и сыгранных не менее 30 игр в предыдущих турнирах. После этого он постоянно остается на уровне 10.
До июля 2014 года ФИДЕ использовала следующие диапазоны: [32]
К -фактор Используется для игроков с рейтингом...
(было 25)для игрока, впервые попавшего в рейтинг-лист, до завершения событий с общим числом 30 игр. [33] для игроков, которые всегда имели рейтинг ниже 2400. для игроков с любым опубликованным рейтингом не менее 2400 и сыгранных не менее 30 игр в предыдущих турнирах. После этого он постоянно остается на уровне 10.
Градация К -фактора уменьшает изменение рейтинга в верхней части рейтингового диапазона, уменьшая возможность быстрого повышения или падения рейтинга для тех, у кого рейтинг достаточно высок, чтобы достичь низкого К -фактора.
Теоретически это может в равной степени относиться и к онлайн-шахматистам, и к игрокам за доской, поскольку всем игрокам труднее поднять свой рейтинг после того, как их рейтинг стал высоким и, как следствие, снизился их К -фактор. Однако, играя онлайн, 2800+ игроков могут легче поднять свой рейтинг, просто выбрав оппонентов с высоким рейтингом — на игровом сайте ICC гроссмейстер может сыграть с рядом разных оппонентов, каждый из которых имеет рейтинг выше 2700. [34] В турнирах за доской только в турнирах «все-играй-все» на очень высоком уровне игрок сможет сразиться с таким количеством более 2700 противников. В обычном открытом шахматном турнире с участием швейцарских пар часто бывает много противников с рейтингом ниже 2500, что снижает возможный прирост рейтинга в одном состязании для игрока с высоким рейтингом.
Формальный вывод для игр с победой/проигрышем
[ редактировать ]Вышеупомянутые выражения теперь можно формально получить, используя связь между рейтингом Эло и обновлением стохастического градиента в логистической регрессии. [35] [36]
Если предположить, что результаты игры являются двоичными , то есть можно наблюдать только выигрыш или проигрыш, проблему можно решить с помощью логистической регрессии , где результаты игр являются зависимыми переменными , рейтинги игроков являются независимыми переменными , а модель, связывающая оба фактора, является вероятностной: вероятность того, что игрок победа в игре моделируется как
где
обозначает разницу рейтингов игроков, и мы используем масштабный коэффициент , и по закону полной вероятности
Потери журнала затем рассчитываются как
и, используя стохастический градиентный спуск, потери журнала минимизируются следующим образом:
- ,
- .
где это этап адаптации.
С , , и , тогда адаптация запишется следующим образом
что можно компактно записать как
где это новый шаг адаптации, который поглощает и , если победы и если побеждает, а ожидаемый результат определяется выражением .
Аналогично обновление рейтинга является
- .
Формальный вывод для игр с победой/ничьей/проигрышем
[ редактировать ]С самого начала рейтинг Эло также использовался в шахматах, где мы наблюдаем победы, поражения или ничьи, и, чтобы справиться с последними, дробное значение очков: , вводится. Однако отметим, что оценки и являются просто индикаторами событий, когда игрок выигрывает или проигрывает игру. Поэтому не сразу понятно, в чем смысл дробного балла. Более того, поскольку мы не указываем явно модель, связывающую значения рейтинга и Что касается вероятности исхода игры, мы не можем сказать, какова вероятность выигрыша, проигрыша или ничьей.
Чтобы решить эти трудности и получить рейтинг Эло в троичных играх, мы определим явную вероятностную модель результатов. Далее мы минимизируем потери журнала с помощью стохастического градиента.
Поскольку проигрыш, ничья и выигрыш являются порядковыми переменными , мы должны принять модель, которая принимает во внимание их порядковый характер, и мы используем так называемую модель смежных категорий, которую можно проследить до работы Дэвидсона. [37]
где
и является параметром. Введение свободного параметра не должно вызывать удивления, поскольку у нас есть три возможных результата и, следовательно, в модели должна появиться дополнительная степень свободы. В частности, с мы восстанавливаем модель, лежащую в основе логистической регрессии
где .
Используя порядковую модель, определенную выше, потери журнала теперь рассчитываются как
что можно компактно записать как
где если только победы, если только побеждает, и если только рисует.
Как и раньше, нам понадобится производная который дается
- ,
где
Таким образом, производная логарифма потерь по рейтингу дается
где мы использовали отношения и .
Затем стохастический градиентный спуск, примененный для минимизации потерь журнала, дает следующее обновление рейтинга:
где и . Конечно, если победы, если рисует, и если проигрывает. Чтобы понять происхождение модели, предложенной Дэвидсоном, это обновление называется рейтингом Эло-Дэвидсона. [36]
Обновление для выводится таким же образом, как и
- ,
где .
Мы отмечаем, что
и, таким образом, мы получаем обновление рейтинга, которое можно записать как
- ,
где и мы получили практически то же уравнение, что и для рейтинга Эло, за исключением того, что ожидаемый балл определяется выражением вместо .
Конечно, как отмечалось выше, для , у нас есть и, таким образом, рейтинг Эло-Дэвидсона точно такой же, как и рейтинг Эло. Однако это бесполезно для понимания случая, когда наблюдаются ничьи (мы не можем использовать что означало бы, что вероятность ничьей равна нулю). С другой стороны, если мы используем , у нас есть
это означает, что использование , рейтинг Эло-Дэвидсона точно такой же, как и рейтинг Эло. [36]
Практические вопросы
[ редактировать ]Игровая активность vs защита своего рейтинга
[ редактировать ]В некоторых случаях рейтинговая система может препятствовать игровой активности игроков, желающих защитить свой рейтинг. [38] Чтобы отбить у игроков желание занимать высокий рейтинг, британский гроссмейстер Джон Нанн в 2012 году предложил выбрать отборочных игроков на чемпионат мира по шахматам, включив бонус за активность, который должен быть объединен с рейтингом. [39]
За пределами шахматного мира опасения по поводу того, что игроки избегают соревновательной игры ради защиты своих рейтингов, заставили Wizards of the Coast отказаться от системы Эло для турниров Magic: the Gathering в пользу разработанной ими системы под названием «Очки Planeswalker». [40] [41]
Выборочное спаривание
[ редактировать ]Более тонкий вопрос связан с спариванием. Когда игроки могут выбирать себе противников, они могут выбирать противников с минимальным риском проигрыша и максимальной наградой за победу. Конкретные примеры того, как игроки с рейтингом 2800+ выбирают противников с минимальным риском и максимальной вероятностью увеличения рейтинга, включают: выбор противников, которых, как они знают, они могут победить с помощью определенной стратегии; выбирать оппонентов, которые, по их мнению, переоценены; или избегать игры с сильными игроками, рейтинг которых на несколько сотен очков ниже их, но которые могут иметь такие шахматные титулы, как IM или GM. В категории выбора переоцененных соперников новички рейтинговой системы, сыгравшие менее 50 игр, теоретически являются удобной мишенью, поскольку их предварительный рейтинг может быть переоценен. ICC компенсирует эту проблему, присваивая более низкий К-фактор известному игроку, если он выигрывает у нового участника рейтинга. К-фактор на самом деле является функцией количества рейтинговых игр, сыгранных новым участником.
Таким образом, онлайн-рейтинги Эло по-прежнему предоставляют полезный механизм выставления рейтинга на основе рейтинга оппонента. Однако ее общую достоверность следует рассматривать в контексте, по крайней мере, двух описанных выше основных проблем: злоупотреблений в движке и избирательного объединения противников.
ICC также недавно ввел рейтинги «автоматического спаривания», которые основаны на случайных парах, но при этом каждая победа подряд гарантирует статистически более сильного противника, который также выиграл x игр подряд. Потенциально в нем участвуют сотни игроков, что создает некоторые трудности на крупном крупном швейцарском турнире, в котором ведется ожесточенная борьба, где победители раундов встречаются с победителями раундов. Такой подход к составлению пар, безусловно, максимизирует рейтинговый риск участников с более высоким рейтингом, которые могут столкнуться, например, с очень жестким сопротивлением со стороны игроков ниже 3000. Это отдельный рейтинг, который относится к категориям «1 минута» и «5 минут». Максимальные рейтинги, превышающие 2500, встречаются исключительно редко.
Рейтинги инфляции и дефляции
[ редактировать ]Термин «инфляция», применяемый к рейтингам, предполагает, что уровень игровой силы, демонстрируемый игроком с рейтингом, со временем снижается; и наоборот, «дефляция» предполагает, что уровень повышается. Например, если есть инфляция, современный рейтинг 2500 означает меньше, чем исторический рейтинг 2500, тогда как в случае дефляции верно обратное. Использование рейтингов для сравнения игроков разных эпох затрудняется, когда присутствует инфляция или дефляция. (См. также «Сравнение лучших шахматистов за всю историю ».)
Анализируя рейтинговые списки ФИДЕ с течением времени, Джефф Сонас предполагает, что инфляция могла иметь место примерно с 1985 года. [42] Сонас смотрит на игроков с самым высоким рейтингом, а не на всех игроков с самым высоким рейтингом, и признает, что изменения в распределении рейтингов могли быть вызваны повышением уровня игры на самых высоких уровнях, но ищет и другие причины.
Увеличилось количество людей с рейтингом выше 2700. Примерно в 1979 году был только один действующий игрок ( Анатолий Карпов ) с таким высоким рейтингом. В 1992 году Вишванатан Ананд был лишь восьмым игроком в истории шахмат, достигшим на тот момент отметки в 2700 очков. [43] К 1994 году это число увеличилось до 15 игроков. 33 игрока имели рейтинг 2700+ в 2009 году и 44 по состоянию на сентябрь 2012 года. Только 14 игроков когда-либо превышали рейтинг 2800.
Одной из возможных причин такого инфляции был минимальный рейтинг, который долгое время находился на уровне 2200, и если игрок опускался ниже этого уровня, его исключали из рейтингового списка. Как следствие, игроки с уровнем мастерства чуть ниже нижнего попадут в рейтинговый список только в том случае, если их рейтинг будет переоценен, и это приведет к тому, что они будут вносить очки в рейтинговый пул. [42] В июле 2000 года средний рейтинг топ-100 составлял 2644. К июлю 2012 года он увеличился до 2703. [43]
Используя мощный шахматный движок для оценки ходов, сыгранных в играх между рейтинговыми игроками, Риган и Хауорт анализируют серии игр турниров с рейтингом ФИДЕ и приходят к выводу, что с 1976 по 2009 год инфляция была незначительной или отсутствовала вообще. [44]
В чистой системе Эло каждая игра заканчивается получением равного количества рейтинговых очков. Если победитель наберет N очков рейтинга, проигравший потеряет N очков рейтинга. Это предотвращает попадание или выход очков из системы во время игр и оценок. Однако игроки, как правило, входят в систему новичками с низким рейтингом и покидают систему опытными игроками с высоким рейтингом. Таким образом, в долгосрочной перспективе система со строго равными сделками имеет тенденцию приводить к дефляции рейтинга. [45]
В 1995 году USCF признал, что несколько молодых игроков-учеников прогрессировали быстрее, чем могла отследить рейтинговая система. В результате состоявшиеся игроки со стабильным рейтингом начали терять рейтинговые очки молодым и недооцененным игрокам. Некоторые из опытных игроков старшего возраста были разочарованы тем, что они считали несправедливым снижением рейтинга, а некоторые даже бросили шахматы из-за этого. [46]
Борьба с дефляцией
[ редактировать ]Из-за значительной разницы во времени возникновения инфляции и дефляции, а также в целях борьбы с дефляцией в большинстве реализаций рейтингов Эло имеется механизм введения баллов в систему для поддержания относительных рейтингов с течением времени. У ФИДЕ есть два инфляционных механизма. Во-первых, выступления ниже «минимального рейтинга» не отслеживаются, поэтому игрок с истинным мастерством ниже этого уровня может быть только не оценен или переоценен, но никогда не будет оценен правильно. Во-вторых, у авторитетных игроков с более высоким рейтингом К-фактор ниже. У новых игроков есть К = 40 , который падает до К = 20 после 30 сыгранных игр и до К = 10 , когда игрок достигает 2400. [31] Текущая система в Соединенных Штатах включает в себя схему бонусных баллов, которая вводит рейтинговые очки в систему для отслеживания улучшения игроков, а также разные значения K для разных игроков. [46] Некоторые методы, используемые, например, в Норвегии, проводят различие между юниорами и взрослыми и используют более высокий К-фактор для молодых игроков, даже повышая прогресс рейтинга на 100%, когда их результаты значительно превышают прогнозируемые результаты. [47]
Минимальные рейтинги в США гарантируют, что игрок никогда не опустится ниже определенного предела. Это также борется с дефляцией, но председатель рейтингового комитета USCF критиковал этот метод, поскольку он не приносит дополнительных очков улучшающимся игрокам. Возможным мотивом введения этих минимальных рейтингов является борьба с мешками с песком, т.е. преднамеренное понижение рейтингов, чтобы иметь право на получение разделов и призов более низких рейтинговых классов. [46]
Рейтинги компьютеров
[ редактировать ]Шахматные матчи человека и компьютера в период с 1997 года ( Deep Blue против Гарри Каспарова ) по 2006 год продемонстрировали, что шахматные компьютеры способны победить даже самых сильных игроков-людей. Однако рейтинги шахматного движка трудно оценить количественно из-за переменных факторов, таких как контроль времени и оборудование, на котором работает программа, а также того факта, что шахматы не являются честной игрой. Существование и величина преимущества первого хода в шахматах становятся очень важными на компьютерном уровне. За пределами некоторого порога мастерства машина с белыми должна быть в состоянии заставить ничью по требованию из стартовой позиции даже при идеальной игре просто потому, что белые начинают со слишком большим преимуществом, чтобы их можно было потерять по сравнению с небольшой величиной ошибок, которые они могут совершить. делать. Следовательно, такой движок более или менее гарантированно наберет не менее 25% даже при идеальной игре. Различия в навыках, выходящие за пределы определенной точки, могут быть обнаружены только в том случае, если человек не начинает с обычной стартовой позиции, а вместо этого выбирает стартовую позицию, которая едва не теряется для одной стороны. Из-за этих факторов рейтинги зависят от пар и выбранных дебютов. [48] Опубликованные списки рейтингов движков, такие как CCRL, основаны на играх, использующих только движок, на стандартных конфигурациях оборудования и не могут быть напрямую сопоставлены с рейтингами ФИДЕ.
Некоторые оценки рейтингов см. в разделе «Шахматный движок § Рейтинги» .
Использование вне шахмат
[ редактировать ]Другие настольные и карточные игры
[ редактировать ]- Го : Европейская федерация го приняла рейтинговую систему на основе Эло, первоначально разработанную Чешской федерацией го.
- Нарды : популярный сервер First Internet Backgammon Server (FIBS) рассчитывает рейтинги на основе модифицированной системы Эло. Новым игрокам присваивается рейтинг 1500, а рейтинг лучших людей и ботов превышает 2000. Та же формула была принята несколькими другими сайтами, посвященными нардам, такими как Play65 , DailyGammon , GoldToken и VogClub . VogClub устанавливает рейтинг нового игрока на уровне 1600. Федерация нард Великобритании использует формулу FIBS для своих национальных рейтингов в Великобритании. [49]
- Scrabble : Национальные организации Scrabble рассчитывают нормально распределенные рейтинги Эло, за исключением Соединенного Королевства , где используется другая система. Североамериканская ассоциация игроков в скрэббл имеет самое большое количество активных членов, насчитывающее около 2000 по состоянию на начало 2011 года. Lexulous также использует систему Эло.
- Несмотря на вопросы о целесообразности использования системы Эло для оценки игр, в которых удача является фактором, производители коллекционных карточных игр часто используют рейтинги Эло для своей организованной игры. DCI (бывшая организация Duelists' Convocation International) использовала рейтинги Эло для турниров Magic: The Gathering и других Wizards of the Coast игр . Однако в 2012 году DCI отказалась от этой системы в пользу новой накопительной системы «Очков Planeswalker», главным образом из-за вышеупомянутой обеспокоенности тем, что Эло призывает игроков с высоким рейтингом избегать игры, чтобы «защитить свой рейтинг». [40] [41] Pokémon USA использует систему Elo для ранжирования своих участников организованной игры TCG. [50] Призы для лучших игроков в различных регионах включали приглашения на праздники и чемпионаты мира до сезона 2011–2012 годов, где награды основывались на системе чемпионских очков, их обоснование было таким же, как и у DCI для Magic: The Gathering . Точно так же компания Decipher, Inc. использовала систему Эло для своих рейтинговых игр, таких как настраиваемая карточная игра «Звездный путь» и настраиваемая карточная игра «Звездные войны» .
Спортивные виды спорта
[ редактировать ]Рейтинговая система Эло используется в шахматной части шахматного бокса . Чтобы иметь право заниматься профессиональным шахматным боксом, необходимо иметь рейтинг Эло не ниже 1600, а также участвовать в 50 или более матчах любительского бокса или боевых искусств.
Американский студенческий футбол использовал метод Эло как часть своей Bowl Championship Series рейтинговой системы с 1998 по 2013 год, после чего BCS был заменен плей-офф студенческого футбола . Джефф Сагарин из USA Today публикует рейтинги команд по большинству американских видов спорта, включая рейтинги по системе Эло для студенческого футбола. Использование рейтинговых систем было фактически отменено с созданием плей-офф студенческого футбола в 2014 году.
В других видах спорта люди поддерживают рейтинги на основе алгоритма Эло. Обычно они неофициальные и не одобрены руководящим органом спорта. Мировые футбольные рейтинги Эло являются примером метода, применяемого к мужскому футболу . [51] В 2006 году рейтинги Эло были адаптированы для Высшей бейсбольной лиги команд Нейтом Сильвером , тогда работавшим в Baseball Prospectus . [52] на основе Эло Основываясь на этой адаптации, оба также создали моделирование Монте-Карло шансов на то, что команды выйдут в плей-офф. [53] В 2014 году сайт Beyond the Box Score, сайт SB Nation , представил систему рейтинга Эло для международного бейсбола. [54]
В теннисе универсальный теннисный рейтинг (UTR) на основе Эло оценивает игроков в глобальном масштабе, независимо от возраста, пола или национальности. Это официальная рейтинговая система крупных организаций, таких как Межвузовская теннисная ассоциация и World TeamTennis , и она часто используется в сегментах теннисного канала . Алгоритм анализирует более 8 миллионов результатов матчей более 800 000 теннисистов со всего мира. 8 мая 2018 года Рафаэль Надаль , выигравший 46 сетов подряд в матчах на грунтовом корте, имел почти идеальный UTR на грунтовом покрытии 16,42. [55]
В пуле для ранжирования игроков в организованных любительских и профессиональных соревнованиях используется основанная на Эло система под названием Fargo Rank. [56]
Одним из немногих рейтингов на основе Эло, одобренных руководящим органом спорта, является Мировой женский рейтинг ФИФА , основанный на упрощенной версии алгоритма Эло, который ФИФА использует в качестве официальной системы ранжирования национальных сборных в женском футболе .
Из первого рейтингового списка после чемпионата мира по футболу FIFA 2018 года FIFA использовала Эло для составления мирового рейтинга FIFA . [57]
В 2015 году Нейт Сильвер, главный редактор сайта статистических комментариев FiveThirtyEight , и Рубен Фишер-Баум составили рейтинги Эло для каждой команды и сезона Национальной баскетбольной ассоциации в течение сезона 2014 года. [58] [59] В 2014 году FiveThirtyEight разработала рейтинги и прогнозы побед на основе Эло для Американской профессиональной Национальной футбольной лиги . [60]
Английская ассоциация корфбола оценивала команды на основе рейтингов Эло, чтобы определить гандикапы для их кубковых соревнований в сезоне 2011/12.
рейтинг игроков Национальной хоккейной лиги на основе Эло. Разработан [61] Показатель хоккея-Эло оценивает общую двустороннюю игру игрока: результативность И защита как в равной силе, так и в ситуациях игры в большинстве/убийства с пенальти.
Rugbyleagueratings.com использует рейтинговую систему Эло для ранжирования команд международных и клубных лиг регби .
Сайт Hemaratings.com был запущен в 2017 году и использует алгоритм Glicko-2 для ранжирования отдельных исторических европейских фехтовальщиков боевых искусств по всему миру в различных категориях, таких как длинный меч , рапира , историческая сабля и меч и баклер . [62]
Видеоигры и онлайн-игры
[ редактировать ]Во многих видеоиграх в соревновательном игровом процессе используются модифицированные системы Эло. MOBA League В игре of Legends перед вторым сезоном соревновательной игры использовалась рейтинговая система Эло. [63] Киберспортивная . игра Overwatch , основа уникальной Overwatch League профессиональной спортивной организации , использует производную от системы Эло для ранжирования конкурентоспособных игроков с различными корректировками, вносимыми между соревновательными сезонами [64] World of Warcraft ранее также использовала систему Glicko-2 для объединения и сравнения игроков Арены, но теперь использует систему, аналогичную TrueSkill от Microsoft . [65] В игре Puzzle Pirates используется рейтинговая система Эло для определения позиций в различных головоломках. Эта система также используется в FIFA Mobile для режимов Division Rivals. Еще одна недавняя игра, в которой начали использовать рейтинговую систему Elo, — это AirMech , в которой используется система Elo. [66] рейтинги для случайного/командного подбора игроков 1 на 1, 2 на 2 и 3 на 3. RuneScape 3 использовала систему Эло в переиздании мини-игры об охотнике за головами в 2016 году. [67] Mechwarrior Online ввела систему Elo для своего нового режима «Comp Queue», вступившего в силу с патчем от 20 июня 2017 года. [68] Age of Empires II DE и Age of Empires III DE используют систему Эло для своей таблицы лидеров и подбора игроков, при этом новые игроки начинают с Эло 1000. [69]
Немногие видеоигры используют оригинальную систему рейтингов Эло. По данным шахматного онлайн-сервера Lichess , система Эло устарела, и сейчас Glicko-2 используется многими шахматными организациями. [70] PlayerUnknown’s Battlegrounds — одна из немногих видеоигр, в которой используется самая первая система Эло. В Guild Wars рейтинги Эло используются для записи рейтинга гильдии, полученного и потерянного в сражениях между гильдиями. В 1998 году появилась онлайн-игровая лестница под названием Clanbase. [71] был запущен, в котором для ранжирования команд использовалась система подсчета очков Эло. Первоначальное значение K составляло 30, но было изменено на 5 в январе 2007 года, а затем изменено на 15 в июле 2009 года. [72] Позже в 2013 году сайт отключился. [73] Похожий альтернативный сайт был запущен в 2016 году под названием Scrimbase . [74] который также использовал систему подсчета очков Эло для ранжирования команд. С 2005 года Golden Tee Live оценивает игроков по системе Эло. Новые игроки начинают с 2100, рейтинг лучших игроков превышает 3000. [75]
Несмотря на то, что во многих видеоиграх используются разные системы подбора игроков , игроки в рейтинговые видеоигры обычно называют все рейтинги подбора игроков Эло .
Другое использование
[ редактировать ]Рейтинговая система Эло использовалась в мягкой биометрии , [76] который касается идентификации людей по человеческим описаниям. Сравнительные описания использовались вместе с рейтинговой системой Эло для обеспечения надежных и различительных «относительных измерений», позволяющих точную идентификацию.
Рейтинговая система Эло также использовалась в биологии для оценки иерархии доминирования самцов. [77] а также в области автоматизации и компьютерного зрения для проверки тканей . [78]
Более того, сайты онлайн-судей также используют рейтинговую систему Эло или ее производные. Например, Topcoder использует модифицированную версию, основанную на нормальном распределении: [79] в то время как Codeforces использует другую версию, основанную на логистическом распределении. [80] [81] [82]
Система рейтингов Эло также была отмечена в приложениях для знакомств, например, в приложении для поиска партнеров Tinder , которое использует вариант рейтинговой системы Эло. [83]
Ютубер Маркес Браунли и его команда использовали рейтинговую систему Elo, когда позволяли людям голосовать за цифровые фотографии, сделанные на разные модели смартфонов , выпущенные в 2022 году. [84]
Рейтинговая система Эло также использовалась в рейтингах колледжей в США , например, в рейтингах компании Parchment, занимающейся цифровыми учетными данными. [85] [86] [87]
Для оценки моделей ИИ также была принята рейтинговая система Elo. В 2021 году Anthropic использовала систему Elo для ранжирования моделей ИИ в своих исследованиях. [88] В таблице лидеров LMSYS на короткое время использовалась рейтинговая система Elo для ранжирования моделей ИИ. [89] до перехода к модели Брэдли-Терри . [90]
Упоминания в СМИ
[ редактировать ]Система рейтингов Эло широко освещалась в социальной сети во время сцены с алгоритмами, где Марк Цукерберг выпустил Facemash . В этой сцене Эдуардо Саверин пишет математические формулы для рейтинговой системы Эло на окне комнаты общежития Цукерберга. В фильме утверждается, что за кадром используется система Эло для ранжирования девушек по их привлекательности. Уравнения, управляющие алгоритмом, кратко показаны и записаны в окне; [91] однако они немного неверны. [ нужна ссылка ]
См. также
[ редактировать ]- Модель Брэдли – Терри
- Шахматная рейтинговая система , другие шахматные рейтинговые системы
- Удачи
- Рейтинговая система Глико , методы рейтингования, разработанные Марком Гликманом.
- Процентный индекс рейтинга (RPI), еще одна система, учитывающая силу оппонентов.
Примечания
[ редактировать ]- ^ Это пишется как «Эло», а не «ЭЛО», и обычно произносится как / ˈ iː l oʊ / или / ˈ ɛ l oʊ / на английском языке. Настоящее имя Эло произносится [ˈeːløː]. на венгерском языке.
Ссылки
[ редактировать ]Примечания
[ редактировать ]- ^ Jump up to: Перейти обратно: а б Эло, Арпад Э. (август 1967 г.). «Предлагаемая рейтинговая система USCF, ее развитие, теория и применение» (PDF) . Шахматная жизнь . XXII (8): 242–247.
- ^ По формуле 100%/(1 + 10 − Д /400 ) для D, равного 100 или 200.
- ^ Elo-MMR: рейтинговая система для массовых многопользовательских соревнований.
- ^ Редман, Тим (июль 2002 г.). «Вспоминая Ричарда, часть II» (PDF) . Шахматный бюллетень Иллинойса. Архивировано (PDF) из оригинала 30 июня 2020 г. Проверено 30 июня 2020 г.
- ^ Эло, Арпад Э. (5 марта 1960 г.). «Рейтинговая система USCF» (PDF) . Шахматная жизнь . XIV (13). ФСКФ : 2.
- ^ Эло 1986, с. 4
- ^ Эло, Арпад Э. (июнь 1961 г.). «Рейтинговая система USCF — научное достижение» (PDF) . Шахматная жизнь . XVI (6). USCF : 160–161.
- ^ «О ФСС» . Шахматная федерация США. Архивировано из оригинала 26 сентября 2008 г. Проверено 10 ноября 2008 г.
- ^ Эло 1986, Предисловие к первому изданию
- ^ Эло 1986.
- ^ Эло 1986, гл. 8.73.
- ^ Гликман, Марк Э., и Джонс, Албин К., «Рейтинг шахматной рейтинговой системы» (1999), Chance, 12, 2, 21-28.
- ^ Гликман, Марк Э. (1995), «Комплексное руководство по шахматным рейтингам». Последующая версия этой статьи появилась в American Chess Journal , 3, стр. 59–102.
- ^ Jump up to: Перейти обратно: а б Положение о рейтингах ФИДЕ вступает в силу с 1 июля 2017 года . ФИДЕ Онлайн (fide.com) (Отчет). ФИДЕ . Архивировано из оригинала 27 ноября 2019 г. Проверено 9 сентября 2017 г.
- ^ Эло 1986, стр. 159.
- ^ Jump up to: Перейти обратно: а б Система шахматных рейтингов США (PDF) (Отчет). 24 апреля 2017 г. Архивировано (PDF) из оригинала 7 февраля 2020 г. . Проверено 16 февраля 2020 г. - через gliko.net.
- ↑ Ананд проиграл Морозевичу номер 1 ( Chessbase, 24 августа 2008 г., Архивировано 10 сентября 2008 г. на Wayback Machine Wayback Machine ). ), затем вернул его, затем Карлсен взял номер 1 ( Chessbase, 5 сентября 2008 г., Архивировано 9 ноября 2012 г. на сайте the Wayback Machine ), затем Иванчук ( Chessbase, 11 сентября 2008 г., архивировано 13 сентября 2008 г. в Wayback Machine ) и, наконец, Топалов ( Chessbase, 13 сентября 2008 г., архивировано 15 сентября 2008 г. в Wayback Machine ).
- ^ Администратор. «Калькуляторы шахматного рейтинга ФИДЕ: Калькулятор изменения шахматного рейтинга» . Ratings.fide.com . Архивировано из оригинала 28 сентября 2017 г. Проверено 28 сентября 2017 г.
- ↑ Шахматная федерация США. Архивировано 18 июня 2012 г. в Wayback Machine.
- ^ Цитата из глоссария USCF: «игрок, который участвует в более чем 300 играх с рейтингом более 2200». Архивировано 8 марта 2013 г. в Wayback Machine Шахматной федерации США.
- ^ «Приближение формул для шахматной рейтинговой системы США». Архивировано 4 ноября 2019 г. в Wayback Machine , Шахматная федерация США , Марк Гликман, апрель 2017 г.
- ^ Эло 1986, гл. 1.12.
- ^ Хорошо, Эй Джей (1955). «Об маркировке шахматистов». Математический вестник . 39 (330): 292–296. дои : 10.2307/3608567 . JSTOR 3608567 . S2CID 158885108 .
- ^ Дэвид, ХА (1959). «Турниры и парные сравнения». Биометрика . 46 (1/2): 139–149. дои : 10.2307/2332816 . JSTOR 2332816 .
- ^ Травински, Би Джей; Дэвид, ХА (1963). «Выбор лучшего лечения в эксперименте парного сравнения» . Анналы математической статистики . 34 (1): 75–91. дои : 10.1214/aoms/1177704243 .
- ^ Бюльманн, Ганс; Хубер, Питер Дж. (1963). «Парное сравнение и ранжирование в турнирах» . Анналы математической статистики . 34 (2): 501–510. дои : 10.1214/aoms/1177704161 .
- ^ Эло 1986, с. 141, гл. 8.4& Логистическая вероятность как основа рейтинга
- ^ «Рейтинговая система Эло – корректировка таблиц ожиданий» . 30 марта 2011 г.
- ^ Эло 1986, гл. 8,73
- ^ Ключевая статья Sonas: Сонас, Джефф. «Рейтинговая формула Сонас — лучше, чем Эло?» . www.chessbase.com . Архивировано из оригинала 5 марта 2005 г. Проверено 1 мая 2005 г.
- ^ Jump up to: Перейти обратно: а б Положение о рейтингах ФИДЕ вступает в силу с 1 июля 2014 года . ФИДЕ Онлайн (fide.com) (Отчет). ФИДЕ . 01 июля 2014 г. Архивировано из оригинала 1 июля 2014 г. Проверено 1 июля 2014 г.
- ^ Положение о рейтингах ФИДЕ действует с 1 июля 2013 года по 1 июля 2014 года . ФИДЕ Онлайн (fide.com) (Отчет). 01 июля 2013 г. Архивировано из оригинала 15 июля 2014 г. Проверено 1 июля 2014 г.
- ^ «Изменения в Рейтинговое Положение» . FIDE Online (fide.com) (пресс-релиз). ФИДЕ . 21 июля 2011 г. Архивировано из оригинала 13 мая 2012 г. Проверено 19 февраля 2012 г.
- ^ « К -фактор» . Chessclub.com . Помощь ИКЦ. 18 октября 2002 г. Архивировано из оригинала 13 марта 2012 г. Проверено 19 февраля 2012 г.
- ^ Кирали, Ф.; Цянь, З. (2017). «Моделирование соревновательных видов спорта: модели Брэдли-Терри-Эло для контролируемого и онлайн-обучения результатов парных соревнований». arXiv : 1701.08055 [ stat.ML ].
- ^ Jump up to: Перейти обратно: а б с Щецинский, Лешек; Джебби, Аймен (01 сентября 2020 г.). «Понимание ничьей в алгоритме рейтинга Эло» . Журнал количественного анализа в спорте . 16 (3): 211–220. дои : 10.1515/jqas-2019-0102 . ISSN 1559-0410 . S2CID 219784913 .
- ^ Дэвидсон, Роджер Р. (1970). «О расширении модели Брэдли-Терри для учета связей в парных сравнительных экспериментах» . Журнал Американской статистической ассоциации . 65 (329): 317–328. дои : 10.2307/2283595 . ISSN 0162-1459 . JSTOR 2283595 .
- ↑ Руководство для родителей по шахматам. Архивировано 28 мая 2008 г. в Wayback Machine Skittles , Дон Хейсман, Chesscafe.com, 4 августа 2002 г.
- ^ «Новости шахмат – План Нанна на чемпионат мира по шахматам» . ChessBase.com. 8 июня 2005 г. Архивировано из оригинала 19 ноября 2011 г. Проверено 19 февраля 2012 г.
- ^ Jump up to: Перейти обратно: а б «Представляем очки Planeswalker-а» . 6 сентября 2011 года. Архивировано из оригинала 30 сентября 2011 года . Проверено 9 сентября 2011 г.
- ^ Jump up to: Перейти обратно: а б «Добираемся до точек» . 9 сентября 2011 года. Архивировано из оригинала 18 октября 2016 года . Проверено 9 сентября 2011 г.
- ^ Jump up to: Перейти обратно: а б Джефф Сонас (27 июля 2009 г.). «Рейтинговая инфляция – ее причины и возможные пути решения» . www.chessbase.com . Архивировано из оригинала 23 ноября 2013 года . Проверено 27 августа 2009 г.
- ^ Jump up to: Перейти обратно: а б «Вишванатан Ананд» . Chessgames.com. Архивировано из оригинала 28 марта 2013 г. Проверено 14 августа 2012 г.
- ^ Риган, Кеннет; Хаворт, Гай (4 августа 2011 г.). «Внутренние шахматные рейтинги» . Материалы конференции AAAI по искусственному интеллекту . 25 (1): 834–839. дои : 10.1609/aaai.v25i1.7951 . ISSN 2374-3468 . S2CID 15489049 . Архивировано из оригинала 20 апреля 2021 г. Проверено 1 сентября 2021 г.
- ^ Бергерсен, Пер А. «ЭЛО-СИСТЕМЕТ» (на норвежском языке). Норвежская шахматная федерация. Архивировано из оригинала 8 марта 2013 года . Проверено 21 октября 2013 г.
- ^ Jump up to: Перейти обратно: а б с Разговор с Марком Гликманом [1] Архивировано 7 августа 2011 г. в Wayback Machine , опубликовано в Chess Life за октябрь 2006 г.
- ^ «Эло-системет» . Норвежский Сьяккфорбунд . Архивировано из оригинала 5 декабря 2013 года . Проверено 23 августа 2009 г.
- ^ Ларри Кауфман, Варианты шахматной доски (2021), с. 179
- ^ «Объяснение рейтингов нард» . Результаты.ukbgf.com . Архивировано из оригинала 14 ноября 2019 г. Проверено 01 июня 2020 г.
- ^ «Играй! Словарь покемонов: Эло» . Архивировано из оригинала 15 января 2015 года . Проверено 15 января 2015 г.
- ^ Лайонс, Кейт (10 июня 2014 г.). «Каковы мировые футбольные рейтинги Эло?» . Разговор . Архивировано из оригинала 15 июня 2019 года . Проверено 3 июля 2019 г.
- ^ Сильвер, Нейт (28 июня 2006 г.). «Ложь, наглая ложь: мы Эло?» . Архивировано из оригинала 22 августа 2006 г. Проверено 13 января 2023 г.
- ^ «Коэффициенты после сезона, версия ELO» . Baseballprospectus.com. Архивировано из оригинала 7 марта 2012 г. Проверено 19 февраля 2012 г.
- ^ Коул, Брайан (15 августа 2014 г.). «Рейтинги Эло по международному бейсболу» . Оценка за пределами коробки . СБ Нация . Архивировано из оригинала 2 января 2016 года . Проверено 4 ноября 2015 г.
- ^ «Рафа — КОЗЕЛ глины?» . 8 мая 2018 г. Архивировано из оригинала 27 февраля 2021 г. Проверено 22 августа 2018 г.
- ^ «Трейт Фарго» . Проверено 31 марта 2022 г.
- ^ «Пересмотр мирового рейтинга ФИФА/Coca-Cola» (PDF) . ФИФА. Июнь 2018 г. Архивировано из оригинала (PDF) 12 июня 2018 г. Проверено 30 июня 2020 г.
- ^ Сильвер, Нейт; Фишер-Баум, Рубен (21 мая 2015 г.). «Как мы рассчитываем рейтинги Эло НБА» . ПятьТридцатьВосемь . Архивировано из оригинала 23 мая 2015 г.
- ^ Рубен Фишер-Баум и Нейт Сильвер, «Полная история НБА», FiveThirtyEight, 21 мая 2015 г. [2] Архивировано 23 мая 2015 г. в Wayback Machine.
- ^ Сильвер, Нейт (4 сентября 2014 г.). «Представляем рейтинги Эло НФЛ» . ПятьТридцатьВосемь. Архивировано из оригинала 12 сентября 2015 года. Пейн, Нил (10 сентября 2015 г.). «Рейтинги Эло НФЛ вернулись» . ПятьТридцатьВосемь. Архивировано из оригинала 11 сентября 2015 года . .
- ^ «Революция хоккейной статистики – как команды выбирают игроков?» . Революция в хоккейной статистике . Архивировано из оригинала 2 октября 2016 г. Проверено 29 сентября 2016 г.
- ^ «О рейтингах — Рейтинги Хема» . Гемарации . Проверено 30 января 2024 г.
- ^ «Сватовство | LoL — League of Legends» . На.leagueoflegends.com. 06.07.2010. Архивировано из оригинала 26 февраля 2012 г. Проверено 19 февраля 2012 г.
- ^ «Добро пожаловать в 8-й сезон соревновательной игры» . PlayOverwatch.com . Близзард Развлечения. Архивировано из оригинала 12 марта 2018 года . Проверено 11 марта 2018 г.
- ^ «World of Warcraft Europe -> Арена» . Wow-europe.com. 14 декабря 2011 г. Архивировано из оригинала 23 сентября 2010 г. Проверено 19 февраля 2012 г.
- ^ «Разработчик AirMech объясняет, почему они используют Elo» . Архивировано из оригинала 17 февраля 2015 года . Проверено 15 января 2015 г.
- ^ [3] [ мертвая ссылка ]
- ^ «МВО: Новости» . mwomercs.com . Архивировано из оригинала 27 августа 2018 г. Проверено 27 июня 2017 г.
- ^ «Age of Empires II: Таблицы лидеров DE — Age of Empires» . 14 ноября 2019 года. Архивировано из оригинала 27 января 2022 года . Проверено 27 января 2022 г.
- ^ «Часто задаваемые вопросы: рейтинги» . lichess.org . Архивировано из оригинала 02 апреля 2019 г. Проверено 11 ноября 2020 г.
- ^ «Запись Wayback Machine на Clanbase.com» . Архивировано из оригинала 05.11.2017 . Проверено 29 октября 2017 г.
- ^ «Гильдийная лестница» . Wiki.guildwars.com. Архивировано из оригинала 1 марта 2012 г. Проверено 19 февраля 2012 г.
- ^ «Прощальное послание клановой базы» . Архивировано из оригинала 24 декабря 2013 г. Проверено 29 октября 2017 г.
- ^ «Игровая лестница Scrimbase» . Архивировано из оригинала 30 октября 2017 г. Проверено 29 октября 2017 г.
- ^ «Страница рейтинга болельщиков игроков «Золотой футболки»» . 26 декабря 2007 г. Архивировано из оригинала 1 января 2014 г. Проверено 31 декабря 2013 г.
- ^ «Использование сравнительных описаний человека для мягкой биометрии». Архивировано 8 марта 2013 г. в Wayback Machine , Д. А. Рид и М. С. Никсон, Международная совместная конференция по биометрии (IJCB), 2011 г.
- ^ Першманн; и др. (2010). «Репродуктивный успех самца и его поведенческие корреляты у полигинного млекопитающего, галапагосского морского льва (Zalophus wollebaeki)». Молекулярная экология . 19 (12): 2574–86. дои : 10.1111/j.1365-294X.2010.04665.x . ПМИД 20497325 . S2CID 19595719 .
- ^ Цанг; и др. (2016). «Проверка ткани по методу рейтинга Эло» . Распознавание образов . 51 : 378–394. Бибкод : 2016PatRe..51..378T . дои : 10.1016/j.patcog.2015.09.022 . hdl : 10722/229176 . Архивировано из оригинала 05.11.2020 . Проверено 5 мая 2020 г.
- ^ «Рейтинговая система конкурса алгоритмов» . 23 декабря 2009. Архивировано из оригинала 2 сентября 2011 года . Проверено 16 сентября 2011 г.
- ^ «Часто задаваемые вопросы: Каковы рейтинг и дивизионы?» . Архивировано из оригинала 25 сентября 2011 года . Проверено 16 сентября 2011 г.
- ^ «Рейтинговое распределение» . Архивировано из оригинала 13 октября 2011 года . Проверено 16 сентября 2011 г.
- ^ «По поводу рейтинга: Часть 2» . Архивировано из оригинала 13 октября 2011 года . Проверено 16 сентября 2011 г.
- ^ «Сватовство в Tinder больше похоже на Warcraft, чем вы думаете – Kill Screen» . Экран убийства . 14 января 2016 г. Архивировано из оригинала 19 августа 2017 г. Проверено 19 августа 2017 г.
- ^ «Лучшая камера смартфона 2022 года!» . Ютуб . 22 декабря 2022 г. Проверено 7 января 2023 г.
- ^ Эйвери, Кристофер Н .; Гликман, Марк Э.; Хоксби, Кэролайн М.; Метрик, Эндрю (01 февраля 2013 г.). «Раскрытый рейтинг предпочтений колледжей и университетов США». Ежеквартальный экономический журнал . 128 (1): 425–467. дои : 10.1093/qje/qjs043 .
- ^ Ирвин, Нил (4 сентября 2014 г.). «Почему у колледжей с четкой специализацией есть скрытое преимущество» . Итог . Нью-Йорк Таймс . Проверено 9 мая 2023 г.
- ^ Селинго, Джеффри Дж. (23 сентября 2015 г.). «Когда у студентов есть выбор среди лучших колледжей, какой из них они выбирают?» . Вашингтон Пост . Проверено 9 мая 2023 г.
- ^ Аскелл, Аманда; Бай, Юньтао; Чен, Анна; Слейте, Рассвет; Гангули, Глубокий; Хениган, Том; Джонс, Энди; Джозеф, Николас; Манн, Бен (09 декабря 2021 г.). «Ассистент общего языка как лаборатория выравнивания». arXiv : 2112.00861 [ cs.CL ].
- ^ «Таблица лидеров Chatbot Arena, неделя 8: Представляем MT-Bench и Vicuna-33B | LMSYS Org» . lmsys.org . Проверено 28 февраля 2024 г.
- ^ «Арена чат-ботов: новые модели и обновление системы Elo | LMSYS Org» . lmsys.org . Проверено 28 февраля 2024 г.
- ^ Сценарий для социальной сети , Sony Pictures, заархивировано 4 сентября 2012 г. в Wayback Machine , стр. 16
Источники
[ редактировать ]- Эло, Арпад (1986) [1-й паб. 1978]. Рейтинг шахматистов прошлого и настоящего (Второе изд.). Arco Publishing, Inc. Нью-Йорк: ISBN 978-0-668-04721-0 .
Дальнейшее чтение
[ редактировать ]- Харкнесс, Кеннет (1967). Официальный справочник по шахматам . Маккей.