Jump to content

Прогнозы статистической ассоциации на футбол

Статистическое предсказание футбола — это метод, используемый в ставках на спорт для прогнозирования исхода футбольных матчей с помощью статистических инструментов. Цель статистического прогноза матча – превзойти прогнозы букмекеров. [ нужна ссылка ] [ сомнительно обсудить ] , которые используют их для установления ставок на исход футбольных матчей.

Наиболее широко используемый статистический подход к прогнозированию – ранжирование . Системы футбольных рейтингов присваивают рейтинг каждой команде на основе результатов ее прошлых игр, так что наивысший рейтинг присваивается сильнейшей команде. Исход матча можно предсказать, сравнив ранги соперников. Существует несколько различных систем футбольных рейтингов, например, широко известными являются Мировые рейтинги ФИФА или Мировые футбольные рейтинги Эло .

Есть три основных недостатка прогнозов на футбольные матчи, основанных на рейтинговых системах:

  1. Ранги, присвоенные командам, не различают их атакующую и оборонительную силу.
  2. Ранги представляют собой накопленные средние значения, которые не учитывают изменения навыков футбольных команд.
  3. Основная цель рейтинговой системы — не предсказывать результаты футбольных матчей, а сортировать команды по их средней силе.

Другой подход к футбольному прогнозированию известен как рейтинговые системы . Хотя рейтинг относится только к порядку команд, рейтинговые системы присваивают каждой команде постоянно масштабируемый показатель силы. Причем рейтинг может присваиваться не только команде, но и ее силе в атаке и защите, преимуществу своего поля или даже навыкам каждого игрока команды (по мнению Штерна). [1] ).

Публикации о статистических моделях футбольных прогнозов начали появляться с 90-х годов, но первая модель была предложена гораздо раньше Морони, [2] который опубликовал свой первый статистический анализ результатов футбольных матчей в 1956 году. Согласно его анализу, как распределение Пуассона , так и отрицательное биномиальное распределение адекватно соответствовали результатам футбольных игр. Серии передач мяча между игроками во время футбольных матчей были успешно проанализированы Рипом и Бенджамином с использованием отрицательного биномиального распределения. [3] в 1968 году. Они усовершенствовали этот метод в 1971 году, а в 1974 году Хилл [4] показали, что результаты футбольных матчей в некоторой степени предсказуемы, а не просто случайны.

Первую модель, предсказывающую исходы футбольных матчей между командами с разным уровнем квалификации, предложил Майкл Махер. [5] в 1982 году. Согласно его модели, голы, которые забивают соперники во время игры, извлекаются из распределения Пуассона . Параметры модели определяются разницей между атакующими и защитными навыками, скорректированной с учетом коэффициента преимущества домашнего поля. Методы моделирования фактора преимущества своего поля были обобщены в статье Карнеи и Каррона. [6] в 1992 году. Зависимость силы команды от времени была проанализирована Кнорр-Хельдом. [7] в 1999 году. Он использовал рекурсивную байесовскую оценку для оценки футбольных команд: этот метод был более реалистичным по сравнению с футбольными прогнозами, основанными на обычной средней статистике.

Методы прогнозирования футбола

[ редактировать ]

Все методы прогнозирования можно разделить на категории по типу турнира, зависимости от времени и алгоритму регрессии. Методы прогнозирования футбола различаются в зависимости от турнира по круговой системе и соревнований на выбывание . Методы соревнований на выбывание обобщены в статье Диего Куонена. [8]

В таблице ниже приведены методы, относящиеся к турнирам по круговой системе .

# Код Метод прогнозирования Алгоритм регрессии Зависимость от времени Производительность
1. ТИЛС Независимый от времени рейтинг наименьших квадратов Линейная регрессия наименьших квадратов Нет Бедный
2. ТИПР Независимая от времени регрессия Пуассона Максимальная вероятность Нет Середина
3. ТИСР Независимая от времени Скеллама регрессия Максимальная вероятность Нет Середина
4. ТДПР Зависимая от времени регрессия Пуассона Максимальная вероятность Фактор временного сброса Высокий
5. ТДМК Зависящая от времени цепь Маркова Монте-Карло цепи Маркова Модель Высокий

Независимый от времени рейтинг наименьших квадратов

[ редактировать ]

Этот метод предназначен для присвоения каждой команде в турнире непрерывно масштабируемого значения рейтинга, так что сильнейшая команда будет иметь самый высокий рейтинг. Метод основан на предположении, что рейтинг, присваиваемый командам-соперникам, пропорционален исходу каждого матча.

Предположим, что команды A, B, C и D играют в турнире и исходы матчей следующие:

Соответствовать # Хозяева поля Счет Гости И
1 А 3 - 1 Б
2 С 2 - 1 Д
3 Д 1 - 4 Б
4 А 3 - 1 Д
5 Б 2 - 0 С

Хотя рейтинги , , и команд A, B, C и D соответственно неизвестны, можно предположить, что исход матча №1 пропорционален разнице рангов команд A и B: . Таким образом, соответствует разнице баллов и это наблюдение за шумом. Такое же предположение можно сделать для всех матчей турнира:

Введя матрицу выбора X, приведенные выше уравнения можно переписать в компактной форме:

Элементы матрицы выбора могут иметь значения 1, 0 или -1, где 1 соответствует командам хозяев, а -1 командам гостей:

Если матрица имеет полный ранг, алгебраическое решение системы можно найти методом наименьших квадратов :

Если нет, то можно использовать псевдообратку Мура – ​​Пенроуза, чтобы получить:

Окончательные параметры рейтинга: В этом случае самый высокий рейтинг имеет сильнейшая команда. Преимущество этого метода рейтинга по сравнению со стандартными системами рейтинга заключается в том, что числа непрерывно масштабируются, определяя точную разницу между сильными сторонами команд.

Независимая от времени регрессия Пуассона

[ редактировать ]

Согласно этой модели (Махер [5] ), если и – это голы, забитые в матче, где команда i играет против команды j, тогда:

и являются независимыми случайными величинами со средними значениями и . Таким образом, совместная вероятность того, что команда хозяев забьет x голов, а команда гостей забьет y голов, является произведением двух независимых вероятностей:

в то время как обобщенная лог-линейная модель для и по словам Куонена [8] и Ли [9] определяется как: и , где относится к атакующей и оборонительной силе, а также к преимуществу своего поля соответственно. и являются поправочными коэффициентами, которые представляют собой количество голов, забитых в течение сезона командами хозяев и гостей.

Предполагая, что C означает количество команд, участвующих в сезоне, а N означает количество матчей, сыгранных к настоящему моменту, силу команды можно оценить путем минимизации отрицательной логарифмической функции правдоподобия по отношению к и :

При условии и известны атакующие и оборонительные силы команды и преимущество домашней площадки которые минимизируют отрицательное логарифмическое правдоподобие, можно оценить с помощью максимизации ожидания :

Усовершенствования этой модели были предложены Марком Диксоном (статистиком) и Стюартом Коулзом. [10] Они изобрели коэффициент корреляции для низких оценок 0–0, 1–0, 0–1 и 1–1, где независимая модель Пуассона не работает. Димитрис Карлис и Иоаннис Нцуфрас [11] построил независимую от времени модель распределения Скеллама. В отличие от модели Пуассона, которая описывает распределение очков, модель Скеллама описывает разницу между счетами дома и на выезде.

Зависящая от времени цепь Маркова Монте-Карло

[ редактировать ]

С одной стороны, статистические модели требуют большого количества наблюдений для точной оценки своих параметров. А когда в течение сезона наблюдений недостаточно (а это обычно бывает), имеет смысл работать со средней статистикой. С другой стороны, хорошо известно, что навыки команды меняются в течение сезона, что делает параметры модели зависящими от времени. Марк Диксон (статистик) и Коулз [10] попытались решить этот компромисс, придав больший вес последним результатам матчей. Рю и Салвесен [12] представила новый метод оценки, зависящий от времени, с использованием модели цепи Маркова.

Они предложили изменить приведенную выше обобщенную линейную модель для и :

при условии соответствует разнице сил между командами i и j. Параметр затем представляет психологические эффекты, вызванные недооценкой силы противоборствующих команд.

Согласно модели, атакующая сила команды А можно описать стандартными уравнениями броуновского движения: , на время :

где и относятся к потере скорости памяти и к дисперсии предыдущей атаки соответственно.

Эта модель основана на предположении, что:

Предположим, что в турнире участвуют три команды A, B и C и матчи проводятся в следующем порядке: : АБ; : переменный ток; : BC, совместная плотность вероятности может быть выражена как:

Поскольку аналитическая оценка параметров в этом случае затруднительна, метод Монте-Карло для оценки параметров модели применяется .

Использование для других видов спорта

[ редактировать ]

Модели, используемые для футбольных ассоциаций, могут использоваться для других видов спорта с таким же подсчетом голов (очков), например, хоккея с шайбой , водного поло , хоккея на траве , флорбола и т. д. Марек, Чупал и Шедива (2014). [13] опираться на исследования Махера (1982), [5] Диксон и Коулз (1997), [10] и другие, кто использовал модели для футбольных ассоциаций . Они представили четыре модели для хоккея :

  • Модель распределения двойного Пуассона (такая же, как у Махера (1982) [5] ),
  • Модель двумерного распределения Пуассона, использующая обобщение двумерного распределения Пуассона , допускающее отрицательную корреляцию между случайными величинами (это распределение было введено в Famoye (2010). [14] ).
  • Диагональные завышенные версии двух предыдущих моделей (по мотивам Диксона и Коулза (1997) [10] ), где вероятности ничьей 0:0, 1:1, 2:2, 3:3, 4:4 и 5:5 моделируются с дополнительными параметрами.

Более старая информация (результаты) не учитывается в процессе оценки во всех четырех моделях. Модели демонстрируются в высшей хоккейной лиге Чехии – Чешской Экстралиге в период с сезонов 1999/2000 и 2011/2012. Результаты успешно используются при фиктивных ставках против букмекерских контор.

  1. ^ Стерн Хэл. (1995) Кто номер 1 в студенческом футболе?... И как мы можем решить? Шанс, Лето, 7–14.
  2. ^ Морони MJ (1956) Факты из цифр . 3-е издание, Пингвин, Лондон.
  3. ^ Рип К. Бенджамин Б. (1968) Мастерство и шанс в футбольном союзе . Журнал Королевского статистического общества, серия A, 131, 581–585.
  4. ^ Hill ID (1974), Футбольная ассоциация и статистические выводы . Прикладная статистика, 23, 203-208.
  5. ^ Перейти обратно: а б с д Махер М.Дж. (1982), Футбольная ассоциация модельеров . Статистика Нирландики, 36, 109-118
  6. ^ Caurneya KS и Carron AV (1992) Преимущество дома в спортивных соревнованиях: обзор литературы . Журнал физиологии спорта и физических упражнений, 14, 13–27.
  7. ^ Кнорр-Хельд, Леонхард (1997) Динамический рейтинг спортивных команд . (ПЕРЕСМОТРЕННАЯ ВЕРСИЯ 1999 г.). Центр совместных исследований 386, документ для обсуждения 98
  8. ^ Перейти обратно: а б Диего Куонен (1996) Статистические модели для футбольных турниров на выбывание
  9. ^ Lee AJ (1997) Моделирование результатов в Премьер-лиге: действительно ли «Манчестер Юнайтед» лучший . Шанс, 10, 15-19
  10. ^ Перейти обратно: а б с д Марк Дж. Диксон и Коулз С.Г. (1997) Ассоциация моделирования футбольных результатов и неэффективности на рынке футбольных ставок , Прикладная статистика, Том 46, Выпуск 2, 265-280
  11. ^ Димитрис Карлис и Иоаннис Нцуфрас (2007) Байесовское моделирование футбольных результатов: использование распределения Скеллама для разницы мячей
  12. ^ Рю Х. и Салвесен Ø. (1999) Прогнозирование и ретроспективный анализ футбольных матчей в лиге . Технический отчет. Норвежский университет науки и технологий, Тронхейм.
  13. ^ Марек, Патрис; Шедива, Бланка; Чупал, Томаш (2014). «Моделирование и прогнозирование результатов хоккейных матчей» . Журнал количественного анализа в спорте . 10 (3): 357–365. дои : 10.1515/jqas-2013-0129 . ISSN   1559-0410 . S2CID   199575279 – через Research Gate.
  14. ^ Фамойе, Ф (2010). «Новое двумерное обобщенное распределение Пуассона». Статистика Неерландики . 64 : 112–124. дои : 10.1111/j.1467-9574.2009.00446.x . S2CID   120921695 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b96dba99ecfcf3dd9ee04342675bb15f__1721971680
URL1:https://arc.ask3.ru/arc/aa/b9/5f/b96dba99ecfcf3dd9ee04342675bb15f.html
Заголовок, (Title) документа по адресу, URL1:
Statistical association football predictions - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)