Jump to content

Пифагорейское ожидание

Пифагорово ожидание — это формула спортивной аналитики , разработанная Биллом Джеймсом для оценки процента игр, которые бейсбольная команда «должна» выиграть, исходя из количества ранов забитых и пропущенных . Сравнивая фактический процент побед команды и процент побед по Пифагору, можно использовать для прогнозирования и оценки того, какие команды работают лучше, а какие — хуже. Название происходит от сходства формулы с теоремой Пифагора . [1]

Основная формула:

где Win Ratio — это коэффициент выигрыша, полученный по формуле. Ожидаемое количество побед будет равно ожидаемому коэффициенту выигрыша, умноженному на количество сыгранных игр.

Эмпирическое происхождение

[ редактировать ]

Эмпирически эта формула довольно хорошо коррелирует с тем, как на самом деле выступают бейсбольные команды. Однако статистики с момента изобретения этой формулы обнаружили, что она содержит довольно обычную ошибку, обычно возникающую примерно в трех играх.

Например, в 2002 году «Нью-Йорк Янкиз» набрали 897 очков и пропустили 697 очков: согласно исходной формуле Джеймса, «Янкиз» должны были финишировать с процентом побед 0,624.

Судя по сезону из 162 игр, «Янкиз» 2002 года должны были закончить со счетом 101–61: на самом деле они закончили со счетом 103–58. [2]

Пытаясь исправить эту рутинную ошибку, статистики провели многочисленные поиски идеального показателя степени.

При использовании одночислового показателя наиболее точным является значение 1,83, которое используется на сайте baseball-reference.com. [3] Таким образом, обновленная формула выглядит следующим образом:

Наиболее известна формула Пифагенпорта. [4] разработано Клэем Давенпортом из Baseball Prospectus :

Он пришел к выводу, что показатель степени следует рассчитывать для конкретной команды на основе забитых очков команды, разрешенных пробежек и игр. Не сводя показатель степени к единому числу для команд в любом сезоне, Давенпорт смог сообщить о среднеквадратической ошибке 3,991, в отличие от среднеквадратической ошибки 4,126 для показателя степени 2. [4]

Менее известен, но столь же (если не более) эффективен метод Формула Пифагенпата , разработанная Дэвидом Смитом. [5]

Давенпорт выразил поддержку этой формуле, заявив:

После дальнейшего анализа я (Клэй) пришел к выводу, что так называемый метод Смита/Патриота, известный как Пифагенпат, лучше подходит. В этом случае X = (( rs + ra )/ g ) 0.287 , хотя в отношении показателя степени есть место для разногласий. В любом случае, это уравнение проще, элегантнее и дает лучший ответ в более широком диапазоне забитых ранов, чем Пифагенпорт, включая обязательное значение 1 на 1 подбор. [6]

Эти формулы необходимы только в экстремальных ситуациях, в которых среднее количество забитых ранов за игру либо очень велико, либо очень мало. В большинстве ситуаций простое возведение каждой переменной в квадрат дает точные результаты.

Существуют некоторые систематические статистические отклонения между фактическим процентом выигрышей и ожидаемым процентом выигрышей, которые включают качество КПЗ и удачу. Кроме того, формула имеет тенденцию возвращаться к среднему значению , поскольку команды, которые выигрывают много игр, как правило, недостаточно представлены в формуле (это означает, что они «должны были» выиграть меньше игр), а команды, которые проигрывают много игр, как правило, перепредставлены (они «должны были» выиграть больше).

Ярким примером являются «Техас Рейнджерс» 2016 года , которые побили прогнозируемый рекорд на 13 игр, финишировав со счетом 95–67, имея ожидаемый рекорд побед и поражений 82–80.

Победы «второго порядка» и «третьего порядка»

[ редактировать ]

В своем отчете о скорректированном положении [7] В Бейсбольном проспекте упоминаются различные «порядки» побед команды. Основной порядок побед — это просто количество выигранных игр. Однако, поскольку послужной список команды может не отражать ее истинный талант из-за удачи, были разработаны различные меры измерения таланта команды.

Выигрыши первого порядка, основанные на чистом дифференциале пробега , представляют собой количество ожидаемых выигрышей, полученных по формуле «питагенпорта» (см. выше). Кроме того, чтобы дополнительно отфильтровать искажения удачи, специалисты по саберметрике команды могут также рассчитать ожидаемые забитые и разрешенные пробеги с помощью уравнения типа «созданные пробежки» (наиболее точным на уровне команды являются «Базовые пробежки »). Эти формулы дают ожидаемое количество ранов команды с учетом ее наступательных и защитных характеристик (общее количество одиночных, парных, прогулок и т. д.), что помогает исключить фактор удачи, связанный с порядком, в котором попадания и прогулки команды пришлись на иннинг. Используя эту статистику, специалисты по саберметрике могут подсчитать, сколько очков команда «должна» забить или пропустить.

Подключив эти ожидаемые забитые и разрешенные раны к формуле Пифагора, можно получить победы второго порядка - количество побед, которых заслуживает команда, исходя из количества ранов, которые они должны были забить и пропустить, с учетом их составляющих атакующих и защитных характеристик. Победы третьего порядка — это победы второго порядка, которые были скорректированы с учетом силы графика (качества подачи и удара противника). Показан процент выигрышей второго и третьего порядка. [ по мнению кого? ] чтобы предсказать будущий фактический процент побед команды лучше, чем фактический процент побед и процент побед первого порядка. [ нужна ссылка ]

Теоретическое объяснение

[ редактировать ]

Первоначально корреляция между формулой и фактическим процентом выигрышей была просто экспериментальным наблюдением. В 2003 году Хейн Хундал предоставил неточный вывод формулы и показал, что показатель Пифагора составляет примерно 2/( σ π ), где σ — стандартное отклонение результатов, набранных всеми командами, деленное на среднее количество набранных очков. [8] В 2006 году профессор Стивен Дж. Миллер предоставил статистический вывод формулы [9] при некоторых предположениях относительно бейсбольных игр: если пробежки для каждой команды соответствуют распределению Вейбулла , а забитые и разрешенные пробежки за игру статистически независимы , то формула дает вероятность победы. [9]

Проще говоря, формула Пифагора с показателем степени 2 следует сразу из двух предположений: что бейсбольные команды выигрывают пропорционально их «качеству», и что их «качество» измеряется соотношением забитых ими очков к разрешенным пробегам. Например, если команда А забила 50 очков и пропустила 40, ее показатель качества будет 50/40 или 1,25. Показатель качества для команды (коллективного) противника B в играх, сыгранных против A, будет 40/50 (поскольку раны, набранные A, являются ранами, разрешенными B, и наоборот), или 0,8. Если каждая команда выигрывает пропорционально своему качеству, вероятность победы А будет равна 1,25 / (1,25 + 0,8), что равно 50. 2  / (50 2  + 40 2 ), формула Пифагора. То же соотношение справедливо для любого количества засчитанных и разрешенных пробежек, в чем можно убедиться, записав вероятность «качества» как [50/40] / [50/40 + 40/50] и очистив дроби .

Предположение о том, что одним из показателей качества команды является соотношение забитых и разрешенных пробежек, является одновременно естественным и правдоподобным; это формула, по которой определяются индивидуальные победы (игры). [Есть и другие естественные и правдоподобные кандидаты для измерения качества команды, которые, если принять «качественную» модель, приводят к соответствующим формулам ожидания процента побед, которые примерно столь же точны, как и формулы Пифагора.] Предположение о том, что бейсбольные команды выигрывают пропорционально своим качество не является естественным, но правдоподобным. Это неестественно, поскольку степень победы спортсменов пропорционально их качествам зависит от роли случайности в спорте. Если случайность играет очень большую роль, то даже команда гораздо более высокого качества, чем ее соперники, будет выигрывать лишь немногим чаще, чем проигрывать. Если случайность играет очень небольшую роль, то команда, качество которой лишь немного выше, чем у ее оппонентов, будет выигрывать гораздо чаще, чем проигрывать. Последнее в большей степени характерно для баскетбола по разным причинам, в том числе потому, что набирается гораздо больше очков, чем в бейсболе (давая команде с более высоким качеством больше возможностей продемонстрировать это качество и, соответственно, меньшим количеством шансов на случай или удачу, позволяющих команде более низкого качества качественная команда для победы.)

В бейсболе ровно столько шансов, сколько необходимо для того, чтобы позволить командам выиграть примерно пропорционально их качеству, то есть получить примерно пифагорейский результат со второй степенью. Более высокий показатель баскетбола, составляющий около 14 (см. ниже), объясняется меньшей ролью случайности в баскетболе. Тот факт, что наиболее точный (постоянный) показатель Пифагора для бейсбола составляет около 1,83, то есть немного меньше 2, можно объяснить тем фактом, что в бейсболе (очевидно) немного больше шансов, чем позволяло бы командам выиграть, точно пропорционально их качество. Билл Джеймс осознал это давно, когда заметил, что повышение точности его исходной формулы Пифагора со второй степенью может быть достигнуто путем простого добавления некоторого постоянного числа к числителю и удвоенной константы к знаменателю. Это приближает результат немного ближе к 0,500, что и дает немного большая роль случайности, а также то же самое дает использование показателя степени 1,83 (или любого положительного показателя степени меньше двух). Можно попробовать использовать различные кандидаты на эту константу, чтобы увидеть, что лучше всего соответствует реальным данным.

Тот факт, что наиболее точным показателем степени для бейсбольных формул Пифагора является переменная, зависящая от общего количества ранов за игру, также объясняется ролью случайности, поскольку чем больше общее количество ранов набрано, тем меньше вероятность того, что результат будет обусловлен на случайность, а не на более высокое качество команды-победителя, проявившееся во время голевых моментов. Чем больше показатель степени, тем дальше от процента выигрышей 0,500 находится результат соответствующей формулы Пифагора, что является тем же эффектом, который создает уменьшение роли случайности. Тот факт, что точные формулы для переменных показателей дают более высокие показатели по мере увеличения общего количества пробежек за игру, согласуется с пониманием роли, которую случайность играет в спорте.

В своем «Бейсбольном реферате» 1981 года Джеймс подробно разработал еще одну из своих формул, названную формулой log5 (которая с тех пор доказала свою эмпирическую точность), используя представление о том, что две команды имеют процент побед в личных встречах друг с другом пропорционально «качественная» мера. Его мерой качества была половина «коэффициента побед» команды (или «шансов на победу»). Коэффициент побед или шансы на победу — это отношение побед команды над лигой к ее поражениям против лиги. [Джеймс, похоже, в то время не осознавал, что его мера качества выражается через соотношение побед. Поскольку в модели качества любой постоянный фактор в показателе качества в конечном итоге отменяется, сегодня мерой качества лучше считать просто соотношение выигрышей, а не его половину.] Затем он заявил, что формула Пифагора, которую он ранее разработал эмпирически, , для прогнозирования процента выигрышей на основе пробежек, было «то же самое», что и формула log5, хотя и без убедительной демонстрации или доказательства. Его предполагаемая демонстрация того, что они одинаковы, сводилась к демонстрации того, что две разные формулы упрощаются до одного и того же выражения в частном случае, который сам по себе трактуется расплывчато, и при этом не признается, что частный случай не является общим. Впоследствии он также не обнародовал какую-либо явную, основанную на качестве модель формулы Пифагора. По состоянию на 2013 год в сообществе саберметриков все еще мало кто осознает, что простая модель «команды побеждают пропорционально качеству», использующая соотношение пробегов в качестве меры качества, ведет непосредственно к оригинальной формуле Пифагора Джеймса.

В Реферате 1981 года Джеймс также говорит, что он сначала попытался создать формулу «log5», просто используя проценты побед команд вместо результатов в формуле Пифагора, но это не дало достоверных результатов. Причина, в то время неизвестная Джеймсу, заключается в том, что его попытка сформулировать подразумевает, что относительное качество команд определяется соотношением их процентов побед. Однако это не может быть правдой, если команды выигрывают пропорционально своему качеству, поскольку команда с коэффициентом 0,900 побеждает своих противников, общий процент побед которых составляет примерно 0,500, в соотношении 9 к 1, а не в соотношении 9 к 5, как у их 0,5. От 900 до 0,500 процентов выигрыша. Эмпирический провал его попытки привел к его конечному, более окольному (и изобретательному) и успешному подходу к log5, который все еще использовал соображения качества, хотя и без полного понимания предельной простоты модели и ее более общей применимости и истинной структурности. сходство с его формулой Пифагора.

Использование в баскетболе

[ редактировать ]

Американский спортивный руководитель Дэрил Мори был первым, кто адаптировал пифагорейские ожидания Джеймса к профессиональному баскетболу, будучи исследователем в STATS, Inc. Он обнаружил, что использование показателя 13,91 для показателей обеспечивает приемлемую модель для прогнозирования процентного соотношения побед и поражений:

«Модифицированная теорема Пифагора» Дэрила была впервые опубликована в журнале STATS Basketball Scoreboard, 1993–94 . [10]

Известный баскетбольный аналитик Дин Оливер также применил теорию Пифагора Джеймса к профессиональному баскетболу. Результат был аналогичным.

Другой известный баскетбольный статистик , Джон Холлингер , использует аналогичную формулу Пифагора, но с показателем степени 16,5.

Использование в Национальной футбольной лиге

[ редактировать ]

Формула также использовалась в Национальной футбольной лиге веб-сайтом футбольной статистики и издательством Football Outsiders , где она известна как проекция Пифагора .

Формула используется с показателем степени 2,37 и дает прогнозируемый процент выигрыша. Затем этот процент побед умножается на 17 (на количество игр, сыгранных в сезоне НФЛ с 2021 года), чтобы получить прогнозируемое количество побед. Это прогнозируемое число, заданное уравнением, называется пифагорейскими победами.

за 2011 год. Альманах Football Outsiders [11] говорится: «С 1988 по 2004 год 11 из 16 Суперкубков были выиграны командой, которая лидировала в НФЛ по пифагорейским победам, и только семь были выиграны командой с наибольшим количеством реальных побед. Чемпионы Суперкубка, которые лидировали в лиге по пифагорейским победам но не настоящие победы включают «Патриотов» 2004 года , «Рэйвенс» 2000 года , «Рэмс» 1999 года и «Бронкос» 1997 года ».

Хотя в «Альманахе Football Outsiders» признается, что эта формула была менее успешной при выборе участников Суперкубка в 2005–2008 годах, она вновь заявила о себе в 2009 и 2010 годах. Улучшение за год. Команды, которые выигрывают как минимум на одну полную игру больше, чем их прогноз по Пифагору, имеют тенденцию регрессировать в следующем году. на уровне 0,500 или выше, несмотря на их низкие достижения.

Например, « Нью-Орлеан Сэйнтс» в 2008 году пошли со счетом 8–8, несмотря на 9,5 побед Пифагора, что намекает на улучшение, которое произошло с следующего года чемпионским сезоном ».

В этом отношении « Миннесота Викингс» 2022 года сильно выделялись: 13–4, несмотря на 8,4 победы по Пифагору. [12]

Использование в хоккее с шайбой

[ редактировать ]

В 2013 году статистик Кевин Даяратна и математик Стивен Дж. Миллер предоставили теоретическое обоснование применения пифагорейского ожидания к хоккею с шайбой. В частности, они обнаружили, что, сделав те же предположения, которые Миллер сделал в своем исследовании 2007 года о бейсболе, а именно, что забитые и пропущенные голы подчиняются статистически независимому распределению Вейбулла , Пифагорейское ожидание работает так же хорошо для хоккея с шайбой, как и для бейсбола. . Исследование Даяратны и Миллера подтвердило статистическую обоснованность этих предположений и оценило показатель Пифагора для хоккея с шайбой чуть выше 2. [13]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ «Игровой дизайнер: Объяснение Пифагора» . 29 мая 2012 года . Проверено 7 мая 2016 г.
  2. ^ «Нью-Йорк Янкиз 2002» . Baseball-Reference.com . Проверено 7 мая 2016 г.
  3. ^ «Часто задаваемые вопросы» . Baseball-Reference.com . Проверено 7 мая 2016 г.
  4. Перейти обратно: Перейти обратно: а б «Бейсбольный проспект – новый взгляд на теорему Пифагора» . Бейсбольный проспект . 30 июня 1999 года . Проверено 7 мая 2016 г.
  5. ^ «Оценщики W%» . Проверено 7 мая 2016 г.
  6. ^ «Бейсбольный проспект - Глоссарий» . Проверено 7 мая 2016 г.
  7. ^ «Бейсбольный проспект – скорректированная турнирная таблица» . Проверено 7 мая 2016 г.
  8. ^ Хундал, Хейн. «Вывод формулы Джеймса Пифагора (длинная)» .
  9. Перейти обратно: Перейти обратно: а б Миллер (2007). «Вывод пифагорейской формулы выигрыша в бейсболе». Шанс . 20 : 40–48. arXiv : math/0509698 . Бибкод : 2005math......9698M . дои : 10.1080/09332480.2007.10722831 . S2CID   8103486 .
  10. ^ Деван, Джон; Зминда, Дон; Сотрудники STATS, Inc. (октябрь 1993 г.). СТАТС Баскетбольное табло, 1993–94 годы . СТАТС, Инк . 17. ISBN  0-06-273035-5 .
  11. ^ Альманах Football Outsiders 2011 ( ISBN   978-1-4662-4613-3 ), стр.xviii.
  12. ^ «Расширенная статистика Миннесота Викингс на 2022 год» . Pro-Football-Reference.com . Проверено 2 ноября 2023 г.
  13. ^ Даяратна, Кевин; Миллер, Стивен Дж. (2013). «Формула Пифагора побед и поражений и хоккей: статистическое обоснование использования классической формулы бейсбола в качестве инструмента оценки в хоккее» (PDF) . Журнал хоккейных исследований 2012/13 . XVI : 193–209.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5b2b0926f41c89f1b322ee4383f8f74c__1719940020
URL1:https://arc.ask3.ru/arc/aa/5b/4c/5b2b0926f41c89f1b322ee4383f8f74c.html
Заголовок, (Title) документа по адресу, URL1:
Pythagorean expectation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)