Pinnacle … Анализ различных моделей расчета ожидаемого количества голов

Перейти на сайт сейчас
  • Как рассчитывается ожидаемое количество голов?
  • Какие существуют подходы к моделированию ожидаемого количества голов?
  • Какая модель расчета ожидаемого количества голов самая точная?

Показатель ожидаемого количества голов, ранее используемый лишь в небольшом сообществе спортивной статистики, теперь применяется наряду с другими общераспространенными показателями футбольной статистики, такими как владение мячом, удары по воротам и количество совершенных фолов. Однако существует множество подходов к расчету этого показателя. В этой статье рассматриваются несколько применяемых моделей и способы получения с их помощью разных результатов.

Цель футбольного матча – забить гол в ворота команды-соперника, не пропустив ни мяча. Звучит просто, но из-за таких факторов, как случайность и везение, команды не всегда добиваются результатов, которых «заслуживают».

Именно поэтому анализ данных и различные показатели (например, ожидаемое количество голов) очень полезны при размещении ставок на спорт: они позволяют анализировать результаты с более аналитической точки зрения и наполнять содержанием заявления типа «невезение виновно в их проигрыше».

Ожидаемое количество голов (часто сокращается до xG) – это одна из форм анализа данных, используемая футбольными командами и набирающая все большую популярность среди игроков, размещающих ставки. Из-за применения различных моделей расчета показателей в статистике ожидаемого количества голов, широко доступной в режиме онлайн, зачастую указываются разные данные.

Могут использоваться как простые, так и сложные модели расчета ожидаемого количества голов. Ниже объясняются принципы действия различных моделей. Так в чем же заключаются технические аспекты различных моделей и насколько отличаются получаемые с их помощью результаты?

Применение основных данных об ударах

Ранее Эндрю Бисли объяснил, как рассчитать ожидаемое количество голов с помощью модели основных данных об ударах. Поскольку удар является определяющим действием гола, данные об ударах – это ключ к любой модели расчета ожидаемого количества голов. Во время футбольного матча происходит бесчисленное множество событий, которые способствуют забиванию гола, но в попытке спрогнозировать конкретно этот результат самое большое значение, несомненно, играют удары.

heat-map-inarticle.jpg

Это простой подход, предусматривающий использование ударов, совершенных в пределах штрафной площадки и за ее пределами, а также применение понятия «большой перспективы гола», которое, по версии компании Opta, определяется как ситуация, в которой обоснованно ожидается, что игрок забьет гол.

Коэффициенты реализации за последние пять сезонов матчей Premier League указывают на то, что коэффициент xG для большой перспективы гола составляет 0,387 (шанс забить гол 38,7 %), для ударов в пределах штрафной площадки – 0,070, а для ударов за пределами штрафной площадки – 0,036.

Подробный анализ данных об ударах

С учетом размера футбольного поля различные углы вероятного совершения удара и влияние, оказываемое этим на вероятность забивания гола (вне зависимости от того, проводится ли по модели более детальный анализ места совершения удара), будут оказывать воздействие на результаты расчета ожидаемого количества голов.

grid-inarticle.jpg

Хотя, как и в случае модели расчета ожидаемого количества голов на основании основных данных, предложенной Эндрю Бисли, такой подход предполагает применение более глубокого анализа места совершения удара при назначении соответствующего коэффициента xG. Для этого проще всего нанести сетку на весь диапазон совершения ударов по воротам и отметить на ней каждый из возможных ударов.

Преимуществом использования такого рода модели является то, что она учитывает разницу между местами совершения ударов игроками (непосредственно перед воротами с большой вероятностью забить гол или под острым углом с меньшей вероятностью забить гол) и используемую для удара часть тела игрока: голова (тяжелее забить гол) или нога (легче забить гол).

Модель Пола Рили – это отличный пример использования немного более совершенного подхода к анализу данных о местах совершения ударов при построении модели расчета xG.

Учет процесса осуществления атаки

Конечно же, при определении наибольшей вероятности реализации попытки учитывается не только место совершения удара и задействованная для этого часть тела игрока. Ведение игры перед ударом будет оказывать влияние на качество предоставленного шанса.

Вместо того чтобы просто назначить коэффициент xG удару на основании места его совершения, в некоторых моделях рассматривается способ создания возможности совершить удар (поперечный или разрезающий пас, контратака и т. д.) и проводится более подробный анализ метода его совершения (удар после успешного ведения мяча, подбор после отраженного удара и т. д.).

pass-inarticle.jpg

Очевидно, что для создания и поддержания такого рода модели требуется намного больше данных и ресурсов; модель расчета xG, предложенная 11tegen11, является одним из примеров модели расчета ожидаемого количества голов, которая учитывает более масштабный процесс осуществления атаки при назначении ударам соответствующего коэффициента xG.

Влияние обороны на коэффициент xG

Все три указанные выше способа моделирования ожидаемого количества голов прекрасно справляются с оценкой общего ожидаемого количества голов, которые должна забить команда за матч или за весь сезон. Но существуют и другие переменные, которые способствуют потенциальной возможности забить гол.

Суть футбольного матча сводится не только к атаке. Так же важны оборонительная позиция и снижение шанса команды-соперника забить гол: защитники могут вынудить игрока совершить удар другим способом или скорректировать свою тактику в самую последнюю минуту, усложнив процесс забивания гола.

Наряду с анализом всего процесса осуществления атаки (начиная со способа предоставления шанса и заканчивая местом проведения окончательных действий) использование близости защитников команды-соперника и оказываемого ими влияния на качество удара дополняет моделирование ожидаемого количества голов еще одним уровнем детализации.

Это означает, что учет размещения вратаря и защитников относительно места совершения удара может обеспечить самыми точными результатами расчета ожидаемого количества голов.

Какая модель расчета ожидаемого количества голов самая точная?

Теперь, когда мы знаем принцип действия различных моделей расчета ожидаемого количества голов, можно приступить к анализу и определить, какая модель дает самые точные результаты. В приведенной ниже таблице сравниваются фактическая разница голов для каждой команды за сезон матчей Premier League 2016–2017 гг. и результаты ожидаемой разницы голов с применением различных упомянутых выше моделей расчета ожидаемого количества голов.

Команда Фактическая РГ Показатель xGD (модель 1) Разница Показатель xGD (модель 2) Разница Показатель xGD (модель 3) Разница
Arsenal +33 +12.5 -20.5 +17 –16 +15.39 -17.61
Bournemouth –12 -6.80 +5.20 –15 –3 -13.76 -1.76
Hull City –43 -33.80 +9.20 –35 +8 -38.88 +4.12
Burnley –16 -19.20 -3.20 –26 –10 -21.06 -5.06
Chelsea +52 +25.90 -26.10 +31 –21 +31.91 -20.09
Crystal Palace –13 -1.50 +11.50 –5 +8 -6.05 +6.95
Everton +18 +5 –13 +1 –17 +1.82 -16.18
Sunderland –40 -27.40 +12.60 –26 +14 -30.56 +9.44
Leicester City –15 -7.60 +7.40 –7 +8 -6.65 +8.35
Liverpool +36 +25.30 -10.7 +33 –3 +31.87 -4.13
Manchester City +41 +41.80 +0.80 +44 +3 +51.13 +10.13
Manchester United +25 +25 0 +24 –1 +29.48 +4.48
Middlesbrough –26 –21 +5 –25 +1 -22.46 +3.54
Southampton –7 +6.60 +13.60 +8 +15 +8.15 +15.15
Stoke City –15 -0.60 +14.40 –2 +13 +0.45 +15.45
Swansea City –25 -21.70 +3.30 -20 +5 -27.34 -2.34
Tottenham Hotspur +60 +32.50 -27.50 +30 –30 +31.04 -28.96
Watford –28 -12.20 +15.80 –13 +15 -16.14 +11.86
WBA –8 -11.80 -3.80 –7 +1 -8.52 –0,52
West Ham United –17 -11.10 +5.90 –7 +10 -9.83 +7.17

Наилучший способ оценки точности каждого из представленных подходов – определить среднеквадратичное отклонение (RMSD), которое иногда называется среднеквадратичной погрешностью (RMSE). Для этого возводится в квадрат разница показателей в полях фактической и ожидаемой разницы голов для каждой команды, подсчитывается среднее значение и извлекается квадратный корень из этого среднего значения.

Показатель xGD (модель 1) Показатель xGD (модель 2) Показатель xGD (модель 3)
RMSD 12.92 12.55 12.01

Как видите, результаты трех разных подходов очень похожи с точки зрения ожидаемой разницы голов за сезон матчей Premier League 2016–2017 гг.: несмотря на разные уровни использованных данных, все три подхода отличаются лишь среднеквадратичным отклонением 0,91.

Но один сезон (380 матчей) – это недостаточно большая выборка данных, чтобы с любой долей уверенности заявлять о преимуществе одного подхода по сравнению с другим. Кроме того, определение среднеквадратичного отклонения в зависимости от отдельных игр, скорее всего, позволит глубже понять, насколько точны результаты каждой из моделей при прогнозировании количества голов, забитых в ходе матча.

Хотите узнать больше о показателе ожидаемого количества голов?

Если вы хотите узнать больше о показателе ожидаемого количества голов и применить полученные знания при размещении ставок, прочтите статью Эндрю Бисли, где он написал о том, как этот показатель можно применить при размещении ставок в ходе сезона матчей Premier League.

BENJAMIN CRONIN

Перейти на сайт сейчас


Поделитесь своим опытом, оставив здесь комментарий

Оставить комментарий

Ваш электронный адрес не будет опубликован.