Pinnacle … Недостатки систем ставок на спорт: корреляция или причинно-следственная связь

Перейти на сайт сейчас
  • Системы ставок на спорт: что такое регрессионный анализ?
  • Использование систем прогнозирования результатов ставок
  • Недостатки регрессионного анализа

Система ставок имеет большое значение, когда дело доходит до обеспечения долгосрочной прибыли в игре на ставках. Однако когда речь заходит о результатах, игроки часто путают системы управления капиталом и системы ставок, а также смешивают понятия корреляции и причинно-следственной связи. Что такое система ставок и в чем заключается разница между корреляцией и причинно-следственной связью? Читайте дальше и узнайте ответ на этот вопрос.

Что такое система ставок?

В отличие от метода расчета ставок или стратегии управления капиталом, которая позволяет определять размеры денежных сумм, которые вы ставите, система ставок на спорт представляет собой структурированную методологию прогнозирования, основанную на количественном анализе прошлых данных и предназначенную для того, чтобы преодолеть маржу букмекера и найти положительное математическое значение.

  • Узнайте, как рассчитывать размеры маржи для ставок.

Игроки часто путают системы управления капиталом и системы ставок: при поиске в Google по запросу «система ставок» отображаются результаты в основном для таких методов, как стратегия Мартингейла, Лабушера или Фибоначчи, но в действительности это разные вещи.

Система управления капиталом просто меняет характер рисков, связанных с вашими ставками, однако с ее помощью нельзя превратить неэффективный метод прогнозирования в выигрышную стратегию, которая гарантирует получение прибыли в долгосрочной перспективе. Система ставок, с другой стороны, позволяет выявить истинные вероятности событий в ходе спортивного соревнования.

Системы ставок на спорт: регрессионный анализ

Наиболее широко используемым методом, предназначенным для разработки систем ставок на спорт, является статистический регрессионный анализ. Для тех, кто не знаком со статистической терминологией, это название может показаться пугающим, но на самом деле это всего лишь метод оценки взаимосвязи между переменными.

Самые типичные из таких систем представляют собой простые линейные регрессии, которые включают только две переменные, например количество голов (предикторная, или независимая, переменная) и частота побед команды в матчах (результат, или зависимая переменная).

В моей первой книге Размещение ставок на спорт с фиксированными коэффициентами: статистическое прогнозирование и управление рисками рассматривалась простая регрессионная модель, основанная на данных об относительном преимуществе двух команд по количеству голов в шести последних сыгранных матчах.

Используя большую выборку данных о матчах (в этом случае игр восьми сезонов с 1993 по 2001 гг.), можно построить график корреляции рассчитанных рейтингов матчей (разность мячей команды хозяев поля, забитых в шести матчах, минус разность мячей команды гостей в шести матчах) и частоты наступления каждого результата. Распределение рейтингов матчей (независимая переменная) и частоты побед домашних команд (зависимая переменная) представлено ниже.

correlation-and-causation-inarticle.jpg

Хотя отдельные измерительные точки на графике расположены несколько беспорядочно, существует очевидный линейный тренд, связывающий две переменные: чем лучше показатель разности мячей команды хозяев поля за шесть матчей в сравнении с аналогичным показателем гостей, тем выше вероятность победы хозяев.

Кривая регрессии на графике, по сути, представляет собой идеализированное соотношение показателя относительного преимущества по количеству голов и частоты побед хозяев без учета статистического шума или влияния фактора везенья или неудачи как случайного элемента.

Кривую, о которой говорилось выше, можно представить в виде уравнения. Поскольку речь идет о простой линейной регрессионной модели, уравнение будет иметь вид y = mx + c, где y является зависимой переменной (вероятность выигрыша), х является независимой переменной (рейтинг матча), м – наклон или градиент линии тренда (показатель прочности связи), а с – константа или точка, в которой кривая пересекает ось у (то есть х = 0). В этом примере уравнение имеет следующий вид:

показатель побед хозяев (%) = (1,56 x рейтинг матча) + 46,5

Когда рейтинг матча равен нулю (то есть команды хозяев и гостей более или менее равны по показателю разности мячей), вероятность выигрыша составляет 46,5 %. Об этом можно интуитивно догадаться, поскольку около 46 % футбольных игр заканчиваются победой хозяев. Если показатель чистой разности мячей хозяев за шесть последних игр превышает аналогичный показатель гостей более чем на десять голов, регрессионная модель покажет, что такие команды, как правило, выигрывают в 62 % случаев. Если разница в очках равна 20, вероятность возрастает до 78 %.

Регрессионный анализ также позволяет понять, в какой мере модель размещения ставок объясняет вариации частоты побед. В этом случае эта величина составляет 86 %. Это подтверждается тем, насколько линия тренда соответствует имеющимся данным. На этом основании можно сделать вывод о существовании тесной корреляционной связи между двумя переменными.

Использование систем прогнозирования результатов ставок

Для того чтобы преобразовать регрессионную модель в полностью функционирующую систему ставок, необходимо составить прогнозы для будущих матчей и использовать полученные сведения для выявления ставок с положительным математическим ожиданием.

Как и в случае с большинством методологий моделирования, исходным является предположение о том, что прошлое – ключ к будущему. Если предыдущие матчи с рейтингами +10 завершились победой хозяев в 62 % случаев, то разумно предположить, что вероятность победы хозяев поля, обладающих преимуществом над своими соперниками по количеству голов в 10 очков, составит 62 %.

  • Прочитайте статью Почему прошлые результаты не являются показателем успеха?

Затем эти вероятности можно просто преобразовать в истинные коэффициенты и, следовательно, определить математическое ожидание, установленное букмекером, который предлагает более высокие коэффициенты. Применив эту модель при размещении 526 ставок на матчи первого сезона Английской футбольной лиги 2001–2002 г. и использовав лучшие из доступных коэффициенты на победу хозяев, мой коэффициент прибыльности составил +2,1 %. Если бы я просто наугад ставил на то, что все команды хозяев будут выигрывать в этом сезоне, мои убытки составили бы –3,7 %.

Корреляция или причинно-следственная связь

Сделав чуть более 500 ставок на игры одного сезона, вы не гарантируете, что сможете получать аналогичную прибыль в будущем. Может показаться, что этого количества достаточно для того, чтобы убедиться в надежности системы ставок, но постоянным читателям раздела «Ресурсы для размещения ставок» известно, что это не так.

Статья Пиннакл о законе малых чисел служит напоминанием о том, что вероятность выявления ложных схем получения прибыли, которые на самом деле ничем не обусловлены и возникли случайно, существует даже при использовании выборки из 1000 ставок. К сожалению, при размещении ставок на игры следующих пяти сезонов эта система оказалась убыточной.

Хотя эта простая регрессионная модель, основанная на данных о преимуществе по количеству голов, доказала свою эффективность в определении команд хозяев с высокой вероятностью выигрыша, нет уверенности в том, что с ее помощью можно будет выявить команды, шансы на победу которых окажутся выше вероятностей, заложенных в коэффициенты букмекера.

Моя модель, возможно, является эффективным инструментом прогнозирования, но, она, по-видимому, не оказалась совершеннее моделей, используемых букмекерами при установке коэффициентов, и моделей, используемых другими игроками, которые влияют на формирование и изменение этих коэффициентов.

Если бы используемая мной модель просто основывалась на том же механизме, что и букмекерские модели, то прибыль была бы нестабильной и обусловливалась влиянием случайных факторов. По-видимому, в ее основе нет реально существующей корреляционной связи. Полученная прибыль не является результатом применения моей модели прогнозирования, поскольку составленные с ее помощью прогнозы достоверны в той же степени, что и прогнозы, составленные при использовании аналогичных моделей.

Точность или достоверность

Конечно, линейную регрессионную модель с двумя переменными вряд ли можно назвать самой сложной системой, применяемой для определения математического ожидания при размещении ставок. Множественная регрессия, включающая несколько независимых, или предикторных, переменных, позволяет повысить точность результатов прогнозирования. Тем не менее аналитикам важно помнить, что это не должно отразиться на достоверности.

Точная модель – это модель с высокой степенью близости результатов измерений. Примером может служить линия тренда простой линейной регрессионной модели, о которой говорилось выше. Точность, однако, не гарантирует достоверность. Достоверность является мерой того, насколько вы близки к истинному значению. Точность имеет отношение к случайным ошибкам, а достоверность – систематическим (также известным как «смещения»).

  • Прибыль – вопрос везения или умений?

Для того чтобы система ставок была валидной, то есть была эффективной в достижении поставленных целей, например определении математического ожидания и получении прибыли на регулярной основе, она должна гарантировать точные и достоверные результаты. Валидность подразумевает как предсказуемость, так и стабильность, то есть является ли предположение истинной причиной явления и подтверждают ли этот вывод результаты неоднократных измерений.

К сожалению, при анализе собственных прошлых результатов многие игроки, делающие ставки на спорт, часто неправильно трактуют такие понятия, как точность, достоверность и валидность, путая при этом корреляцию и причинно-следственную связь. Их ошибка заключается в том, что они верят, что прибыль получена в результате применения системы ставок, хотя в большинстве случаев это объясняется простым везеньем.

Недостатки регрессионного анализа

В то время как регрессионный анализ является полезным инструментом для разработки системы ставок, его основной недостаток заключается в том, что он не позволяет различать явления корреляции и причинно-следственной связи. Регрессионный анализ эффективен в определении связи между переменными, например количеством забитых и пропущенных голов и вероятностью победы в матчах, но с помощью этого метода невозможно определить, является ли одно следствием другого.

Регрессионный анализ позволяет сделать вывод, что если Barcelona проиграет, то, значит, Лионель Месси не смог забить гол. Но нельзя утверждать, что если Лионель Месси не забьет гол, то Barcelona проиграет матч.

Если наличие причинно-следственных связей в системе ставок и валидность такой системы не установлены, то существует опасность, что используемая модель, возможно, не лучше моделей прогнозирования, используемых другими людьми. В контексте относительных навыков, например навыков игры на спортивных ставках, важным является не столько прогноз будущих событий, сколько его точность в сравнении с другими прогнозами.

JOSEPH BUCHDAHL

Перейти на сайт сейчас


Поделитесь своим опытом, оставив здесь комментарий

Оставить комментарий

Ваш электронный адрес не будет опубликован.