Роль продвинутой аналитики в футболе: от математических моделей до скрытых действий Месси
Применение продвинутой аналитики в спорте вызывает жаркие споры. Сторонники этого подхода видят в прагматизме, основанном на данных, естественный этап эволюции в том, как мы играем и смотрим игры. Противники же утверждают, что такой подход ставит результат превыше всего, лишая игру спонтанности и радости.
Тем не менее, даже для тех, кто не причисляет себя ни к одному из этих лагерей, сама идея применения подобных исследований к футболу представляется удивительной и заслуживающей восхищения. Игра по своей природе сопротивляется упорядоченному анализу. Это сравнимо с попыткой подготовить налоговую декларацию для домашней кошки: требуется невероятная изобретательность, чтобы просто понять, какие вопросы задавать, не говоря уже о поиске ответов.
Если бейсбол можно представить как набор таблиц, то футбольные матчи больше похожи на нелинейное свободное стихотворение, написанное 90-минутными отрезками. Люк Борн — специалист по анализу данных, сосредоточенный на исследованиях движения. Благодаря своему опыту в изучении сложных движущихся объектов, он понял, что обладает уникальными возможностями для изучения столь неуловимой игры. В Национальной лаборатории Лос-Аламоса Борн занимался разработкой методов определения того, какой уровень повреждений могут выдержать лопасти вертолета до того, как это повлияет на его способность оставаться в воздухе. Он также сопоставлял климатические данные для прогнозирования урожайности и изучал перемещение огромных стад наземных млекопитающих. Динамика футбольного матча, хоть и загадочна, не была для него совершенно чужой, и он стал пионером в количественной оценке некоторых неосязаемых аспектов игры.
Неочевидная тактика Месси
Совместно с частым соавтором Хавьером Фернандесом, Борн опубликовал академические работы с такими названиями, как «Широкие открытые пространства: Статистический метод измерения создания пространства в профессиональном футболе». В этом исследовании специалисты по данным изучают, как игроки без мяча могут манипулировать позиционированием соперников на поле. Подобно стилусу детской магнитной доски, перемещающему металлические частицы по поверхности игрушки, кажущиеся незадействованными игроки могут деформировать "географию" своих оппонентов, открывая новые пути для атаки.
Благодаря технологиям отслеживания игроков, это стало измеримым навыком, и, как и во многих других аспектах, Лионель Месси демонстрирует в нем выдающиеся результаты. В ходе своих исследований Борн и Фернандес обнаружили, что Месси, возможно, является одним из лучших "ходоков" в мировом футболе. Аргентинская легенда склонен к неспешным прогулкам по полю, и обычно считалось, что он либо экономит энергию, либо просто не прикладывает усилий. Хотя это может быть частью правды, их исследование показывает, что медленные перемещения Месси по полю уникальным образом "замыкают" оборонительные системы. «Такое поведение при ходьбе — это не отстраненность от матча, а сознательное действие, направленное на движение через ценные пустые пространства и установление контроля над ними», — пишут исследователи. «Месси делает это очень эффективно, что ставит его в число лучших игроков по объему "завоеванного" пространства за весь матч, несмотря на отсутствие активных рывков».
Иными словами, Месси может достичь большего во время неспешной прогулки, чем большинство игроков во время полномасштабного спринта.
Обратная сторона аналитики: мнение экспертов
На вопрос о влиянии их работы на восприятие игры, специалисты, глубоко погруженные в аналитические «двигатели» футбола, дают любопытные ответы. По словам Борна, он смотрит футбол «странным образом». Он склонен наблюдать за игрой с точки зрения тактической системы, или того, неверно ли собираются данные, или что данные могут охватывать основные компоненты, но модели упускают общую картину. «Это в некотором смысле испортило для меня спорт», — признает Борн.
Сара Радд придерживается схожего мнения. «Довольно утомительно смотреть каждую игру столь аналитически», — отмечает она. «Трудно отключить эту часть мозга, но все равно хочется быть фанатом и наслаждаться». Радд настолько рано занялась футбольной аналитикой, что по сути ей пришлось изобретать ее с нуля. После окончания Колумбийского университета она несколько лет жила в Чили, где еще больше полюбила свой любимый вид спорта. Она с теплотой вспоминает, как прищуривалась, глядя на свой небольшой телевизор стандартного разрешения, чтобы смотреть трансляции матчей из Аргентины. «Нужно было действительно хорошо знать команды», — вспоминает она. «Если вы не были по-настоящему знакомы с командами, вы не могли понять, кто есть кто из игроков. Было трудно прочитать номера, и вы не могли толком разглядеть их лица».
Радд и ее тогдашний бойфренд придумали игру, основанную на этой сложности. «Мы включали телевизор, и если играл клуб "Бока Хуниорс", задача была — как быстро можно заметить Карлоса Тевеса. Не по его лицу, а потому что у него был очень своеобразный стиль бега. Это было что-то вроде: "Опа! Вот он!"». Крепкий, похожий на пожарный гидрант, приземистый, бойкий Тевес был похож на неутомимого робота-курьера, запрограммированного на "убийство" на поле. Одна только мысль об этом вызывает у Радд ностальгию: «Какой игрок!».
Истоки футбольной аналитики: путь Сары Радд
О своем пребывании в Южной Америке Радд вспоминает: «Это заставило меня еще больше захотеть работать в футболе». Она устроилась на работу в Microsoft в Сиэтле, занимаясь анализом данных и машинным обучением, но продолжала искать возможности попасть в спортивную индустрию. «Один мой друг предложил мне поступить в магистратуру MBA, а затем посмотреть, смогу ли я получить работу в Nike или Adidas в их футбольном подразделении».
В 2011 году она узнала о конкурсе, проводимом компанией по спортивной аналитике StatDNA. «Они проводили исследовательский конкурс, в рамках которого предоставляли набор данных», — рассказывает она, отмечая, что до этого момента «практически ничего подобного» не собиралось для футбола.
Используя таблицу с базовыми данными о местоположении игроков, Радд задалась целью разработать метод анализа индивидуальной производительности более сложным образом, чем просто голы и передачи. «Направлений было не так много», — вспоминает она. «Думаю, просто наблюдая за игрой, я заинтересовалась оценкой того, сколько ценности люди добавляют каждым своим действием. Не обязательно пытаясь оценить альтернативы, но имея возможность в некоторой степени количественно оценить, например, что это была опасная потеря мяча, или что глупо бить по воротам оттуда, и так далее». Для этого она использовала марковские цепи — статистический инструмент, который помогает определить вероятность того, что что-либо произойдет внутри системы, исходя из ее текущего состояния.
Марковские цепи и футбольное поле
Впервые представленные в 1906 году, марковские цепи представляют собой отступление от принципа абсолютной независимости — основного постулата теории вероятности, наблюдаемого в таких вещах, как колеса рулетки, где каждый спин предлагает свежий эксперимент с повторяющимися шансами. Цепи — это способ изучения текущих сценариев, где каждая отправная точка представляет собой разную возможность для будущего. В журнале American Scientist Брайан Хейс приводит в качестве примера настольную игру «Монополия».
Цепи были изобретены и названы в честь Андрея Маркова, русского математика с непростым характером, который, согласно отчету Хейса, в конце своей карьеры перестал посещать заседания Академии наук в Санкт-ПетерПетербурге, утверждая, что у него нет подходящей обуви. Когда школа прислала ему пару новых ботинок, он сказал, что они «глупо сшиты», тем самым доказав, что его текущее состояние (раздражение) способствовало вероятности его возвращения (нулевой).
Корни открытия Маркова проросли из спора о законе больших чисел и свободе воли. Он долгое время верил, что Вселенная — это серия событий, взаимосвязь которых можно понять с помощью математики. Он усовершенствовал эту идею, сжав текст стихотворного романа Александра Пушкина «Евгений Онегин» в одну длинную последовательность букв, подходящую для математического анализа. В ходе этого он обнаружил, что во всем произведении встречаются стабильные паттерны двойных гласных и двойных согласных. Взяв большую выборку из начала текста, он смог определить, что распределение букв не соответствовало принципу независимости, демонстрируя, что даже нечто столь прекрасное и изменчивое, как поэзия, было пленником холодных дедуктивных свойств математики. Он опубликовал свою первую работу по этой теме в 1906 году и официально представил свои выводы в 1913 году, через год после своего прошения об отлучении от Русской православной церкви.
«Любая попытка имитировать вероятные события на основе огромных объемов данных — погоды, поиска Google, поведения жидкостей — опирается на идею Маркова», — говорится в статье в Harvard Gazette. Сара Радд, которая изучала компьютерные науки и экологию в Колумбийском университете и работала над поисковой системой Microsoft Bing, добавила футбол в этот список. Ее работа «Концепция тактического анализа и оценки индивидуальной атакующей производительности в футболе с использованием марковских цепей» распределила игроков по одному из 39 «состояний», в зависимости от таких факторов, как местоположение и владение мячом, для расчета вероятности того, что произойдет дальше.
Работа Радд была достаточно впечатляющей, чтобы принести ей как победу в конкурсе, так и работу в StatDNA. Когда в следующем году компания была приобретена гигантом Премьер-лиги — лондонским «Арсеналом», Радд неожиданно оказалась в Лондоне, работая на свою любимую команду и знакомя персонал клуба со своими передовыми исследованиями. Она провела почти десять лет в клубе, став руководителем аналитического отдела, прежде чем покинуть его в 2021 году, чтобы основать собственную фирму со своим мужем.
«Одна из наших задач — быть спокойным голосом разума», — говорит Радд. «Это одна из вещей, которые мне нравятся в консалтинге по сравнению с работой в клубе. Можно быть немного эмоционально отстраненным. Можно быть немного спокойнее. Потому что, когда вы ежедневно находитесь на тренировочной базе, эмоции зашкаливают. Это очень стрессовая среда. На кону стоит очень многое».
Противоречия в футбольной философии
В интервью изданию The Athletic Радд сообщила, что основала собственную фирму, отчасти, чтобы «разобраться в футболе». На вопрос о том, как это выглядит, она признает, что это «действительно сложно», почти до самоотрицания. «Одна из трудностей аналитики в футболе заключается в том, что существует так много разных способов выиграть. Так много компромиссов. Думаю, кто-то описал это как попытку укрыться одеялом, которое слишком коротко. Если вы применяете высокий прессинг, это произойдет за счет чего-то еще. Есть несколько вещей, которые, как мы знаем, действительно помогают выигрывать, но все еще очень многое можно сделать так же эффективно, делая что-то другое».
Независимо от объема проведенных исследований, футбол сохраняет стойкую «аллергию» на простые ответы. Даже такой фундаментальный вопрос, как то, хотите ли вы, чтобы ваша команда владела мячом или нет, является предметом дебатов на самых высоких уровнях. Как утверждал легенда голландского футбола Йохан Кройф, «футболист должен иметь мяч в ногах».
Диаметрально противоположной этой философии является позиция Жозе Моуринью, одного из самых успешных тренеров XXI века. Португальский наставник, известный своим острым языком, считал, что «кто владеет мячом, тот испытывает страх», предпочитая, чтобы его команды ждали и использовали ошибки соперников, подобно людям из «Войны миров», которые прятались, пока марсиане не подхватывали простуду и не умирали.
Где еще такие кардинально противоречивые мировоззрения могут иметь равные основания, как не в плохо спроектированном эксперименте, которым является футбол? «Долгое время считалось, что если бы у нас был широкомасштабный доступ к данным отслеживания, это решило бы все наши проблемы», — объясняет Радд. «И потом мы получили их, и нет, у нас все еще много проблем».
Эволюция аналитических подходов
Размышляя о своей работе 2011 года с использованием марковских цепей, Сара Радд не может не находить недостатки в исследовании, которое сделало ее пионером движения. «В то время, когда я писала эту работу, я не смотрела на нее столь аналитически, как сейчас», — отмечает она. «Думаю, определенно было много решений, которые я бы приняла по-другому, в частности, как разбивать поле». Радд разделила поле на равные квадраты, разбив обширное открытое пространство на сетку легко отслеживаемых ячеек. Это был порядок из хаоса, созданный из ошибоного отчаяния. «Теперь мы знаем, что поле функционирует не обязательно линейно или аккуратными маленькими квадратами», — говорит Радд. «Есть определенные зоны, где происходят события по ряду причин, которые не совсем совпадают с этими разметками поля». Эти области скопления игроков являются нечеткими и реагируют на тактические тенденции, такие как оборонительные действия, направляющие игру по флангам, или высокий прессинг при потере владения — стратегии, разработанные благодаря работе таких людей, как Борн и Радд, аналитиков, которые «тянут за образное одеяло» в офисах, скрытых от публики.
«Я не большой поклонник немедленного перехода к прагматизму, если это не требуется», — говорит Радд. «Мы должны помнить, что мы находимся в индустрии развлечений. Это должно быть весело».
