Daj mi numer, ja i tak zgubię

Przyznam się uczciwie, że statystyka nie była moim ukochanym przedmiotem na studiach. Mimo iż jestem jednym z największych sceptyków fenomenu cyferek, to zainspirowany modelem opracowanym przez CIES Football Observatory postanowiłem spojrzeć nieco w przyszłość i przyjrzeć się analitycznemu podejściu do futbolu.

Autor: Michał Jóźwiak

Należy zacząć od tego, że algorytm sporządzony przez CIES to rewolucja na rynku wycen piłkarskich. Przez wiele lat niemalże monopolistą był bowiem w tym zakresie Transfermarkt, którego funkcjonowanie opierało, i w zasadzie nadal opiera się, nie na analizie statystycznej, a na subiektywnych ocenach tysięcy piłkarskich sympatyków z całego świata – czyli tzw. crowdsourcingu. Prawo do przedstawienia swojej opinii na temat wartości danego zawodnika ma każdy, kto zarejestruje się na portalu. Dane nie są analizowane w sposób w pełni demokratyczny – uprzywilejowani członkowie społeczności, nazywani potocznie sędziami, dokonują wnikliwej oceny wszelkich wycen pojawiających się na portalu, przypisując im odpowiednią wagę. Pozwala to uniknąć manipulacji oportunistycznych agentów piłkarskich czy dalece nietrafionych analiz niedoświadczonych kibiców. Jest to praktyka szczególnie wartościowa w przypadku mniej popularnych lig, takich jak Ekstraklasa, gdzie wycenę trzeba opierać na zaledwie kilku przedstawionych na portalu szacunkach. W całym modelu ciężko jednak o obiektywizm – zarówno u dokonującej estymacji wartości zawodników społeczności, jak i u wyznaczonych do kontroli owych ocen sędziów. Ponadto, oceny błyskawicznie się dezaktualizują – Transfermarkt uaktualnia swoje wyceny przeciętnie co pół roku, co w piłkarskim świecie jest działaniem dalece niepraktycznym, kilka dobrych meczów winduje niekiedy cenę, szczególnie młodych zawodników, o kilkadziesiąt, a nawet o kilkaset procent w górę. To że zarówno największe światowe media, jak i gigantyczne korporacje, jakimi są czołowe, europejskie kluby sportowe, wciąż nierzadko bazują w swoich analizach czy sprawozdaniach na tak nieprecyzyjnych danych, opracowywanych nierzadko przez pełnych pasji nastolatków, wydaje się zjawiskiem bezprecedensowym.

 

Moneyball

 

Futbol, pod kątem statystycznej analizy, przez wiele lat pozostawał w tyle za sportami takimi jak baseball czy koszykówka, prawdopodobnie przez swoją nikłą popularność w Stanach Zjednoczonych, które wybitnie lubują się w liczbach. W roku 2010 New York Times nazwał piłkę nożną „najmniej statystycznym ze wszystkich popularnych sportów”. Liga MLS (Major League Soccer) ukazywała wówczas na swojej stronie internetowej jedynie sześć danych statystycznych przy każdym z zawodników. MLB (Major League Baseball) udostępniała dwadzieścia dziewięć metryk dotyczących samego bicia piłki przez pałkarzy. Sławą okryła się zresztą zekranizowana z Hollywoodzkim rozmachem historia Oakland Athletics, drużyny zarządzanej na przełomie XX i XXI w. przez emerytowanego baseballistę – Billy’ego Beane’a.

 

Kadr z filmu “Moneyball” – fot. Materiały Prasowe Netflix

 

Aby w pełni zrozumieć jednak sens wydarzeń, które miały miejsce w północnej Kalifornii, musimy cofnąć się aż do roku 1980, kiedy wspomniany w poprzednim paragrafie Billy Beane, znakomicie zapowiadający się zawodnik, musiał wybrać między karierą sportową, a naukową. Został bowiem przyjęty na wymarzony Uniwersytet Stanford, jedną z dziesięciu czołowych uczelni w kraju. Udział w drafcie i podpisanie kontraktu z New York Mets przekreślił jego szanse na edukację na najwyższym światowym poziomie, zapewnił jednak znaczny zastrzyk gotówki – samo podpisanie kontraktu gwarantowało zawodnikowi 125 tys. dol. bonusu. Billy nie był jednak w stanie spełnić gigantycznych, pokładanych w nim oczekiwań. Swoją krótką, kilkuletnią karierę zawodniczą zakończył w Oakland Athletics, gdzie pozostał, pełniąc w latach 90. rolę skauta. Subiektywne, niekiedy życzeniowe myślenie kolegów po fachu odrzucało Beane’a, który zamierzał opierać swoje wybory i podejmowane decyzje na bazie twardych danych, nie doświadczenia i zmysłu. Kilka lat później główny bohater filmu Moneyball objął stanowisko dyrektora generalnego klubu. Klubu, który zmagał się z niemałymi problemami finansowymi i pełnił raczej rolę akademii wychowującej młodych zawodników dla najbogatszych drużyn ligi. Paul DePodesta, absolwent Harvardu, mianowany szefem skautingu w zespole Oakland Athletics, pozwolił jednak zrealizować wizę Billy’ego, który jeszcze jako skaut zafascynowany był analizą szczegółowych danych statystycznych. Zespół złożony z zawodników co najwyżej przeciętnych zajął w sezonie 2002 pierwsze miejsce na zachodzie, ustępując w całej lidze wypracowanym bilansem (103–59) jedynie legendarnemu New York Yankees. Odniósł również dwadzieścia ligowych zwycięstw z rzędu, co nie wydarzyło się w amerykańskiej lidze baseballa od roku 1935. Innowacyjne podejście pozwoliło drużynie, aż po dziś dzień, gościć średnio co drugi sezon w fazie play-off, która jeszcze w latach 90. wydawała się praktycznie nieosiągalna.

 

Scouting w Football Managerze

 

Futbol bardzo jednak na przestrzeni ostatniej dekady ewoluował. Kompleksowe statystyki prezentują obecnie takie serwisy jak Opta, wiele drużyn używa również własnych systemów do zbierania danych. Niemiecka Federacja Piłkarska (DFB) zastosowała w roku 2014, przełomowym zresztą dla germańskiej piłki, rozwiązanie opracowane przez SAP. Dziesięciominutowy trening, z dziesięcioma piłkarzami oraz trzema piłkami pozwolił na uzyskanie ponad siedmiu milionów danych w niezwykle rozbudowanej bazie. SAP ma również swój udział w rewolucjonizowaniu niemieckiej piłki klubowej. Dietmar Hopp, właściciel TSG Hoffenheim, oraz współzałożyciel informatycznego giganta stara się stale implementować innowatorskie rozwiązania z zakresu analizy danych do klubowej strategii. Sam Roberto Firmino miał, zgodnie ze słowami scouta drużyny z Hoffenheim – Lutza Pfannenstiela, zostać odkryty dzięki grze Football Manager, co przy obecnym zaawansowaniu technologicznym drużyny wydaje się wyjątkowo barwną anegdotą. Klubem, który wyróżnia się na piłkarskiej mapie Europy swoim analitycznym podejściem jest również FC Midtjylland, duński fenomen, który odnotował w ubiegłym roku remisy w spotkaniach z Atalantą Bergamo oraz Liverpoolem. Filozofia zespołu z Jutlandii opiera się nie tylko na pozyskiwaniu niedocenianych, młodych piłkarzy, którzy przynoszą w dłuższej perspektywie czasowej krociowe zyski i świetne wyniki sportowe, ale i analizy taktycznej gry zespołu przy pomocy algorytmów, co ma zoptymalizować uzyskiwane wyniki. Prezes klubu – Rasmus Ankersen – kładzie w swoich wypowiedziach szczególny nacisk na stałe fragmenty gry. Klub zatrudnił nawet trenerów szlifujących z zawodnikami grę rękoma, aby szlifować dokonywanie mocniejszych oraz bardziej precyzyjnych wrzutów z autu.

 

Football Manager – fot. Materiały Prasowe SEGA

 

Meritum

 

Zbawieniem dla domorosłych sympatyków piłkarskich danych statystycznych może okazać się CIES Football Observatory, które opracowuje przystępną, ale zarazem kompleksową analizę danych w celu przedstawienia aktualnej, realnej wartości zawodników z czołowych europejskich lig. Ceny płacone za zawodników, wbrew opinii laików, nie są bowiem irracjonalne. Są oparte na kryteriach, które są w znacznej części obiektywne, co pozwala nanieść je na model statystyczny. Ten stworzony przez CIES został opracowany w oparciu o 1790 transferów, a korelacja między estymowanymi, a realnymi sumami transferowymi plasuje się na poziomie wyższym niż 80 proc. Oznacza to w dużym uproszczeniu, że wzięte pod uwagę zmienne pozwalają wytłumaczyć ⅘ różnic wartości poszczególnych transferów. Twórcy algorytmu dodają, że jeśli w dokonywanej analizie weźmiemy pod uwagę dodatkowo siłę przetargową klubów (opartą w dużym stopniu na aktualnej sytuacji finansowej drużyn), jesteśmy w stanie uzyskać współczynnik korelacji bliski 85 proc.

Informacje uwzględnione w modelu statystycznym CIES mogą być podzielone na trzy partie – statystyki opisujące danego piłkarza, dane odnoszące się do klubu oraz zmienne wynikające z kontekstu. Ta ostatnia grupa pozwala uwzględnić inflację – zarówno tę znaną nam z lekcji ekonomii, jak i tę istniejącą wewnętrznie na rynku piłkarskim. Druga analizuje poziom klubu, w którym zatrudniony jest dany gracz. Zarówno pod kątem sportowym, jak i finansowym. Uwzględniane są wyniki odnotowane przez zespół we wszelkich kompetycjach, a także prestiż i renoma samych rozgrywek. Ponadto, maglowane (sic!) są wszelkie dane dotyczące bieżących inwestycji tak klubu, jak i całej ligi. Pierwsza, a zarazem podstawowa część analizy opiera się zaś głównie na danych numerycznych. Pod uwagę brane są m. in. długość kontraktu, wiek gracza, status międzynarodowy, przebieg kariery, a przede wszystkim występy zawodnika, zarówno na polu klubowym, jak i reprezentacyjnym. Oczywistym wydaje się wzięcie pod uwagę liczbę rozegranych minut, strzelonych bramek, czy odnotowanych asyst, ale sam model opiera się na metodologii wykorzystującej bardzo szczegółowe dane dostarczane przez OptaPro. Obserwatorium podjęło także współpracę z firmą Instat, dzięki możemy przyjrzeć się przedstawionej w łopatologiczny sposób formie klubów ze znakomitej większości europejskich lig. CIES opracowuje również specjalną bazę danych, dzięki której dowiemy się chociażby, że najmłodszy skład w Europie ma aktualnie duńskie FC Nordsjælland, najstarszy Sivasspor (co ciekawe, w czołowej dziesiątce znajduje się aż sześć tureckich klubów), a najwyższą jedenastką w Europie dysponuje Hertha Berlin (średnia na poziomie 186,4 centymetra, imponujące!). Nietuzinkowy wydaje się również i atlas migracji, która pozwala nam zaobserwować, że, pomijając kraje europejskie, największymi „eksporterami” na światowymi rynku piłkarskim są obok Brazylii i Argentyny kolejno Kolumbia, Nigeria, Urugwaj i Ghana. Portal stale dostarcza nowych danych, będących inspirującym źródłem interpretacji piłkarskich trendów. Z najnowszego (stan na 25.03.2021) dowiemy się chociażby, że w analizie zespołów z pięciu najlepszych lig, tym który z największą dbałością podchodzi do zrównoważonego rozwoju składu okazuje się być Manchester United. Wszystko podparte liczbami i fachową wiedzą.

 

Czołowa 10 rankingu CIES z 4 stycznia 2021 roku – fot. Twitter CIES Football Observatory

 

Zestawiając dane z serwisu Transfermarkt z tymi przedstawionymi przez CIES, łatwo zauważyć, iż są one bardzo rozbieżne. Popularny w polskich mediach Piotr Zieliński jest przez niemiecki portal wyceniany na zaledwie 46 mln euro, co jest wartością niemal o 33 proc. mniejszą od tej przedstawianej przez szwajcarską organizację. Podobnie niedoszacowany jest Jan Bednarek, Arkadiusz Reca oraz Krzysztof Piątek, z tym, że tu różnica sięga już prawie 50 proc. Portale jeszcze bardziej niejednomyślne są w wycenie Mateusza Klicha – różnica między 3,5 a 12,5 mln euro wydaje się dość znacząca. Model opracowany przez CIES jest bez dwóch zdań bardziej precyzyjny, jesteśmy też łatwiej w stanie określić jakie czynniki są brane pod uwagę przy jego ustalaniu. Możemy być przekonani, że jest to przyszłość światowej piłki. Futbol to wielki biznes; za wielkim biznesem idą wielkie pieniądze, wielkie pieniądze kochają zaś wielkie liczby w jeszcze większych bazach danych. Pozwalają one wierzyć w to, że świat jest w jakiś bardzo złożony sposób uporządkowany, a wszystkie zdarzenia tworzą logiczną całość. Osobiście uważam to podejście za zgubne, życie jest bowiem dużo bardziej nieprzewidywalne niż by się nam wydawało, a wiele aspektów mających na nie kluczowy wpływ na zawsze pozostanie dla nas tajemnicą.

Może to i lepiej.

W końcu podobno tylko rzeczy nieoczywiste są wartościowe.