Aktualności

Czym jest xG, czyli kiedy spodziewać się gola?

Aktualności14.01.2020 
Dlaczego Krzysztof Piątek strzelając gola Izraelowi na wyjeździe wcale nie był w sytuacji, która zawsze kończy się bramką? Jak skomplikowane były strzały Arkadiusza Milika i Sebastiana Szymańskiego? Tłumaczymy, czym jest specjalny wyznacznik – gole oczekiwane – pomagający w analizie indywidualnej i zespołowej, który również zaczyna przebijać się do świadomości kibiców.

– Oczekiwać to mogę prezentów pod choinką od świętego Mikołaja, ale nie każde życzenie się spełnia, prawda? Dlatego skupiajmy się na faktach – brzmiała opinia Craiga Burleya, byłego piłkarza Chelsea, a obecnie eksperta telewizyjnego. – To najgłupsza wymówka jaką słyszałem. On powiedział o tym pierwszy, a przecież to chyba najbardziej zbędna statystyka w historii futbolu – grzmiał Jeff Stelling, prezenter telewizyjny.

Jaki był powód ich oburzenia sprzed kilku lat? Chodziło o wówczas nowy współczynnik, który został stworzony przez analityków firmy Opta na bazie rozwiązań statystyków związanych z amerykańskimi sportami. „Gole oczekiwane” (w skrócie: xG) weszły do futbolu nagle, zaskakując co bardziej twardogłowych ekspertów, ale nie wszystkich. W końcu pierwszymi, którzy przytoczyli tę liczbę przy okazji meczów byli dziennikarz ESPN Gabriele Marcotti i… prowadzący wtedy Arsenal Arsene Wenger.

Dziś to gole oczekiwane są punktem wyjścia do kolejnych wyznaczników, a także pomagają poszerzyć perspektywę szerszej grupie kibiców piłkarskich. W Anglii najważniejszy program BBC „Match of the Day” przytacza xG po każdym skrócie z Premier League, odpowiednią klasyfikację można znaleźć również pośród gazetowych podsumowań kolejek. Kilka lat temu Burley widząc negatywne reakcje na swoje słowa szydził, że „wkurzył kujonów”, ale prawda jest taka, że po przeciwnej mu stronie jest coraz więcej osób. A jak wygląda sytuacja w Polsce?

20 tys. strzałów

– Nasz początek był taki, że zobaczyliśmy „gole oczekiwane” w Premier League – mówi Filip Dutkowski z serwisu EkstraStats i firmy Sports Solver, które zajmują się innowacyjnymi analizami statystycznymi w polskiej piłce. – Zaczęliśmy zastanawiać się, jak to się liczy, a całość opisał analityk Michael Caley. Podzielił pole karne i jego okolice na kilka stref, notując jak często z każdej z nich strzały kończyły się bramką. Przeszczepiliśmy ten model do Ekstraklasy w 2016 r. Rozróżniamy strzały nogą i głową, z czasem dodaliśmy też liczbę obrońców na drodze do bramki i czy golkiper jest między słupkami. Jest to wciąż model strefowy, podczas gdy pojawia się coraz więcej modeli innego typu, w których lokalizację określa się przez koordynaty X,Y, czyli konkretne miejsce na boisku, skąd został oddany strzał.

Obecnie baza strzałów EkstraStats, którzy na swojej stronie udostępniają za darmo do wglądu statystyki goli oczekiwanych indywidualnych i zespołowych, sięga już dwóch i pół roku zbierania danych. Każdy mecz Ekstraklasy jest oglądany, a strzał zapisywany – tych prób jest już 19263. – Dzięki temu mamy dobry model, by oszacować, jakie jest prawdopodobieństwo strzelenia gola z danej pozycji i w konkretnej sytuacji – tłumaczy.

Jednym z propagatorów goli oczekiwanych jest Billy Beane, który rozpoczął rewolucję statystyczną w amerykańskim baseballu. Jego analityczna ocena potencjału zawodników pozwalała skromnej drużynie Oakland Athletics osiągać wyniki ponad stan, a całą historię przedstawiono w filmie „Moneyball”, a głównego bohatera sportretował Brad Pitt. – Statystyki to rezultat – zaznaczał Beane w wywiadzie dla „FourFourTwo”. – Można mieć ten sam efekt, czyli np. zdobytą bramkę, ale z dwóch różnych wydarzeń, które miały różny stopień trudności w zrealizowaniu. Porównajmy gola Messiego, który mija dziewięciu rywali do zwykłego dołożenia nogi do piłki przed samą bramką. Statystycznie te trafienia dają tyle samo, ale wymagają czegoś zupełnie innego i jedno było znacznie trudniejsze do osiągnięcia – tłumaczył.

W każdym meczu drużyny oddają określoną liczbę strzałów, a każdej próbie przypisywany jest inny współczynnik „goli oczekiwanych”. Jeśli jest to np. uderzenie z piątego metra na wprost pustej bramki, a do tego nogą, to można założyć, że xG jest wysokie – bo takie sytuacje bardzo często kończą się golem. Jeśli jest to jednak strzał z czterdziestu metrów, gdy na drodze jest ośmiu rywali i bramkarz, to współczynnik będzie znikomy, bo piłka do siatki wpada kilka razy na tysiąc zdarzeń. Gole oczekiwane zadają również kłam piłkarskiemu bon-motowi o „sytuacji stuprocentowej” – w każdym rozwiniętym modelu xG nie ma okazji, która w tysiącu symulacji zawsze kończyłaby się bramką.

Nie trzeba mieć wiedzy matematycznej, czy statystycznej, by stwierdzić, że gol Roberta Lewandowskiego ze Słowenią – po kilkudziesięciometrowym rajdzie, z ostrego kąta – jest trudniejszy do strzelenia (xG równe 0,09), niż np. trafienie Krzysztofa Piątka w wyjazdowym meczu z Izraelem (0,72). Jednak dzięki xG można również dowiedzieć się, jakie szanse na zdobycie bramki mieli Sebastian Szymański (0,06) oraz Arkadiusz Milik (0,02), którzy w eliminacjach EURO 2020 trafiali zza pola karnego. W Internecie dostępne są strony, które dają możliwość sprawdzenia każdej sytuacji.

– Jest to miara jakości, jak drużyna stwarza sobie sytuacje, ale też jak robi to sam zawodnik. Przy czym samo xG, jako wyznacznik dyspozycji, skuteczności, kreatywności, to dopiero punkt wyjścia do dalszej analizy, która ma odpowiedzieć na pytanie, co jest jego źródłem. W analizie statystycznej trzeba zastanawiać się, z czego niski lub wysoki współczynnik xG się bierze  – mówi Andrzej Gomołysek, analityk InStat oraz trener z licencją UEFA B. – Może się to wydawać magią, ale tak nie jest. Jest to z jednej strony statystyka złożona, ale z drugiej działająca na wyobraźnię… Choć może w Polsce przebija się bardzo powoli do świadomości. Natomiast zdecydowanie pomaga w spojrzeniu na liczby w futbolu. Trzeba iść w tym kierunku, by statystyki mierzyły coś jakościowego.

Kto spojrzał w dane?

W Anglii często podaje się przykład Juventusu Turyn z sezonu 2015/16, gdy po dziesięciu kolejkach mistrzowie Włoch mieli tylko trzy wygrane. Jednak w tych meczach strzelili znacznie mniej goli, niż wynikało to ze współczynnika xG, czyli sumy jakości stwarzanych sobie szans. Co ważne, tracili też więcej bramek, niż de facto rywale potrafili sobie wykreować, a więc ich wyniki były gorsze, niż faktyczna dyspozycja. – Turyńczycy strzelili wówczas 11 goli, ale ich xG było na poziomie 19. Na drugim końcu boiska stracili dziewięć, choć z goli oczekiwanych wynikało, że powinni wpuścić tylko pięć. Patrząc na te statystyki zakładaliśmy, że wszystko wróci do normy i rzeczywiście, wkrótce szczęście Starej Damy się odwróciło. Wygrali kolejnych 15 meczów w Serie A i zdobyli kolejny tytuł – opowiadał w „FourFourTwo” Duncan Alexander z Opta.

Ekspert z EkstraStats podaje również przykład Lecha Poznań sprzed dwóch sezonów, gdy zespół prowadził Nenad Bjelica. Wówczas według modelu xG „Kolejorz” dominował w lidze zwłaszcza pod względem defensywy i to  pomimo zapaści w rundzie finałowej rozgrywek. W klubie nie wytrzymano jednak presji  i szkoleniowca zwolniono. – Może decyzja byłaby inna, gdyby spojrzeli w szczegółowe statystyki. M.in. xG za trenera Bjelicy było najlepsze w Lechu, imponujące również w porównaniu do kolejnych lat – mówi Dutkowski.

Jednak nowa metodologia dopiero dociera do klubów Ekstraklasy. Jedynie Legia Warszawa oraz Lech Poznań uruchamiają lub planują uruchomić laboratoria badawcze, które z pomocą statystyków, informatyków i uczonych pomogłyby zbierać oraz analizować dane. Tymczasem w topowych ligach rewolucja trwa w najlepsze: o golach oczekiwanych wydano książkę autorstwa Jamesa Tippetta, model jest rozwijany o współczynniki „asyst oczekiwanych”, a nawet stopniowania sytuacji, które nie kończą się strzałem.

Wróćmy jednak do goli oczekiwanych. W trakcie trudniejszego momentu w rundzie jesiennej w Lechu doszło do (regularnego) spotkania sztabu szkoleniowego z osobami z pionu sportowego w klubie. Z informacji „Łączy Nas Piłka” wynika, że analizując przyczyny gorszych wyników odniesiono się właśnie do goli oczekiwanych. Z xG ofensywnych wynikało, że Lech jest tuż za Legią, stwarzał sobie klarowne okazje, ale nie wykorzystywał ich tak często – jednak utrzymując formę można było spodziewać się wyrównania serii.

Nawet ważniejszy był wniosek dotyczący defensywy: „Kolejorz” dopuszczał rywali do klarownych okazji, które były wykorzystywane z wyższą skutecznością niż po drugiej stronie boiska. W treningu oraz stylu gry inaczej rozłożono akcenty i w efekcie od początku listopada Lech stracił tylko trzy gole w siedmiu meczach, notując najniższe w sezonie wyniki xG defensywnego. Mimo że bilans goli oczekiwanych poznanian jest drugi najwyższy w lidze (7,27), to nadal dwukrotnie niższy od Legii, która… jest wyjątkowo skuteczna. Z modelu EkstraStats wynika, że stołeczny zespół powinien strzelić 32-33 gole, a ma ich aż 39.

Punkt wyjścia rewolucji

W Polsce gole oczekiwane to wciąż nowość, a żaden z klubów nie posiada swojego modelu xG. – My podaliśmy całą metodologię, by statystyki w futbolu stały się bardziej powszechne – mówi Dutkowski. Także w tym celu w lutym Sports Solver organizuje warsztaty dotyczące nowoczesnych metod analitycznych w futbolu. Początkowo zakładano jeden dzień zajęć, ale zainteresowanie ze wszystkich stron – klubów, trenerów, dziennikarzy i kibiców – było tak duże, że wynajęto większą salę i otworzono zapisy na kolejny dzień. Już teraz w planach są kolejne konferencje, by przyciągnąć jak najwięcej zainteresowanych.

– Powstaliśmy dlatego, że w futbolu dzieje się rewolucja statystyczna i analityczna, ale polska piłka klubowa nie zbudowała sobie do niej odpowiednich kompetencji. My chcemy pomóc w tworzeniu podstaw i fundamentów, by wiedza zwiększała się z każdym sezonem. Chcemy także zmienić rozmowę o piłce, wprowadzić ujęcie empiryczne, tak aby argumenty, dzięki bardziej rozwiniętym statystykom, były weryfikowalne – tłumaczy.

O tym, że budowanie świadomości jest potrzebne mówi również Gomołysek. – W Polsce wciąż utarło się, że analityk w sztabie zajmuje się wyłącznie nagrywaniem, wycinaniem i obrabianiem materiałów wideo. Liczby może się pojawiają, bo Ekstraklasa ma umowę z firmą dostarczającą klubom i kibicom statystyki, ale czy są one wykorzystywane w analizach? – zastanawia się. – Jesienią w Warszawie odbyła się konferencja analityków z klubów Ekstraklasy i statystyki przewinęły się na ledwie kilku slajdach. Materiały wideo były porządnie, profesjonalnie obrobione, lecz temat analizy statystycznej w zasadzie przemilczano. To nie kwestia zastąpienia jednego drugim, ale uzupełnienia. Nie można wyciągać samych liczb bez wideo, czy na ich podstawie robić analizę. Wszystko musi mieć potwierdzenie – mówi analityk InStat.

– Chcemy pokazać, co jest możliwe, a możliwe jest… wszystko, także w zasięgu klubów – mówi Dutkowski. – InStat i Wyscout ma teraz każdy, ale przewagę można zbudować własnymi rzeczami, pomysłami, analizami. Polskiej piłce na razie tego brakuje. Dlatego pokazujemy na przykładzie goli oczekiwanych, że da się to zrobić i gdzie można rewolucję zacząć - kończy.

Michał Zachodny

Zobacz również

© PZPN 2014. Wszelkie prawa zastrzeżone. NOWY REGULAMIN ŁNP od 25.03.2019 Regulamin portalu DO 25.03.2019 Polityka prywatności