EURO 2016 v2

Ostatnio pisałem o artykule w którym uzgadniano szanse wygrania Euro przez drużyny na bazie zakładów bukmacherskich. Dostępny zbiór danych wykorzystaliśmy na ostatnich zajęciach ze Statystyki 2 do zabawy w przewidywanie czy Polska wyjdzie z grupy. Różne osoby, próbowały różnych modeli, jeden przypadł mi szczególnie do gustu i poniżej go opiszę.

Model jest taki: jeżeli drużyna A gra przeciw drużynie B, to liczbę goli, które A strzeli B można modelować jako funkcje zależną od różnicy w sile A-B.

Informacje o różnicach w sile można wziąć np. z rankingu FIFA, informacje o liczbie strzelonych goli z wikipedii. Liczba goli jest całkowita więc przyjmujemy, że modelujemy ją rozkładem Poissona z domyślną funkcją łączącą – log.

I tak powstał poniższy wykres. Każdy mecz drużyn A vs B to dwie kropki, jedna opisuje ile goli A strzeliła B a druga kropka ile goli B strzeliła A. Na osi OX jest różnica siły w rankingu FIFA a na OY liczba strzelonych goli. Szara linia przedstawia oczekiwaną liczbę goli w oparciu o regresję Poissona. Zaznaczyłem też trzy punkty – największe outliery. Belgia jest w rankingu FIFA o prawie 400 punktów wyżej niż Włosi, a jednak to Włosi strzelili dwie bramki. Hiszpania strzeliła 3 gole, choć przy jej przewadze spodziewać można było się mniejszej liczby. Niemcy przy swojej przewadze w rankingu FIFA powinni coś strzelić (choć szans na gol więcej mieli Polacy).

Screen Shot 2016-06-20 at 01.02.03

Taki model. Może założenie o rozkładzie Poissona nie jest najlepsze i ranking FIFA nie jest najbardziej odpowiedni, ale przynajmniej łatwo zapamiętać jak działa i jak korzystać z regresji Poissona.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *