Zastanawiałem się, czy liczba medali zdobytych na olimpiadzie w Rio koreluje z wielkością kraju.
Dane o populacji krajów można pobrać z wikipedii. O liczbie medali np. z serwisu wp.pl. Pobieramy dane pakietem XML i rysujemy pakietem rbokeh (interaktywna grafika, nadająca się na strony www).
Kod R dla obu tych operacji jest tutaj).
Otrzymujemy taki wykres (obie osie są w skali logarytmicznej). Korelacja Spearmana wynosi 0,44. Polska jest w okolicy 33 miejsca na obu osiach.
Wnioski? Korelacja jakaś jest. Co prawda są odstępstwa, częściej są to duże kraje o małej liczbie medali (Indie, Nigeria), rzadko odstępstwa dotyczą małego kraju o dużej liczbie medali.
Maciej Samcik pisał niedawno o korelacji liczby medali z PKB:
http://samcik.blox.pl/2016/08/Na-igrzyskach-w-Rio-rzadzil-PKB-Czy-naszych-11.html
A co z państwami, które nie zdobyły żadnego medalu?
A tu inne ciekawe zestawie: ilu sportowców danej reprezentacji przypada na jeden medal (w sportach zespołowych medal dla całej drużyny liczy się jako jeden):
https://oko.press/nikt-wyslal-tylu-sportowcow-malo-medali/
Polska wypada słabo – 22 sportowców na jeden medal (wynik zaniżają siatkarze i szczypiorniści).
Ciekawsze może byłoby porównanie jak wygląda kwalifikacja medalowa w odniesieniu do PKB, wydatków na sport.
Jeszcze jakby to było z podziałem na mężczyzn i kobiety i np. na grupy: lekkoatletyka, pływanie, wioślarstwo,…?
Apropos dołączonego kodu.
Czy przypadkiem zamiast biblioteki „XML” nie powinna być załadowana biblioteka „rvest” ?
Apropos dołączonego kodu.
Czy przypadkiem zamiast biblioteki „XML” nie powinna być dołączona biblioteka „rvest” ?
Dzięki za linki.
Pytanie o efekt PKB, liczby wysłanych zawodników czy innych zmiennych to ciekawy pomysl na projekt z modeli liniowych/mieszanych. Zostawię na letni semestr.
Co do rvest zamiast XML -to całkiem możliwe, dzięki.
Krajów bez medali nie ma w tym zestawieniu, nie było ich w klasyfikacji wp. Przyjrzę im się po wakacjach.
Na dobrą sprawę, na wykresie powinienem jmieścić liczbę medalistów a nie medali, jeżeli już ją zestawiać z populacją kraju.
Okazuje się, że filtr antyspamowy restrykcyjnie poblokował kilka komentarzy. Przeczyszczę po wakacjach.
Temat alternatywnych klasyfikacjach medalowych wałkowany jest od dobrych kilku lat. Pierwszy szerzej to zrobił Datablog (The Guardian) https://www.theguardian.com/sport/datablog/2012/jul/30/olympics-2012-alternative-medal-table
Na bazie tych m.in. danych Google podczas Rio 2016 cały czas prowadził taką klasyfikację:
https://landing.google.com/altmedaltable/results/
Tutaj Rogers (kiedyś Datablog, a teraz Google) opisuje jak powstawał ten ranking
https://medium.com/google-news-lab/building-an-alternative-olympic-medal-table-da0beea525e0#.8xi6umdok
Przekopując się przez feedly znalazłem jeszcze dwa posty dotyczące medali w Rio. Nature vs nurture (http://www.spoleczenstwo.pl/?p=593) i Olimpijskie sukcesy – jak wypadliśmy na igrzyskach w Rio?(http://szychtawdanych.pl/?p=1181)