Olimpiada, Twitter a geolokalizacja*

Dzisiaj przedstawię wizualizację danych dotyczących letnich igrzysk olimpijskich w Londynie pobranych publicznie dostępnym API Twittera. Jest to trzecia wizualizacja prezentowana na tym blogu, która powstała na bazie Twittera i dotyczy sportu. Poprzednie dwie były o Premier League i Euro 2012. Podobnie jak poprzednie, również ta została wykonana w oddziale Netezza IBM Polska i jest ze szczegółami opisana na blogu petascale analytics.

Ta wizualizacja jest wyjątkowa z uwagi na charakterystykę użytych danych. Zbierane wiadomości zawierały informację o lokalizacji/położeniu geograficznym. Wiadomości z informacją o lokalizacji jest jedynie kilka procent, ale wystarczą one do wykonania interesujących grafik. Połączenie informacji o użytkowniku, treści wiadomości, czasie wysłania wiadomości i położenia daje wiele interesujące możliwości. Jeżeli macie pomysły co nowego, ciekawego można zrobić z informacją o położeniu geograficznym – śmiało podzielcie się pomysłami w komentarzach.

Ok, więc czas na pięć historii zbudowanych wokół pięciu wizualizacji.

Na początek zobaczmy gdzie znajdują się osoby piszące wiadomości na Twitterze. Informacja o lokalizacji jest tak dokładna, że prawie można rozróżnić w którym rzędzie na stadionie siedział wysyłający wiadomość. Na poniższej mapie łatwo zlokalizować stadion olimpijski, hale koszykówki i basen na którym przeprowadzane były zawody pływackie. Z okolic tych miejsc pochodziło najwięcej komentarzy.

Dodajmy do informacji o położeniu informację o nastawieniu osoby piszącej wiadomość. Zobaczmy teraz na mapie Londynu gdzie pisano dobrze a gdzie pisano źle o organizacji igrzysk. Okolice stadionu olimpijskiego i hal w których odbywały się zawody w podnoszeniu ciężarów zielenią się od pozytywnych opinii, za to w London City dominują negatywne komentarze.

Osoby piszące dużo wiadomości udostępniają tyle informacji o sobie, że można odtworzyć gdzie przebywały podczas dnia. Ups, problem z prywatnością? Może warto sprawdzić ile z informacji o nas udostępniamy już nie tylko wielkim korporacjom, ale wręcz każdemu internaucie?

Zobaczmy teraz gdzie i ile mówi się o różnych dyscyplinach olimpijskich. Poniżej prezentowanych jest sześć ciekawszych przykładów. O piłce nożnej mówiło się dużo i wszędzie (choć najwięcej na Wembley), zawody zapaśnicze czy taekwondo były rzadziej komentowane i raczej tylko przez osoby śledzące zawody w halach sportowych.

A na koniec, zobaczmy o kim mówiono najwięcej podczas igrzysk olimpijskich? Okazuje się, że po raz kolejny Usain Bolt wyprzedził pozostałych sportowców. Nie jest to dużym zaskoczeniem, a czy w poniższej liście top 200 jest jakieś zaskakujące nazwisko?

 

 

PS: Oczywiście wszystkie wizualizacje wykonano w R.

* słowo geolokalizacja jest niedopuszczalne w grach, ale na tyle się upowszechniło, że pozostawiam je bez dalszego spolszczenia.