Najgorszy wykres 2017 roku

Zbliża się Sylwester, czas więc wybrać najgorszą prezentację danych opublikowaną w roku 2017.
Konkurs na najgorszą wizualizację przeprowadzamy co roku od 2012 (edycja 2016, edycja 2015, edycja 2014, edycja 2013, edycja 2012). W tym roku było wiele ciekawych zgłoszeń przesłanych przez facebook, emailem, od studentów przedmiotu Techniki Wizualizacji Danych. Ze zgłoszeń wybrałem 10 niezwykłych wykresów, mogących moim zdaniem śmiało rywalizować o tytuł najgorszego wykresu ever.

Zasada plebiscytu jest prosta. Do końca roku można wskazywać swoje typy na najgorszy wykres, głosując za pomocą ankiety umieszczonej na końcu tego wpisu (w jednym dniu można głosować tylko raz. Jednocześnie można wskazać do 5 kandydatów). Po nowym roku zobaczymy, który wykres otrzymał najwięcej głosów. To on otrzyma tytuł „Zniekształcenie roku 2017”. Aby ułatwić głosowanie, każdy kandydat ma skrótową wpadającą w ucho nazwę.

1. Detale są bez znaczenia

Ten wykres pochodzi z tvn24. Za pomocą słupków przedstawiono nakłady na zdrowie jako % PKB. Co jednak ciekawe, długość słupków wcale nie jest proporcjonalna do prezentowanych liczb. Słupki systematycznie sobie rosną zaznaczając wyłącznie kolejność. Wartość zakodowana przez pierwszy słupek różni się od wartości zakodowanej przez czwarty tylko o 1,2 pp. Różnica pomiędzy dwoma ostatnimi to 1,5 pp. Długość słupków tylko wprowadza w błąd. Wartości liczbowe zostały zignorowane – jak widać to tylko detale.

Screen Shot 2017-10-24 at 21.55.04

2. 12%

Ten wykres pochodzi z benchmarku nvidia. Wygląda na to, że wzrost wydajności jest naprawdę duży (pierwszy słupek jest 3x mniejszy od ostatniego), przynajmniej dopóki nie spojrzy się na oś. Więcej podobnych ciekawych zniekształceń jest opisanych tutaj.

nvidia

3. Gdzie jest Wally?

Mapki (czyli kartogramy) są wspaniałe, wyglądają elegancko, często są kolorowe i jeszcze powodują przyjemne uczucie zrozumienia, przecież ’łał widziałem gdzieś ten kształt – to chyba kontury Polski’.
Do pewnych analiz kartogramy się jednak zupełnie nie nadają, a jedną z nich jest porównywanie dwóch kartogramów.
Np. jak znaleźć istotne różnice na poniższych kartogramach?
Przykład pochodzi z biqdata.

Screen Shot 2017-10-23 at 15.47.11

4. Będzie lepiej!

Wykresy słupkowe to jedna z najprostszych w użyciu technik prezentacji danych. Trudno zrobić je źle, a jednak, poniższy wykres pokazuje, że się da. Prezentuje dane z lat 2016/2017 oraz prognozy. A prognozy nie dość, że są optymistyczne, to jeszcze narysowane w taki sposób…
Źródło

Screen Shot 2017-01-25 at 15.17.38

5. Jak tankować, to tylko na Śląsku

Za Forbes podajemy wykres ze średnimi cenami benzyny w różnych województwach. Gdzieś musi być drożej, a gdzieś musi być taniej, ale czy z poniższego wykresu łatwo odczytać, że maksymalna różnica cen pomiędzy województwami to 5%?

tabelka-ceny-paliw

6. Nie interesuję się

Poniższy wykres pochodzi z portalu oko.press i prezentuje odpowiedzi na pytanie które wydarzenia można uznać za najważniejsze w 2016 roku.
Jeden z nielicznych przypadków w których legenda jest 3 razy większa niż wykres, sam wykres całkowicie nieczytelny, właściwie jedyne co można odczytać to, że na pytanie ,,Które wydarzenie było najważniejsze” w poprzednim roku najczęstsza odpowiedź to ,,Nie wiem, nie interesuję się, nie zastanawiałem się”.

screen-shot-2016-12-31-at-10-12-02

7. Walec

Jak przedstawić cztery liczby by wyglądały poważnie? Dodajmy dwie kategorie, masę cyfr najlepiej nic nie wnoszących i koniecznie pokażmy dane w 3D. Gdy jeszcze zastosujemy różne agregacje dla różnych słupków oraz dwie kategorie, wtedy będziemy mogli być pewni, że z wykresu niewiele da się odczytać.

Żródło wyjaśnia związek tego wykresu ze smogiem w Wadowicach.

Screen Shot 2017-10-24 at 22.04.01

8. Ślub tylko w miesiącu z r i roku z 0

W serwisie Bankier znaleźć można taki zaskakujący wykres przedstawiający liczbę małżeństw.
Z jakichś niezwykłych powodów autor wykresu zdecydował się pomiędzy pomiarami dodać dołki aby wykres był ciekawszy.

Screen Shot 2017-02-14 at 16.38.49

9. Wrocław na tle innych miast

Na portalu wroclaw.pl znaleźć można porównanie finansów Wrocławia z pięcioma innymi dużymi miastami. Dane ciekawe, ale sposób prezentacji dziwaczny (w raporcie jest więcej takich kwiatków). Np. co można odczytać z poniższej szarlotki (podpowiedź, segmenty szarlotki NIE są posortowane po wielkości)?

Screen Shot 2017-12-28 at 01.03.31

10. Będzie impreza

Na portalu biznes.onet umieszczono portret zamożnego Polaka. Poniższy wykres pokazuje rozkład wielkości miesięcznych oszczędności. Nie przypuszczałem, że to powiem, ale: te dane znacznie lepiej byłoby pokazać na wykresie kołowym. A tutaj, skąd te kolory, skąd te wielkości?

kola

Który wykres zasługuje na tytuł ,,Zniekształcenie roku 2017''?

View Results

Loading ... Loading ...

Konkurs na najgorszy wykres 2016 roku

Zbliża się nasz konkurs na najgorszy wykres tego roku. Kandydaci z poprzednich lat dowodzą, że nie jest prosto zdobyć ten tytuł (edycja 2015, edycja 2014, edycja 2013, edycja 2012).

Zasada konkursu jest prosta. Raz dziennie, do końca roku, można wskazać swoje typy za pomocą ankiety umieszczonej na końcu tego wpisu. Po nowym roku zobaczymy, który wykres otrzymał najwięcej głosów. To on otrzyma tytuł ,,Zniekształcenie roku 2016”, a więc grafikę najbardziej zniekształcającą prezentowane dane. Aby ułatwić głosowanie, każdy kandydat ma skrótową nazwę ,,wpadającą w ucho” nazwę.

Tym razem nominowanych grafik było kilkadziesiąt. Część otrzymałem na maila, część trafiła do mnie przez tag @smarterpoland na Facebooku lub Twitterze. Aby uprościć głosowanie, wybrałem 13 grafik w czterech grupach: ,,Ach te słupki”, ,,Co tam panie w polityce”, ,,Pole minowe” i ,,Niefortunne koło”.

Niech zwycięży najlepszy!

Czytaj dalej Konkurs na najgorszy wykres 2016 roku

Program 500+ a prezentacja danych na tle mapy

Na portalu wp.pl trafiłem pod artykułem Platforma celowo opóźnia wypłaty 500+? Mocne słowa posła PiS na taką grafikę.

Screen Shot 2016-05-27 at 09.53.19

Artykuł jest o tym, że w miastach w których wygrało PO procent rozpatrzonych wniosków w programie 500+ jest znacznie mniejszy niż w miastach w których wygrał PiS (pomińmy na chwilę to, że w Polsce mamy więcej niż 8 dużych miast).

Z powyższego wykresu najbardziej w oczy rzuca się to, że z tych 8 miast PO wygrało w 4 największych a PiS w 4 najmniejszych.
Rzuca się to w oczy dlatego, że liczba złożonych wniosków jest proporcjonalna do obwodu zewnętrznego brzegu obwarzanka a nie go jego pola.
Liczby, które są główną treścią artykułu, czyli procent rozpatrzonych wniosków, odpowiadają zaznaczonemu ciemniejszym kolorem wycinkowi okręgu.
Utrudniono porównywanie tych wycinków na kilka sposobów. Jednym jest to, że na wycinkach są liczby które przykrywają część informacji, w przypadku Ostrołęki skutecznie utrudniając jakiekolwiek porównania. Okręgi są umieszczone w różnych punktach (a szkoda, a mogłyby mieć wspólny środek).
Liczby umieszczone są w różnych miejscach grafiki, przez co trudno wykonać na nich jakieś sensowne operacje, jak np. policzyć sumaryczną liczbę przyznanych wniosków.

Te same informacje można przedstawić np. na poniższym wykresie mozaikowym. Można prosto odczytać zarówno procent rozpatrzonych wniosków, liczbę złożonych i rozpatrzonych wniosków.

Screen Shot 2016-05-29 at 08.52.21

Konkurs na najgorszą grafikę 2015

Zbliża się koniec roku, czas na wybór najgorszej grafiki tego roku. Trzeba przyznać, że laureaci konkursów z poprzedniego roku, sprzed dwóch lat czy sprzed trzech lat stawiają poprzeczkę dosyć wysoko. Ale i w tym roku nie brakuje znakomitych kandydatów.

Zasada jest prosta. Wybieramy wykres, który otrzyma tytuł ,,Zniekształcenie roku 2015”. A więc grafikę najbardziej zniekształcającą przekazywane dane. Na końcu wpisu znajduje się sonda. Głosować można na więcej niż jeden wykres. Aby ułatwić głosowanie, każdy kandydat ma skrótową nazwę.

Rok 2015 był rokiem wyborów (Prezydent, Sejm, Senat), połowa z poniższych zgłoszeń ma jakiś związek z wyborami. Zanim zaczniemy ich prezentację chciałbym zaznaczyć, że pojedyncze wpadki (jak prezentowane poniżej) nie są dowodem stronniczości tego czy innego medium (nie są też dowodem braku stronniczości). Nie ma co więc wysuwać zbyt ogólnych wniosków o mediach, skupmy się na wykresach.

Niech zwycięży najlepszy!

Czytaj dalej Konkurs na najgorszą grafikę 2015

Robisz to źle: sondaże dot. referendum z 6 września

Na portalu Gazeta.pl znalazłem ostatnio prezentacje wyników sondaży dot. uczestnictwa w planowanych referendach.

Moją uwagę przykuł poniższy wykres, prezentujący rozkład odpowiedzi na pytanie ,,Czy weźmiesz udział w referendum ogłoszonym na 6 września?”.

Screen Shot 2015-08-25 at 15.46.04

Czytaj dalej Robisz to źle: sondaże dot. referendum z 6 września

Konkurs na najmniej udany wykres 2014 roku

Rok temu, w grudniu, organizowaliśmy konkurs na wykres przekłamujący dane. Podobny konkurs organizowaliśmy dwa lata temu. W tym roku nieco zmieniliśmy formułę. Zamiast szukać przekłamań, tropimy błędy, które utrudniają odczytanie informacji z wykresów. Każdemu może przydarzyć się nieczytelny wykres, ale te wykresy pochodzą z miejsc, gdzie błądzenie powinno być rzadsze, czyli z raportów ministerstw i poważniejszych mediów.

W szrankach stanie więcej wykresów niż w poprzednich edycjach konkursu. Wiele z nich nadesłanych zostało przez czytelników (za co bardzo dziękuję). Znaleziska z poprzednich lat wypełniły esej ,,info-pomyłka” ze zbioru esejów o wizualizacji, zwycięzcy tego głosowania trafią do kolejnej wersji eseju.

Ponieważ statystycy zajmujący się wizualizacją danych praktycznie jednym głosem krytykują wykresy kołowe, prezentację kandydatów zaczniemy właśnie od nich.

Czytaj dalej Konkurs na najmniej udany wykres 2014 roku

Esej 5: Info-pomyłka

Przed chwilą udostępniliśmy esej o tytule ,,Info-pomyłka” pod adresem www.biecek.pl/Eseje/indexPomylka.html. Piąty z serii ,,Wakacje z wizualizacją”.

W tym eseju znaleźć można wiele przykładów błędów w prezentacji danych. Tak celowych manipulacji jak i nieumyślnych potknięć. Wszystkie prezentowane w tym eseju przykłady są z polskiego podwórka, więc lektura powinna być interesująca.

We wtorek zorganizowaliśmy konkurs pośrednio związany z tym esejem. W konkursie należało zaproponować artykuł w którym wykorzystywane są dane. Tym razem otrzymaliśmy 49 zgłoszeń. Co ciekawe każde inne i większość z bardzo różnych tematów (sporo artykułów – ciekawostek, trochę artykułów o polityce, ekonomii i sporcie). Żaden artykuł nie powtórzył się, co dla mnie jest zaskoczeniem (patrz paradoks urodzin, jaka jest szansa, że dwóch studentów z 25 osobowej grupy ma urodziny tego samego dnia?). Ale pozytywnym zaskoczeniem, ponieważ jest więcej materiału do opracowania.

W konkursie wygrał numerek 31, czyli osoba o mailu krzysztof.**********@gmail.com. Gratulujemy! Skontaktujemy się mailowo. Za trzy tygodnie kolejny, ostatni już konkurs.

Ten esej to część zbioru ,,Odkrywać! Ujawniać! Objaśniać!” wydanego przez Fundację, dostępnego już w sprzedaży. O tym jak go kupić można przeczytać na stronie http://biecek.pl/Eseje/ indexZakup.html. Co trzy tygodnie na stronie http://biecek.pl/Eseje/ będziemy publikować kolejny rozdział w postaci elektronicznej, bezpłatnie, na otwartej licencji CC BY&SA.

Dane statystyczne w mediach, konkurs

Czy wykresy służą do manipulowania danymi?
Zazwyczaj (niektórzy powiedzieliby ,,statystycznie”) nie, choć patrząc na niektóre wykresy, nieporadnie prezentujące proste dane, można mieć wątpliwości.

Dobrych wykresów jest coraz więcej, zarówno dlatego, że narzędzia nie pozwalają już popełniać podstawowych błędów, jak i też dlatego, że rośnie świadomość autorów wykresów. Ale wciąż znaleźć można zabawne lub przerażające info-pomyłki i to o nich jest szósty Esej ,,Info-Pomylka”, który odkryjemy za dwa dni.

Czas więc na konkurs.

Wykresy w polskiej prasie pojawiają się coraz częściej, między innymi dlatego, że rośnie dostępność danych, które można pokazać.
Ale nie wszystkie dane okazują się wystarczająco ciekawe by znaleźć się w gazetach lub portalach informacyjnych.
Dzisiejszy konkurs dotyczy właśnie danych liczbowych, które przebijają się do mediów drukowanych lub elektronicznych.

Aby wziąć udział w konkursie, należy znaleźć artykuł z polskojęzycznego portalu informacyjnego, który prezentuje jakieś liczby.
Czy to rankingi, czy wyniki konkursów sportowych, czy poparcie polityczne, czy informacje o demografii czy przestępczości, czy ekonomii, bez znaczenia.

Reguły:
1. W losowaniu biorą udział wszystkie odpowiedzi, nie ma poprawnych i niepoprawnych!.
2. Jedna osoba może wziąć udział tylko raz w tej zabawie.
3. Liczą się tylko głosy oddane dziś i jutro (30 września, 1 października).
4. Spośród odpowiedzi wylosuję jedną osobę, która otrzyma papierowe wydanie Esejów.

Po co?
Pracuję teraz nad zestawem wskazówek dotyczących czytania danych z artykułów prezentowanych w mediach. Okazuje się, że nie zawsze to jest proste, warto pewne rzeczy wyjaśnić.
Ale o jakich zastosowaniach danych w mediach warto opowiedzieć? Tutaj właśnie liczę na Wasze zgłoszenia konkursowe, mam nadzieję z nich odczytać z jakim typem artykułów zazwyczaj kojarzone są dane liczbowe.

Powodzenia w losowaniu. Książka czeka.

[Jeżeli powyższy formularz się nie wyświetla, proszę wysłać odpowiedź przez tę stronę]

Wykresy kołowe są passé

Jestem jedną z tych osób, które uważają, wykresy kołowe to najgorszy możliwy sposób prezentacji danych.

Jakiś czas temu Maciej B. przesłał mi link do raportu, który zachwiał tym przekonaniem.

Raport o wdzięcznym tytule ,,Analytics: The real-world use of big data” opracowany przez IBM Institute for Business Value zawiera wykresy kwadratowe. Oto jeden z nich:

Jaki morał wyciągnąłem z tego raportu?
Big Data przełamie jeszcze niejedną barierę.

Robisz to źle: narracja z użyciem wykresu

W piątkowym numerze ,,Ekonomia & rynek” znalazłem poniższy wykres ilustrujący podtytuł ,,Taki wzrost prognozowali najwięksi optymiści. Większy jest już tylko w Rumunii”.

Wykres pokazuje najwyższy wzrost PKB w Polsce, podtytuł mówi, że w Rumunii jest wyższy.
Dziwnie też wygląda legenda wykresu, oznajmiająca, że 2 zaznaczone jest na żółto a na wykresie są trzy kraje zaznaczone na zielono ale ze wzrostem 2.

Może to tylko błąd na wykresie, a może tylko błąd w tytule. Interesujące pytanie to: który z tych dwóch sprzecznych komunikatów zapamiętamy?