Rok temu, w grudniu, organizowaliśmy konkurs na wykres przekłamujący dane. Podobny konkurs organizowaliśmy dwa lata temu. W tym roku nieco zmieniliśmy formułę. Zamiast szukać przekłamań, tropimy błędy, które utrudniają odczytanie informacji z wykresów. Każdemu może przydarzyć się nieczytelny wykres, ale te wykresy pochodzą z miejsc, gdzie błądzenie powinno być rzadsze, czyli z raportów ministerstw i poważniejszych mediów.
W szrankach stanie więcej wykresów niż w poprzednich edycjach konkursu. Wiele z nich nadesłanych zostało przez czytelników (za co bardzo dziękuję). Znaleziska z poprzednich lat wypełniły esej ,,info-pomyłka” ze zbioru esejów o wizualizacji, zwycięzcy tego głosowania trafią do kolejnej wersji eseju.
Ponieważ statystycy zajmujący się wizualizacją danych praktycznie jednym głosem krytykują wykresy kołowe, prezentację kandydatów zaczniemy właśnie od nich.
Kandydat nr 1. Zaginione fragmenty
Źródło: strona Ministerstwa Nauki i Szkolnictwa Wyższego (przekierowanie do serwisu GUS) raport Szkoły wyższe i ich finanse w 2012 r. oraz w latach poprzednich.
Zagadkowy wykres, co stało się z paskami prezentującymi kraje na lewym kole? A co odpowiada za kolejność krajów na prawym kole?

Kandydat nr 2. Pinkie Pie
Poniższy wykres kołowy pokazuje (?) w której dzielnicy mieszka więcej lub mniej warszawiaków. Nie potrafię odgadnąć jaką informację koduje 17 różnych odcieni różu. Dzielnice są posortowane alfabetycznie poczynając od dolnego prawego rogu, utrudnia to odczytanie np. tego ile dzielnic ma mniejszy odsetek mieszkańców niż Bemowo (lub dowolna inna dzielnica).

Kandydat nr 3. Tajemnicze ćwiartki
Źródło: serwis Ministerstwa Środowiska raport Informacja o stanie lasów oraz o realizacji „Krajowego programu zwiększania lesistości”.
Brak legendy może zawęzić krąg odbiorców. Na poniższym wykresie umieszczono skróty jakichś nazw, ale nie umieszczono wyjaśnienia tych skrótów. Na wykresie nie ma legendy. Znaczenie tych skrótów nie jest też wyjaśnione w akapicie odnoszącym się do wykresu przez co dla kogoś spoza branży ten wykres wiele nie powie (zakładam, że raporty ministerstwa kierowane są też dla osób spoza branży).

Kandydat nr 4. Szarlotka w 3D i z napisami
Każdy pseudo-trójwymiarowy wykres kołowy zniekształca percepcje kątów. Sprawia to, że komunikat wizualny, szybciej interpretowany przez mózg, może stać się niezgodny z komunikatem liczbowym.
Patrząc na poniższy wykres, oceńmy na ile '6.5%’ przy 'uszkodzone/przemysł’ wydaje się większe od '4,7%’ przy 'Pozostałe kategorie’? Różnica pomiędzy tymi wartościami to prawie 40%. Ale nie widać tego. Wręcz trudno ocenić, który z tych wycinków jest większy niż drugi.

Kandydat nr 5. NRN = najmniejsze rozpoznawalne napisy
Na zlecenie Ministerstwa Pracy i Polityki Społecznej popełniono bardzo ciekawy raport „Aktywność kobiet na rynku pracy”. Niestety sposób prezentacji wyników pozostawia miejscami sporo do życzenia.
Poniższy wykres przedstawia w gruncie rzeczy pięć liczb, więc historia nie jest zbyt skomplikowana. Większość wykresu to tło, wielkość napisów w legendzie została tak dobrana by nie dało się łatwo domyślić co ten wykres przedstawia. Również podział kategorii jest dosyć nieszczęśliwy (praca w co drugi dzień to mniejsza liczba dni w tygodniu, dlaczego to różne kategorie? Co dokładniej oznacza mniejsza liczba godzin i dni w tygodniu?).

Kandydat nr 6. Dobór kolorów ma znaczenie
Kolejny wykres pochodzi z raportu Społeczeństwo informacyjne w liczbach dostępnego w serwisie Ministerstwa Administracji i Cyfryzacji.
Na stronie z raportami widnieje ostrzeżenie: ,,W serwisie tym udostępniamy raporty i dane przygotowywane lub wykorzystywane przez MAC. Te raporty zostały przygotowane w przeszłości, dlatego mogą nie spełniać do końca wymogów dostępności (mogą np. zawierać niedostępne dla czytników grafiki)”. Być może ono tłumaczy, dlaczego ten raport z przeszłości przedstawia poziom umiejętności za pomocą czterech odcienie beżu. Przy czym najjaśniejszy odcień oznacza niskie umiejętności, a pośrednie odcienie oznaczają brak umiejętności (!!) i średnie umiejętności.
[jako bonus dodałem komentarz ,,ogólnie dorośli nie mają pędu do wiedzy” umieszczony pod wykresem, ale odnoszący się do kolejnych wyników]

Nie tylko w wykresach kołowych można szukać dziury.
Kandydat nr 7. Najbardziej różowe województwa
Wykres z serwisu Ministerstwa Pracy i Pomocy Społecznej (link tutaj). Zastanawia mnie klucz jakim wybierano kolory na legendzie, od różu przez ciemną zieleń do jasnej zieleni?

Kandydat nr 8. Zakrzywienie czasoprzestrzeni
Wykres z gablotki w Narodowym Centrum Badań Jądrowych. Mógłbym przeboleć pseudo trzeci wymiar, ale nie mogę zrozumieć, jak to możliwe, że słupki mają różne kierunki ale linie pomocnicze są proste. Czy nie powinny być wygięte? [tak, wiem, równie dobrze można doszukiwać się sensu w serialach]

Kandydat nr 9. O jedno zero za mało
Wykres z portalu wyborcza.biz [nadesłany przez czytelnika]. W czterech panelach (z pięciu) uwzględniono zero na osi OY, dzięki czemu możny porównywać wartości pomiędzy osiami oraz można oceniać względne tempo wzrostu.
Wyjątkiem jest prawy panel, na którym wzrost o 50% wygląda na większy o kilka rzędów niż wzrosty na innych panelach (a spółek komandytowych przybywa znacznie szybciej).

Kandydat nr 10. Przepraszam, czy tu coś widać?
Infografika z portali gazeta.pl za portalem domiporta.pl. Prezentuje potencjalnie ciekawą informację o tym gdzie więcej a gdzie mniej kradną. Ale dlaczego za pomocą długości trójwymiarowych słupków? Ile czasu potrzeba by znaleźć drugie i drugie od końca województwo pod kątem kradzieży samochodu z włamaniem.

Kandydat nr 11. 161% zasięgu
Wykres z Pulsu Biznesu [nadesłany przez czytelnika]. Tytuł wykresu mówi o zasięgu usług, ale sam wykres przedstawia zsumowane różne segmenty usług. Coś spadło do 161 procent w 2014 roku ale to raczej nie zasięg usług.

Kandydat nr 12. Co łączy Ursus i Wilanów?
Pod tym adresem znajduje się raport związany ze zdrowiem warszawiaków (dla wielu ciekawy temat). Dane są jednak tak posiekane na części, że pewne wyniki wydają się bardzo dziwne.
Np. w Ursusie samobójstw jest cztery razy mniej niż w innych dzielnicach a już na Wilanowie to wypadków komunikacyjnych jest cztery razy mniej niż w innych dzielnicach. O ile jeszcze dla wypadków komunikacyjnych da się znaleźć historię pasującą do wyników (mniej dróg?) to co z samobójstwami?
Co łączy Ursus, Włochy, Żoliborz i Wilanów? To mniejsze dzielnice, o ludności znacznie poniżej 100 tys mieszkańców. Prezentowane na wykresie częstości są szacowane na bazie dziesiątek, małych setek zgonów, przez co są obciążone dużą zmiennością.

Kandydat nr 13. Słabe i słabsze strony
Ponownie raport ,,Społeczeństwo informacyjne w liczbach” z MAC (przypominam, serwis z raportami z przeszłości).
Tym razem wykres prezentujący nasze silne (??) i słabe strony na tle UE. Kolejność czynności (kolejne wymiary) jest dosyć zagadkowa, podobnie jak wybór zakresu dla osi. W przypadku 'umiejętności pisania programu komputerowego’ prezentowane pozycja kropki na osi przebiła zero.

Kandydat nr 14. Połącz podobne kolory
Wykres z serwisu Ministerstwa Infrastruktury i Rozwoju Wydatki strukturalne w Polsce w latach 2003-2010 wraz z prognozą na lata 2011-2020
Zastosowanie siedmiu różnych odcieni pomarańczowego i legenda w której etykiety nie mają żadnego łatwego do odgadnięcia porządku [a z pewnością nie pomagającego w odczytaniu, która krzywa to która wartość]. Co ciekawe raport wykonany przez PwC.

Kandydat nr 15. 155 cyfr
Z portalu Ministerstwa Rolnictwa i Rozwoju Wsi Ogólna informacja o stanie realizacji poszczególnych działań w ramach PROW 2007-2013
Wykres powalający chęcią precyzyjnego przedstawienia liczb. Co prawda słupki są w pionie bardzo ściśnięte, przez co ledwie widać o ile sąsiednie słupki różnią się długością, ale liczby są przedstawione z siedmiocyfrową precyzją (choć przyznacie im więcej cyfr tym trudniej coś porównać). Jak na wizualizację danych, większy nacisk postawiono tu na liczby nie na wizualizację. Tabela byłaby równie czytelna, a nawet czytelniejsza o ile co trzy cyfry doda się separator tysięczny.

Kandydat nr 16. Jak szybko przybywa lasów?
Z serwisu Ministerstwo Środowiska raport Informacja o stanie lasów oraz o realizacji „Krajowego programu zwiększania lesistości”.
Wykres paskowy z którym jest kilka problemów.
Tytuł ,,zmiana powierzchni” mógłby sugerować, że słupki przedstawiają o ile zmieniła się powierzchnia lasów. Ale nie, one przedstawiają powierzchnię lasów. Zmianę trzeba sobie oszacować.
Szacując zmianę, należy wziąć pod uwagę, że słupki nie zaczynają się w zerze, ich względna długość nie niesie więc informacji. W przedstawianym okresie powierzchnia lasów zwiększyła się o 2,85% (choć słupki sugerują większą zmianę).
Czytając etykiety można przecinek dziesiętny odczytać jako separator tysięcy (na osi OY zawsze po nim są trzy cyfry), ale w rzeczywistości jest to przecinek dziesiętny. Gdyby usunąć wszystkie przecinki i 'mln’ zastąpić 'tys’ nie byłoby problemu.

Głosować można na kilka wykresów.
Niech wygra najgorszy wykres!

Nieśmiało proponuję wprowadzić poprawki do wykresu który przedstawia wyniki głosowania na najgorszy wykres, bo w tej formie można by go dołączyć do puli wykresów na które można głosować 😉 Chyba że taki właśnie był zamysł, to wtedy proszę zignorować poniższe.
1) Zsumowanie wartości procentowych daje znacznie więcej niż 100%. Zapewne to wynik tego, że można głosować na kilka wykresów jednocześnie.
2) Słupki mają długość przedstawioną w jakiejś zaskakującej skali. Np różnica długości pomiędzy 16 – 15 Votes jest całkiem spora, ale już różnica 15 – 14 Votes jest znacznie mniejsza.
Pozdrawiam.
Wykres nie jest najlepszy,
Procenty nie sumują sie do 100% z powodów o których piszesz, ale same słupki można by przedstawić lepiej.
Problem w tym, że nie znam lepszych wtyczek do wordpressa pozwalających na robienie sondaży. Ale jestem otwarty na propozycje.
Mnie zastanawia także dobór krajów, które znalazły się na lewym wykresie (kandydat 1). Nie są to ani kraje europejskie (jest Arabia Saudyjska), ani nie są to kraje o najwyższej liczbie studentów, studiujących w Polsce (studentów z USA i Chin jest więcej niż chociażby z Francji, a znalazły się one na prawym wykresie). Dość zagadkowe.
Microsoft PowerView, czyli jak nie prezentować możliwości narzędzia do tworzenia wykresów… https://support.office.com/en-us/article/charts-and-other-data-visualizations-in-Power-View-141bd462-9853-4973-ac37-842e8345f51e
Zgłaszam kandydata do edycji 2015
http://www.zelaznalogika.net/sondazowy-wehikul-czasu-tvp/
Nie dośc, że zamieniona kolejność miesięcy, to 0>2 na ostatnim słupku.
Świetne