Na portalu wp.pl trafiłem pod artykułem Platforma celowo opóźnia wypłaty 500+? Mocne słowa posła PiS na taką grafikę.
Artykuł jest o tym, że w miastach w których wygrało PO procent rozpatrzonych wniosków w programie 500+ jest znacznie mniejszy niż w miastach w których wygrał PiS (pomińmy na chwilę to, że w Polsce mamy więcej niż 8 dużych miast).
Z powyższego wykresu najbardziej w oczy rzuca się to, że z tych 8 miast PO wygrało w 4 największych a PiS w 4 najmniejszych.
Rzuca się to w oczy dlatego, że liczba złożonych wniosków jest proporcjonalna do obwodu zewnętrznego brzegu obwarzanka a nie go jego pola.
Liczby, które są główną treścią artykułu, czyli procent rozpatrzonych wniosków, odpowiadają zaznaczonemu ciemniejszym kolorem wycinkowi okręgu.
Utrudniono porównywanie tych wycinków na kilka sposobów. Jednym jest to, że na wycinkach są liczby które przykrywają część informacji, w przypadku Ostrołęki skutecznie utrudniając jakiekolwiek porównania. Okręgi są umieszczone w różnych punktach (a szkoda, a mogłyby mieć wspólny środek).
Liczby umieszczone są w różnych miejscach grafiki, przez co trudno wykonać na nich jakieś sensowne operacje, jak np. policzyć sumaryczną liczbę przyznanych wniosków.
Te same informacje można przedstawić np. na poniższym wykresie mozaikowym. Można prosto odczytać zarówno procent rozpatrzonych wniosków, liczbę złożonych i rozpatrzonych wniosków.
Byłoby fajnie gdyby przy okazji takich wpisów (propozycja wykresu w R) był też podawany kod R-a. Zakładam że ten wykres był zrobiony w R/ggplot2. 😉
Akurat mozaiki w ggplot2 wychodzą tak sobie,
Ten wykres robiłem funkcją mosaicplot() a później adobe ilustrator.
No tak, ale to w ogóle jest pytanie o rzetelne podejście do danych.
Popatrzmy na liczby bezwzględne: w tym samym okresie rozpatrzono w zależności od miasta od 3,1 tys. do 80 tys. wniosków – prawie 26 razy więcej.
Ciekawe, czy w Warszawie do tego zadania zatrudnionych jest 26 razy więcej urzędników? Statystycznie pewnie jest też więcej trudnych przypadków do rozpatrzenia…
A nie, przepraszam… te liczby dotyczyły złożonych… rozrzut rozpatrzonych jest sporo mniejszy (2,1 vs 19 tys.)…
Moim zdaniem te dane to piękne pole do budowania skrajnie różnych komunikatów i sprawdzania ich skuteczności.
Z jednej strony można podkreślić procent rozpatrzonych wniosków i wykazywać przewagę miast rządzonych przez PiS, z drugiej można skupić się na wartościach bezwzględnych i tutaj Warszawa rządzona przez PO ma więcej rozpatrzonych wniosków niż cztery niebieskie miasta razem wzięte.
W sam raz aby sprawdzić jak różne wykresy będą odczytane przez różne osoby (np. w zależności od deklarowanych sympatii politycznych).