W ostatnich dniach od trzech osób (dziękuję Krzysztofowi T., Maciejowi B. i Markowi S.) dostałem link do artykułu ,,prezentującego” liczby zebranych głosów przez kandydatów na prezydenta (źródło gazeta.pl).
Sugeruję przyjrzenie się wykresom z tego artykułu połączone z próbą odnalezienia przynajmniej trzech problemów z prezentacją.
Trzy problemy, które mnie rzuciły się w oczy to:
1. Wysokość słupków, czy nawet pole pokazanych kartek nijak ma się do liczby głosów. Kartki dla Dudy są mniejsze.
2. Kolejność kandydatów na kolejnych ilustracjach jest przypadkowa. Czasem zgodna z rosnącą liczbą głosów, czasem malejącą, czasem jeszcze inną.
3. Na ostatnim zdjęciu autora ogarnęła pokusa, by wysokością kandydata uzależnić od liczby głosów (wcześniejszy kandydaci byli podobnej wysokości co też śmiesznie wygląda), mało spójnie.
Nie jest to z resztą jedyny wykres związany z wyborami prezydenckimi, który dziwnie prezentuje dane. Poniższy wykres z nieznanego powodu prezentuje luty po lewej stronie a styczeń po prawej, co sprawia wrażenie wzrostu poparcia tam gdzie jest spadek. Pomijam już to, że 0% poparcia dla J. Korwina wygląda na większe niż 3% dla R. Kalisza.

Maciej podesłał też kody w ggplot2 pokazujące liczbę głosów w rzetelny sposób. Kody i odrobinę zmieniony wykres poniżej.
Na wykresie dla Dudy, na dole są dwa „słupki” a na górze widać już trzy.
myślę że pewne rzeczy pokazywane na tym wykresie nie są błędem nieumyślnym znając profil GW.
gsub(„Jarubaz”, „Jarubas”, Kandydat)
Przepraszam za pomyłkę. Poprawiłem kod.
Myślę, że w tej infografice trzeba oceniać kandydatów na podstawie pola powierzchni ich postaci na zdjęciach, największe szanse ma jednak Komorowski, na drugim miejscu Pan Duda, na trzecim Pani Ogórek – czyli typowy ranking 😉
Świetny artykuł, tylko u mnie wykres stworzony z tego kodu wygląda inaczej http://i.imgur.com/pu55Flp.png.
Jest szansa na poprawienie tego kodu?
Tutaj jest kod użyty do wygenerowania wykresu z artykułu:
https://github.com/pbiecek/SmarterPoland_blog/tree/master/2015/podpisy
Dziękuję! U mnie Rstudio wypluwa następujący błąd (wcześniejsza wersja była OK):
> library(ggplot2)
> d d$Kandydat ggplot(data = d,
+ aes(x = Kandydat,
+ y = Poparcie*1000)) +
+ geom_bar(stat=’identity’) +
+ theme_bw() +
+ xlab(”) +
+ ylab(’Liczba głosów’) +
+ g …. [TRUNCATED]
Error in structure(list(call = match.call(), aesthetics = aesthetics, :
object 'comma’ not found
>
google mówi, wpisz library(scales) 😉
No i wszystko OK! Dziękuję za pomoc. I nie wiem jak mogłem nie spróbować w Google, chyba błąd był dla mnie zbyt specyficzny 😉