Dużo frajdy daje praca z zaangażowanymi studentami. Prowadzę w tym semestrze zajęcia z Technik Wizualizacji Danych na MINI PW i MIM UW. Na laboratoria przygotowuję różne zbiory danych a oni trzask / prask czyszczą dane, szukają sygnałów i prezentują sygnały graficznie.
Ostatnie zajęcia to temat rysowania map w ggplot2, a za worek treningowy posłużyły nam dane o wynikach (i w liczbie głosów i w liczbie mandatów i we frekwencji) wyborów do sejmików.
Po godzinie od pokazania danych powstały poniższe wykresy.
Każdy z nich na swój sposób pokazuje, że w województwach o wyższej frekwencji wygrywa PIS a niższej PO (wyjątkiem jest świętokrzyskie, najwyższa frekwencja a wygrywa PSL).
Dane i kody użyte do wykonania wykresów można pobrać z githuba.
Bawiąc się trochę danymi zauważyłem, że granice województw z tej strony http://www.diva-gis.org/ , czyli te na powyższych obrazkach, są niepoprawne. Porównując z danymi z http://www.codgik.gov.pl/ czyli (chyba) oficjalnymi (przy okazji tutaj http://www.gis-support.pl/baza-wiedzy/dane/dane-do-pobrania/ są już gotowe dane dla poszczególnych poziomów) widać spory rozjazd (czerwony to dane z DIVy, czarny oficjalne)
http://static.pokazywarka.pl/i/5432693/109743/diff.jpg
Dla ogólnej wizualizacji nie ma to znaczenia, ale jak już wrzucimy na mapę miejscowości to widać rozbieżności:
http://static.pokazywarka.pl/i/5432693/123431/places-diva.jpg
[img]http://static.pokazywarka.pl/i/5432693/123431/places-diva.jpg[/img]
Zapewne błędy pojawiły się przy jakieś zamianie odwzorowań.
Dzięki! Przydadzą się.