Co jakiś czas dostaję od czytelników interesujące sugestie dotyczące raportów / wizualizacji / tematów. Bardzo mnie one cieszą. Mam nadzieję, że kiedyś blog fundacji będzie prowadzony przez więcej osób, a to podsyłanie materiałów jest krokiem w tym kierunku.
Dziś będzie o wykresie z raportu ,,Huszlew Strategia Rozwiązywania Problemów Społecznych”, na który uwagę zwróciła mi Natalia J.
Chodzi o poniższy wykres. Przedstawia on jak w kolejnych latach wyglądała liczba urodzeń, zgonów i bilans migracji ludności. W Huszlewie w roku 2005 mieszkało 2996 osób.

Pomijając problemy typowe dla wykresów pseudo 3D i określenie 'ilość’ stosowane do policzalnej liczby osób, z tym wykresem jest jeszcze kilka rzeczy nie tak.
Jeżeli migracje zaznaczono liczbami ujemnymi (bo ludzi ubywa) to dlaczego liczba zgonów jest przedstawiona o stronie dodatniej? (przecież od zgonów też ubywa)?
Zmieńmy to.

No dobrze, widać teraz czy więcej ludzi ubywa z powodu zgonów czy z powodu migracji, ale trudno oczytać jak wygląda całkowity bilans dla liczby ludności.
Połączmy informację o zgonach z informacją o migracji.

W tym miejscu warto zastanowić się co w tych danych jest najciekawsze. Raczej nie bezwzględna liczba zgonów czy narodzin czy migracji, ale informacja o bilansie. Bilans pokaże jak szybko wyludnia się opisywane miasto.
Zrezygnujmy więc z zaczepiania słupków w zerze i przedstawmy informację tak, by łatwiej było odczytać jak wygląda interesujący współczynnik.

Bardzo fajne, chociaż bałbym się co z tego wykresu zrozumie laik 😉 ale skoro już kombinujemy, to można to też przedstawić wykresem waterfall, analogicznie do tego jak pokazuje się przychody, rozchody i wynik finansowy, rozwiazanie idealne do tego przypadku.
Dziękuję, nie znałem wcześniej wykresu waterfall, ale od czego jest wikipedia http://en.wikipedia.org/wiki/Waterfall_chart.
W sumie to ciekawy sposób pokazania skumulowanych zmian. Postaram się zrobić coś takiego dla całej Polski i wybranych województw. Po rozbiciu na narodziny, zgony i migracje może taka mapa ciekawie wyglądać.
Znalazłem taki ciekawy wykres, będący przykładem złej prezentacji – dane dotyczą ilości ataków na bankomaty i wielkości strat. Dwa typy danych pokazano na jednym wykresie z dwiema skalami i nie jest oczywiste która skala dotyczy których danych:
http://www.automatykabankowa.pl/czy-ataki-na-bankomaty-to-nadal-zmora-dla-bankow-i-ich-klientow/
Zaciekawiony – racja, ale to raczej maly grzech, tzn mozna się domyślić, że pojedyńcza strata z ataku na bankomat jest poniżej miliona euro. Jeden wykres i to, że strata jest na dodatniej skali zupełnie OK – strata to też może być zmienna, a nie tylko ujemna wartość zysku 🙂
Taki wykres o którym pisze Przemek jest dobry w przypadku skumulowanych zmian, ale tylko gdy jest ich dużo. Analityk chce widzieć obrazowo, która składowa jaki wnosi wkład w ostateczny wynik. Na przykład gdy mamy kilka spółek w grupie kapitałowej, chcemy graficznie zobaczyć jaki wkład wnosi poszczególna spółka w skonsolidowany wynik. W przypadku trzech składowych jest trochę nieodpowiedni. A ujmowanie tego extra na osi czasu?