Za dwa dni odkrywamy Esej ,,Od Kuchni”, ze zbiorem wskazówek dotyczących projektowania wykresów. Ponieważ ostatni konkurs wypadł bardzo ciekawie, postanowiłem kolejny urządzić w podobnej formule. Ponownie więc mamy konkurs, w którym można wygrać papierową wersję Esejów o wizualizacji danych.
Aby wziąć udział w konkursie, należy odpowiedzieć na poniższe pytanie.
Reguły:
1. W losowaniu biorą udział wszystkie odpowiedzi, nie ma poprawnych i niepoprawnych!.
2. Jedna osoba może wziąć udział tylko raz w tej zabawie.
3. Liczą się tylko głosy oddane dziś i jutro (9-10 września).
4. Spośród odpowiedzi wylosuję jedną osobę, która otrzyma papierowe wydanie Esejów.
A jakie jest pytanie?
Poniżej jest przedstawionych pięć różnych layoutów proponowanych przez różne narzędzia do prezentacji danych. Każdy z nich przedstawia te same dane, o średnim wyniku poziomu umiejętności matematycznych w różnych krajach i różnych grupach wiekowych na bazie badania PIAAC (nomen omen ciekawe dane).
Zadanie: wskazać wykres, który Twoim zdaniem wygląda najlepiej (wybrać opcję w formularzu na końcu wpisu).
Opcja A
Opcja B
Opcja C
Opcja D
Opcja E
(btw: Zdaję sobie sprawę, że z każdym z tych wykresów coś jest nie tak i można by go poprawić. Ale dzięki temu wybór jest ciekawszy.)
Powodzenia w losowaniu. Książka czeka.
[Jeżeli powyższy formularz się nie wyświetla, proszę wysłać odpowiedź przez tę stronę]
zwykle przy takich danych sprawdza się histogram
Histogram do pokazania 36 średnich?
Czy 36 rozkładów?
Ja zrobiłbym to na 4 wykresach słupkowych – każda grupa wiekowa to osobny wykres, na wykresach na osi X kraje, na Y wynik. Czyli opcja C rozbita na 4 wykresy słupkowe 🙂 (a zagłosowałem inaczej niż C)
Wykresy słupkowe lepiej zazwyczaj wyglądają, bo wypełniają więcej miejsca i bardziej wpadają w oko,
ale dla tych danych występuje inny ciekawy problem.
Skala pomiarowa nie jest ilorazowa i nie bardzo wiadomo gdzie jest punkt ,,zero”.
Ale o tym w czwartek.
Hyhy, ja też głosuję inaczej niż C, ma fatalnie przygotowaną oś X na przykład.
A propos C,
Z jakiegoś powodu, gdy Excel rysuje wykres punktowy to spodziewa się liczb jako współrzędnych.
A gdy zamiast liczb ma etykiety, to gubi ich nazwy (dla paskowego jest ok, ale dla punktowego zamienia etykiety na liczby).
Czy ktoś wie jak łatwo zmusić Excela aby mimo wszystko wyświetlał nazwy na osi X?
możnaby było spróbować też pobawić się z wykresem radarowym. dość klarownie wtedy się układają dane między sobą
Jeżeli chodzi wykres C, to twórcy Excela nie widzą sensu tworzenia wykresów punktowych w oparciu o dane w których jedna z osi ma kategorie tekstowe :).
Najprościej to obejść tworząc wykres liniowy a następnie formatując odpowiednio linie (formatuj serię danych – brak linii i odpowiedni format znaczników).
D ze względu na minimalizm i soczyste punkty – wykorzystanie koloru i kształtu. Jak dla mnie, wybrałbym go również w konkursie na najbardziej czytelny. Oprócz punktów wygrywa odpowiednio dużymi punktami oraz brakiem siatki lub tła, która potrafi zaciemnić i skomplikować, jak w przypadku A i C. Wykres D chyba jako jedyny mógłby zyskać na dodaniu czegoś, np linii oddzielających państwa lub je oznaczających (przecinając punkty), ale koniecznie cienkich, by nie dominowały, jak w przypadku C. Inne wykresy aż proszą się o odjęcie części lub całej podziałki.
A, B promują słuszną ideę posortowania krajów.
Wykres słupkowy „robi robotę”, ale — no właśnie — stwarza ryzyko pomyłki, sugerując np., że ludzie z najmłodszej grupy są „dwa razy mądrzejsi” od najstarszych ankietowanych.
Żeby ten problem wyeliminować, wystarczyłoby posłużyć się wykresem kolumnowym skumulowanym. Pięknie oddałby relacje między wynikami różnych grup wiekowych, a wysokość całego słupka pokazałaby sumaryczny wynik danego kraju, dzięki czemu wykres otrzymuje drugą funkcję — dowiadujemy się, które narody uchodzą za bardziej inteligentne od innych.
A i B na pierwszy rzut oka pokazują coś. B jest bardziej przyjazny dla daltonistów. B wygrywa.
@Marcin
B wyglądałby bardzo ładnie w czarno-białym druku, tylko czarne kształty symboli są za ciężkie. Gdyby je trochę zmniejszyć i nałożyć na niego kolory z A (użyć jednocześnie koloru i kształtu), to byłbym zupełnie zadowolony
W B przeszkadzał mi ten krzyżyk, który jest znacznie lżejszy niż pozostałe symbole. Ale jego zmiana wymagała by zmiany skali_shape, więc niech traci autor biblioteki ggthemes. Może i racja że symbole są za duże, ale to już moja wina.
W A przeszkadza mi to szare tło. Choć w tym przypadku ma tę zaletę że wykres wyróżnia się na stronie. Mogłoby być jaśniejsze, choć eksperymentowanie z jasnością jest ryzykowne, każdy ma inaczej skonfigurowaną jasność swojego ekranu. Linie pomocnicze siatki są na plus, można by zmapować grupę wiekową na kształt ale byłoby zbyt podobnie do B. Kolor mógł też być w skali zachowującej kolejność, ale to już wina funkcji cut() że gubi informacje o uporządkowaniu.
Excela nie komentuję. Tyle ludzi pracuje w MicrosoftResearch nad wizualizacją i eksploracją danych, jak oni mogą żyć z takimi wykresami? Choć może jak się zna to narzędzie to można zrobić coś lepszego, nie wiem, nie widziałem.
Tableau plus za duże czytelne symbole. Ale nie potrafiłem łatwo przenieść legendy w światło wykresu. A legenda z boku dziwnie wygląda. Przyjemnie się z niego korzysta, choć niektóe zachowania są super denerwujące (na Macu zamiana osi i walka z proporcjami wymiarów okna wykresu jest super uciążliwa).
Plot.ly to super pomysł ale jeszcze daleko do produkcji. Z punktami niewiele można zrobić przez www.
Rozumiem strategię ,,ship-early” dla start-upów, ale oni ryzykują, że nie zdążą zrobić dobrego narzędzia a fala entuzjazmu z możliwości dzielenia się wykresami już przeminie.