Warsztaty infograficzne, Katowice 2013

W ubiegłą sobotę i niedzielę, w Katowicach organizowane były ’Warsztaty infograficzne, Katowice 2013’ wspólnie przez Akademię Sztuk Pięknych w Katowicach [koordynacja: Justyna Lauer] i INPRIS [więcej informacji o warsztatach tutaj].

Zamysł był następujący. Zgromadźmy organizacje pożytku publicznego, które czegoś chcą, np, pokazać jak wygląda wybór sędziów do trybunału konstytucyjnego lub jak wygląda zachorowalność na nowotwory piersi w Polsce. Posadźmy ich w jednym miejscu razem z projektantami/grafikami z ASP [głównie ASP w Katowicach, ale byli też goście z ASP w Poznaniu]. W takim kotle pozwólmy tym dwóm grupom pracować, tak by razem zaprojektowały infografikę/plakat/broszurę/stronę www, co tam jest potrzebne żeby podstawiony cel zrealizować.

Pomysł interesujący. Projektów zgłoszonych przez NGOsy było osiem, projektantów było około 40. Czasu na pracę w zespołach, prezentowanie swoich rozwiązań, zbieranie komentarzy było sporo. Dodatkowo w trakcie warsztatów odbyły się ciekawe wykłady: o ilustracji, o typografii, o narracji obrazem.

Nasza fundacja pojechała tam z projektem nad którym aktualnie pracujemy, tj. przedstawieniem statystyk dotyczących zachorowań na raka piersi w sposób zrozumiały dla pacjentek. To nie jest proste. Robić wykresy dla samego siebie jest łatwo. Robić wykresy dla osób obcujących z wykresami się da. Ale prezentować dane osobom, które nie są oswojone z odczytywaniem krzywych przeżycia, to już inna para kaloszy.

W realizowanym projekcie naszą grupą docelową są kobiety, które mają 50-70 lat, dowiedziały się, że mają nowotwór piersi, są przerażone, ale też chcą się dowiedzieć więcej jak wyglądają prognozy dla osób chorych. Łatwo popaść w generowanie nieprawdziwych obietnic, spłycanie informacji do poziomu papki, łatwo straszyć śmiercią, łatwo odciąć się od tematu pokazując morze liczb.

Ale my chcemy pokazać jak wyglądają prognozy w sposób czytelny dla osoby starszej i mniej obytej z wykresami.

Jak to zrobić?

Dużo mówi się o zaletach interdyscyplinarności, jest to bardzo modne słowo. Pewnie o interdyscyplinarności można nawet mówić przy okazji współpracy fizyka teoretycznego z fizykiem eksperymentalnym. Jednak inną jest sprawą współpraca 'ścisłowców’ ze 'ścisłowcami’ (wiedza różnych osób jest różna, ale podstawy są podobne i komunikacja jest możliwa bez wielkich wyrzeczeń) a inną 'ścisłowców’ z 'nie-ścisłowcami’ [wybaczcie etykietki, ale wiecie o co chodzi].

Gdy statystyk rozmawia z projektantem czy grafikiem, gdy każdej ze stron zależy na efekcie końcowym, wtedy widać jak trudno wyjść ze swojej skóry i spojrzeć na coś z innej perspektywy. Np. w zespole poświęciliśmy ponad dwie godziny na 'dynamiczną’ dyskusję o sensowności używania wykresów kołowych. Z punktu widzenia projektantów i grafików koło jest obiektem bardzo przyjaznym, estetycznym, naturalnym, nie straszy odbiorcy, więc nadaje się idealnie. Moje poglądy są zupełnie inne, wykresy kołowe nie pozwalają na precyzyjne komunikaty, nie pozwalają na porównania, nie nadają się do przedstawiania zmian w czasie.

Pracując na odległość łatwo jednej ze stron się poddać, machnąć ręką i powiedzieć, niech będzie, zrobię jak chcesz.
Dla nas to nie była opcja. Zderzenie poglądów przerodziło się w kwestionowanie wszystkiego, podważanie każdego przyjętego założenia i następnie próbę złożenia w całość kawałków, które ostały się w ogniu krytyki.
Fantastycznie!
Wyszedł nam z tego pomysł na kilka eksperymentów. Np. dodanie linii pomocniczych na kołach pomagających odczytanie kątów i sprawdzenie czy to będzie ,,zjadliwe”. Ale czy naturalny jest podział koła na 8, 10 czy 12 części? Nie wiemy! Więc zróbmy eksperyment! Najlepiej na pozostałych uczestnikach!
Było też sporo dyskusji dotyczących zupełnych fundamentów dotyczących komunikacji z czytelnikiem. Koledzy i koleżanki projektanci nalegali by informację podzielić na części i przedstawić części niezależnie w sposób prosty[=czytelny]. Maksymalnie jedna zależność na jednym ,,skrawku” (wykresie czy grafice). Ja nalegałem, żeby przedstawić całość w postaci jednego czegoś, najbardziej zwartego, czytelnego i pokazującego zależności pomiędzy wieloma wieloma czynnikami. Takich dyskusji było wiele i z mojej perspektywy otwierają one oczy na zupełnie nowe rzeczy.

Podsumowując, było fantastycznie mam nadzieję że takich inicjatyw będzie więcej i więcej.
Pojawiło się wiele pomysłów na kolejne projekty, o których pewnie niedługo napiszę.
Temat komunikacji z użyciem danych to działka w której czerpać należy i z doświadczeń analityków i z doświadczeń projektantów/grafików.

Druga część warsztatów będzie miała miejsce w maju. Do tego czasu mam nadzieję, że powstanie 'to coś’ nad czym pracujemy. Jak tylko powstanie to oczywiście pokażę na blogu.

I anegdotka.
Prowadzę zajęcia z pakietów statystycznych R i SAS. Ostatnio jeden ze studentów zapytany o wrażenia powiedział, że bardzo mu się podoba, ale uważa, że poziom trudności jest nierówny. Są trudne tematy, takie jak profilowanie, debugowanie, raportowanie kodu i są też bardzo proste tematy, takie jak tworzenie wykresów. Tymczasem z mojej perspektywy, profilowanie, debugowanie, raportowanie to były proste rzeczy, a trudne rzeczy to projektowanie wykresów. Zresztą, większość studentów nauczyła się szybko profilować, debugować, raportować kod, ale wykresy w ich projektach nie dość, że były nieprzemyślane, to jeszcze w wielu przypadkach tego braku przemyślenia oni sami nie dostrzegali [pewnie jest w tym oczywiście sporo mojej winy, powinienem położyć większy nacisk].

Więc jak to jest?

Czy analitykom potrzebne są zajęcia z komunikacji z użyciem danych? Uwrażliwiające na sposób czytania przez różne osoby różnych charakterystyk wykresów.
Czy też dbanie o takie 'duperele’ to strata czasu, ważniejsze jest by wiedzieć jak generować raporty szybciej niż jest je w stanie przeczytać szef? Ewentualnie po drodze podsyłanie raportów grafikowi, by ten je 'upiększył’.

Infografiki z lotniska w Zurychu

Większość dni z poprzedniego tygodnia spędziłem w Zurychu. Moja pierwsza wizyta w Szwajcarii, a już ten kraj awansował do pierwszej trójki miejsc do których chcę kiedyś wrócić (obok Kioto i Lanzarote). Duże wrażenie zrobiła na mnie rzemieślnicza sumienność i obywatelska odpowiedzialność bijąca z każdej strony.

Świadomość wpływu na otoczenie i odpowiedzialność za ten wpływ musi być powiązana z byciem poinformowanym. A bycie poinformowanym z infografikami. Nie zdziwiło mnie więc gdy wyjeżdżając, na lotnisku, znalazłem interesujące infografiki. Kilka z nich przedstawię poniżej.

Czytaj dalej Infografiki z lotniska w Zurychu

Widać różnice…

Mały ,,off-topic” na początek. Dawno, dawno temu, gdy po raz pierwszy prowadziłem laboratorium dla studentów studiów inżynierskich, zgodnie z wolą wykładowcy zaliczenie otrzymywało się na podstawie wykonanego projektu, który oddawało się w formie sprawozdania. Wykonanie dobrego sprawozdanie było czasochłonne, mniej więcej 20 godzin pracy, ale dawało studentowi sporo satysfakcji. Zdarzały się sprawozdania bardzo dobre, ale najbardziej utkwiło mi w pamięci najkrótsze sprawozdanie jakie kiedykolwiek widziałem. Pewien osobnik wysłał spakowany zbiór plików graficznych opatrując je jednozdaniowym, krótkim komentarzem w mailu ,,widać różnice” (lub ,,widać rużnice”, wydaje mi się, że były w tym sprawozdaniu/zdaniu błędy językowe, ale nie dam za to głowy). Wraca do mnie to wspomnienie za każdym razem gdy widzę wykresy w sprawozdaniach bez komentarza lub z bardzo skąpym komentarzem.

Jednak artykuły w gazetach to nie sprawozdania z wykonania projektu. Nadmierna zwięzłość, będąca wadą sprawozdania, może być zaletą artykułu.

Oglądałem ostatnio dwie dosyć interesujące infografiki (podesłane przez Andrzeja D.). Jedna w interesujący sposób pokazuje historię zadłużenia Grecji (link), druga lepiej wykonana graficznie ale mniej interesująca merytorycznie pokazuje rozwój e-learningu (link). Pierwszą szczególnie polecam Waszej uwadze, zbiór wykresów z jednozdaniowymi komentarzami ale łatwiej przyswajalny i z większą ilością informacji niż niejeden artykuł na temat historii problemów Grecji.

Nawet najlepszą jednak infografikę można zrobić jeszcze lepiej. Poniżej wklejam cztery wycinki z powyższych infografik, każdy kryje jakiś feler, który utrudnia poprawne odczytanie wykresu.

Zadanie na dziś: Znajdź feler na każdym wycinku! (i podziel się swoim znaleziskiem w komentarzach)


 

PSL, infografiki i grafy

W różnych mediach pojawia się ostatnio sporo infografik nawiązujących do sieci powiązań pomiędzy posłami PSL i ich rodzinami a stanowiskami obsadzanymi przez zwycięzców w wyborach. Chciałoby się zobaczyć ten obraz w dużej skali tzn dla wszystkich synekur i dla wszystkich partii. Zostawmy tkanie tego grafu dziennikarzom. Dziś postaram się rozprostować jedną bardzo zakręconą infografikę.

W tym artykule znajduje się poniższy wykres, przedstawiający sieć powiązań pomiędzy PSL a czterema spółkami.

Wykres niewątpliwie wygląda na bardzo skomplikowany i być może to skomplikowanie było celem autora, ale w rzeczywistości sieć tych zależność dosyć łatwo przestawić w postaci tabelarycznej (poniżej).

Po co komplikować rzeczy proste?

Z poniższego wykresu łatwo zobaczyć kto w ilu miejscach i na jakim stanowisku.

,,Szkoła to strata czasu”. Czy tak o szkole myślą 15-letni Polacy?

Tak, ten tytuł bardziej przypomina tytuł z Faktu czy portalów (dez)informacyjnych, niż wyważony tytuł bloga informacyjnego ;-). Ale przynajmniej pasuje do treści prezentowanej poniżej.

W poprzednim wpisie pisałem o badaniu PISA w ramach którego w roku 2009 przepytano ponad 500 tyś 15-latków z całego świata z czego prawie 5 tyś z Polski. Pytano o bardzo wiele rzeczy, między innymi o nastawienie do szkoły. Angielskojęzyczną wersję ankiety z oryginalnymi pytaniami znaleźć można tutaj. Dwa pytania zainteresowały mnie szczególnie: Q33A i Q33B, czyli (w wolnym tłumaczeniu) ,,Szkoła uczy mnie rzeczy, które mogą być przydatne w przyszłej pracy” i ,,Szkoła to strata czasu”. Przy obu zdaniach student mógł zaznaczyć ,,bardzo się nie zgadzam”, ,,nie zgadzam się”, ,,zgadzam się”, ,,bardzo się zgadzam”. Ponieważ najczęściej ankietowani zgadzali się z pierwszym zdaniem a nie zgadzali z drugim, więc aby łatwiej przedstawić te wyniki graficznie zamieniłem obie zmienne na binarne, w pierwszym przypadku licząc jaki procent uczniów ,,bardzo się zgadza” z tym, że szkoła przygotowuje do pracy, a w drugim przypadku jaki procent uczniów ,,bardzo się zgadza”, ,,zgadza się” lub ,,nie zgadza się” z tym zdaniem (czyli wszystko poza ,,bardzo się nie zgadzam”). Inny podział poziomów na zmienne binarne nie zmieniał znacząco kolejności państw ale mniej je różnicował, dlatego nie zastosowałem binaryzacji metodą dwa za vs. dwa przeciw.

Poniżej graficzna prezentacja jak te dwa wskaźniki wyglądają dla europejskich państw.

 

Tak, to państwo w prawym dolnym rogu to Polska.

Tak, to źle wróży skoro uczniowie tak myślą o szkole.

Tak, ze zbioru kilkuset współczynników można wybrać takie w których wypadamy znacznie lepiej na tle europejskich krajów.

Tak, ten wpis miał na celu sprowokowanie Was do poklikania w te interaktywne wykresy przedstawiające inne charakterystyki uczniów.

Tak, do badania PISA jeszcze wrócimy i przedstawimy te dane bez tej sztucznej binaryzacji (jak tylko wymyślę jak to zrobić czytelnie, a może Wy macie na to jakiś pomysł?).

W ankiecie dla ucznia jest znacznie więcej pytań. Może któreś z nich szczególnie Was interesuje?

 

Badanie PISA a interaktywna grafika

 

Poniżej przedstawię podsumowanie kilku zmiennych opisujących 15-latków z 74 różnych krajów. Przedstawione poniżej dane zebrano w ramach badania PISA w roku 2009. Są to bardzo ciekawe dane i będziemy do nich jeszcze niejednokrotnie wracać. W tym wpisie jednak zamiast skupiać się na danych lub historii, którą te dane opisują, moim celem będzie przedstawienia interesującego narzędzia do tworzenia interaktywnych wykresów, czyli portalu tableausoftware. Do bardziej szczegółowego omówienia danych z badania PISA wrócimy w przyszłości.

PISA to skrót nazwy Programu Międzynarodowej Oceny Umiejętności Uczniów (Programme for International Student Assessment). Jego celem jest uzyskanie porównywalnych danych o umiejętnościach uczniów z różnych krajów, którzy ukończyli 15 rok życia. PISA bada umiejętności i wiedzę ważną z perspektywy wyzwań, przed jakimi 15-latkowie staną w swym dorosłym życiu (więcej informacji o PISA). Z tej strony można pobrać bazę danych z surowymi danymi oraz skrypty pozwalające na wczytanie tych danych do programów SAS i SPSS (w sumie ponad 1GB danych). Format danych jest dosyć nieprzyjemny do wczytania z poziomu R. Przygotowuję odpowiedni skrypt i pewnie niedługo napiszę o tym jak wczytać całe dane prosto i wygodnie do R. Na razie niewielki wycinek z tych danych, 20 zmiennych, można pobrać w formacie binarnym Rdata z tej strony. Ponieważ moim zdaniem edukacja młodych ludzi jest bardzo, bardzo, bardzo ważna, dlatego też ten zbiór danych stanowi bardzo interesujący kąsek do dalszej analizy i mam nadzieję będziemy wiele razy do niego wracać. Jutro opiszę trochę dokładniej jak były konstruowane zmienne w wycinku danych, który tutaj pokazuję.

Dzisiaj jednak chciałbym napisać nie o danych ale o narzędziu tableausoftware. Podczas ,,10 lunchów” poznałem Daniela O., który podesłał mi namiary na to narzędzie do przygotowywania i udostępniania wizualizacji danych. W tym narzędziu można np. opracować zbiór interaktywnych wykresów a następnie prosto upublicznić te wykresy w postaci strony www. Idealne narzędzie dla dziennikarzy pracujących z danymi (btw: nic nie mam z tego, że tak słodzę. Trial jest za darmo do używania). Pobawiwszy się nim na prostych tabelkach tylko czekałem na okazję by jakieś interesujące dane przedstawić za jego pomocą. I okazja się nadarzyła.

Poniższy rysunek jest linkiem do strony z czterema interaktywnymi wykresami i filtrem w postaci pola wielokrotnego wyboru (checkbox). W jutrzejszym wpisie dokładniej opiszę jak liczone były zmienne, które są tu prezentowane, na razie chodzi mi wyłącznie o pokazanie narzędzia. To tylko drobny pokaz możliwości wspomnianego narzędzia. Interaktywność pozwala na przefiltrowanie punktów lub sprawdzenie jak wybrane państwa przedstawione na jednym wykresie są położone na innych wykresach. Mam też nadzieję, że nawet taka podstawowa interakcja ułatwi zrozumienie i przyciągnie uwagę do tych danych.

Czy tak jest? Czy kusiło Was pobawić się tymi wykresami? Czy mieliście czas by sprawdzić jak wypada Polska na tle innych państw jeżeli listę tych innych Państw ograniczymy np tylko do Europy? Chętnie usłyszę Wasze opinie i wrażenia. Czy warto umieszczać taką interaktywną grafikę, czy lepiej pozostać przy statycznych wykresach (bo RSS czyta się offline, bo nie ma czasu na klikanie)? A może temat wciągnął Was na tyle, że pobraliście komplet wykresów i dane i stworzyliście własną kombinację ciekawych wykresów (można to zrobić, link do pobrania środowiska na dole wizualizacji)?

 

 

 

Gartner chart

Widziałem kilka dni temu świetną wizualizację. Nie wykonaną w R, nie dotyczącą polskich danych ale wciąż wystarczająco świetną by ją tu wrzucić. Świetna oznacza że jest w niej na tyle interesującej treści by przez przynajmniej kilka minut analizować ją bez znudzenia.

Firma Gatner przygotowuje co roku wizualizacje jaka technologia jest w jakim stadium rozwoju, jakie są oczekiwania i jak daleko jej do wielkoskalowych rzowiązań.