SER X + warsztaty przetwarzania i prezentowania danych

SER X, ostatnie w tym roku akademickim Spotkanie Entuzjastów R, odbędzie się już za 9 dni w czwartek 21 maja (budynek MiNI PW, Koszykowa 75 start godzina 18).

Tym razem mamy dla uczestników super gratkę. Wspólnie ze studenckim Kołem Naukowym Data Science łączymy SER razem z warsztatami przetwarzania i prezentowania danych.

Czytaj dalej SER X + warsztaty przetwarzania i prezentowania danych

Warsztaty Computerworld poświęcone wizualizacji danych

Jakiś czas temu pisałem o konferencji Big Data, organizowanej przez Computerworld, podczas której miałem przyjemność przedstawienia wyników z prostej eksploracji danych dotyczących wydarzeń na Ukrainie (chodzi o ten wpis).

Możliwości grafiki statystycznej okazały się interesujące dla wielu osób, w konsekwencji wspólnie z Computerworld przygotowujemy dwudniowe warsztaty poświęcone wizualizacji danych. Prelegentami będą Marcin Marciniak (prowadzący między innymi TechnoBloga) i ja (prowadzący tego bloga).

Warsztaty są przygotowane z myślą o analitykach, programistach i statystykach (warto znać jakiś język programowania, najlepiej R, i mieć przynajmniej podstawowe doświadczenie w analizie danych).

Więcej informacji o warsztatach znaleźć można tutaj.

Warsztaty infograficzne, Katowice 2013

W ubiegłą sobotę i niedzielę, w Katowicach organizowane były ‘Warsztaty infograficzne, Katowice 2013‘ wspólnie przez Akademię Sztuk Pięknych w Katowicach [koordynacja: Justyna Lauer] i INPRIS [więcej informacji o warsztatach tutaj].

Zamysł był następujący. Zgromadźmy organizacje pożytku publicznego, które czegoś chcą, np, pokazać jak wygląda wybór sędziów do trybunału konstytucyjnego lub jak wygląda zachorowalność na nowotwory piersi w Polsce. Posadźmy ich w jednym miejscu razem z projektantami/grafikami z ASP [głównie ASP w Katowicach, ale byli też goście z ASP w Poznaniu]. W takim kotle pozwólmy tym dwóm grupom pracować, tak by razem zaprojektowały infografikę/plakat/broszurę/stronę www, co tam jest potrzebne żeby podstawiony cel zrealizować.

Pomysł interesujący. Projektów zgłoszonych przez NGOsy było osiem, projektantów było około 40. Czasu na pracę w zespołach, prezentowanie swoich rozwiązań, zbieranie komentarzy było sporo. Dodatkowo w trakcie warsztatów odbyły się ciekawe wykłady: o ilustracji, o typografii, o narracji obrazem.

Nasza fundacja pojechała tam z projektem nad którym aktualnie pracujemy, tj. przedstawieniem statystyk dotyczących zachorowań na raka piersi w sposób zrozumiały dla pacjentek. To nie jest proste. Robić wykresy dla samego siebie jest łatwo. Robić wykresy dla osób obcujących z wykresami się da. Ale prezentować dane osobom, które nie są oswojone z odczytywaniem krzywych przeżycia, to już inna para kaloszy.

W realizowanym projekcie naszą grupą docelową są kobiety, które mają 50-70 lat, dowiedziały się, że mają nowotwór piersi, są przerażone, ale też chcą się dowiedzieć więcej jak wyglądają prognozy dla osób chorych. Łatwo popaść w generowanie nieprawdziwych obietnic, spłycanie informacji do poziomu papki, łatwo straszyć śmiercią, łatwo odciąć się od tematu pokazując morze liczb.

Ale my chcemy pokazać jak wyglądają prognozy w sposób czytelny dla osoby starszej i mniej obytej z wykresami.

Jak to zrobić?

Dużo mówi się o zaletach interdyscyplinarności, jest to bardzo modne słowo. Pewnie o interdyscyplinarności można nawet mówić przy okazji współpracy fizyka teoretycznego z fizykiem eksperymentalnym. Jednak inną jest sprawą współpraca ‘ścisłowców’ ze ‘ścisłowcami’ (wiedza różnych osób jest różna, ale podstawy są podobne i komunikacja jest możliwa bez wielkich wyrzeczeń) a inną ‘ścisłowców’ z ‘nie-ścisłowcami’ [wybaczcie etykietki, ale wiecie o co chodzi].

Gdy statystyk rozmawia z projektantem czy grafikiem, gdy każdej ze stron zależy na efekcie końcowym, wtedy widać jak trudno wyjść ze swojej skóry i spojrzeć na coś z innej perspektywy. Np. w zespole poświęciliśmy ponad dwie godziny na ‘dynamiczną’ dyskusję o sensowności używania wykresów kołowych. Z punktu widzenia projektantów i grafików koło jest obiektem bardzo przyjaznym, estetycznym, naturalnym, nie straszy odbiorcy, więc nadaje się idealnie. Moje poglądy są zupełnie inne, wykresy kołowe nie pozwalają na precyzyjne komunikaty, nie pozwalają na porównania, nie nadają się do przedstawiania zmian w czasie.

Pracując na odległość łatwo jednej ze stron się poddać, machnąć ręką i powiedzieć, niech będzie, zrobię jak chcesz.
Dla nas to nie była opcja. Zderzenie poglądów przerodziło się w kwestionowanie wszystkiego, podważanie każdego przyjętego założenia i następnie próbę złożenia w całość kawałków, które ostały się w ogniu krytyki.
Fantastycznie!
Wyszedł nam z tego pomysł na kilka eksperymentów. Np. dodanie linii pomocniczych na kołach pomagających odczytanie kątów i sprawdzenie czy to będzie ,,zjadliwe”. Ale czy naturalny jest podział koła na 8, 10 czy 12 części? Nie wiemy! Więc zróbmy eksperyment! Najlepiej na pozostałych uczestnikach!
Było też sporo dyskusji dotyczących zupełnych fundamentów dotyczących komunikacji z czytelnikiem. Koledzy i koleżanki projektanci nalegali by informację podzielić na części i przedstawić części niezależnie w sposób prosty[=czytelny]. Maksymalnie jedna zależność na jednym ,,skrawku” (wykresie czy grafice). Ja nalegałem, żeby przedstawić całość w postaci jednego czegoś, najbardziej zwartego, czytelnego i pokazującego zależności pomiędzy wieloma wieloma czynnikami. Takich dyskusji było wiele i z mojej perspektywy otwierają one oczy na zupełnie nowe rzeczy.

Podsumowując, było fantastycznie mam nadzieję że takich inicjatyw będzie więcej i więcej.
Pojawiło się wiele pomysłów na kolejne projekty, o których pewnie niedługo napiszę.
Temat komunikacji z użyciem danych to działka w której czerpać należy i z doświadczeń analityków i z doświadczeń projektantów/grafików.

Druga część warsztatów będzie miała miejsce w maju. Do tego czasu mam nadzieję, że powstanie ‘to coś’ nad czym pracujemy. Jak tylko powstanie to oczywiście pokażę na blogu.

I anegdotka.
Prowadzę zajęcia z pakietów statystycznych R i SAS. Ostatnio jeden ze studentów zapytany o wrażenia powiedział, że bardzo mu się podoba, ale uważa, że poziom trudności jest nierówny. Są trudne tematy, takie jak profilowanie, debugowanie, raportowanie kodu i są też bardzo proste tematy, takie jak tworzenie wykresów. Tymczasem z mojej perspektywy, profilowanie, debugowanie, raportowanie to były proste rzeczy, a trudne rzeczy to projektowanie wykresów. Zresztą, większość studentów nauczyła się szybko profilować, debugować, raportować kod, ale wykresy w ich projektach nie dość, że były nieprzemyślane, to jeszcze w wielu przypadkach tego braku przemyślenia oni sami nie dostrzegali [pewnie jest w tym oczywiście sporo mojej winy, powinienem położyć większy nacisk].

Więc jak to jest?

Czy analitykom potrzebne są zajęcia z komunikacji z użyciem danych? Uwrażliwiające na sposób czytania przez różne osoby różnych charakterystyk wykresów.
Czy też dbanie o takie ‘duperele’ to strata czasu, ważniejsze jest by wiedzieć jak generować raporty szybciej niż jest je w stanie przeczytać szef? Ewentualnie po drodze podsyłanie raportów grafikowi, by ten je ‘upiększył’.