Odkrywać! Ujawniać! Objaśniać!

eseje
W listopadzie mamy wiele akcji wydawniczych. Kilka dni temu pisałem o tym, że do księgarni trafiają Muffinki – bogato ilustrowane opowiadania statystyczne dla dzieci.
A w tę sobotę do księgarni wrócił ,,Zbiór esejów o sztuce prezentowania danych Odkrywać! Ujawniać! Objaśniać!” Akurat dostaliśmy z drukarni kolejny metr sześcienny książek. W sam raz na święta.

Cała książka jest dostępna w formacie html tutaj. Wersję papierową można kupić w tych księgarniach.

A co znajduje się w kolejnych rozdziałach?

Perełki z historii – Zobaczcie jak wyglądała słynna Róża Nightingale, wykres który uratował tysiące ludzkich istnień. Co tak naprawdę w Człowieku witruwiańskim zakodował Da Vinci? Jakimi wykresami Otton Neurath chciał edukować społeczeństwo.

Percepcja obrazu – Czym różni się plamka ślepa od żółtej oraz dlaczego przy słabym świetle trudno trafić w dziurkę od klucza. Dlaczego na łodziach podwodnych jest czerwone oświetlenie. Co łączy dentystę i dietetyka?

Percepcja kolorów – Dlaczego nie widzimy w podczerwieni ani ultrafiolecie, choć niektóre owady i węże potrafią. Co można odczytać z wykresu chromatyczności i jak pomóc kolegom z deuteranomalią.

Percepcja danych – Jak wygląda Rachunek od państwa 2012? Dlaczego tak trudno czytać wyniki sondaży? Dlaczego tak trudno radzić sobie z niepewnością?

okladka-724x1024

Od kuchni – Dlaczego wykres mozaikowy jest świetny choć rzadko stosowany? Co widać w twarzach Chernoffa? Dlaczego dobre garnki to nie wszystko?

Info-pomyłka – Jaki nie dać się zwieść słupkom, kątom, i dziwnym osiom.

Droga – Jak bawić się prezentacją danych. I to nie tylko na komputerze.

Gramatyka – Do ilu można liczyć w języku plemienia Pirahã? Jak składać wykresy w pakiecie ggplot2? Czym charakteryzuje się polski rozkład normalny?

Miłej lektury!

Gramatyka języka wizualizacji danych

Screen Shot 2016-03-20 at 20.39.28

,,Gramatyka języka wizualizacji danych” to nowy rozdział w drugim wydaniu ,,Zbioru esejów o sztuce prezentowania danych”. Jest on już dostępny online na stronie http://biecek.pl/Eseje/indexGramatyka.html.

Ten esej jest oparty głównie o materiały z książki Lelanda Wilkinsona ,,The Grammar of Graphics”, moje doświadczenia z pakietem ggplot2 oraz eksperymenty z narzędziami do wyrażania komunikatów opartych o dane (w tym wykresów statystycznych, ale nie tylko).

To nie są materiały do nauki pakietu ggplot2 (ggplot2 to jedna z implementacji gramatyki języka wizualizacji, być może to najbardziej dojrzała implementacja ale z pewnością nie doskonała, jeszcze). Jest to raczej próba rozłożenia na niezależne części elementów wykresu, które są w niezależny sposób z wykresu odczytywane.

Użycie pakietu archivist pozwoliło na umieszczenie uchwytów oraz instrukcji odtwarzających wszystkie wykresy w tym eseju. Kompletna lista wykresów, kodów R i uchwytów archivista znajduje się tutaj https://rawgithub.com/pbiecek/Eseje/master/GamatykaGrafiki.html.

Gdyby ktoś szukał polskojęzycznych materiałów poświęconych nauce podstaw ggplot2 to polecam ,,Przewodnik po pakiecie R” (tutaj lub tutaj). Angielskojęzycznym materiałów jest wiele, można zacząć od strony domowej samego projektu http://docs.ggplot2.org/current/.

Co nowego w drugim wydaniu Esejów?


Drugie wydanie Esejów trafiło do księgarni internetowych w poprzednim tygodniu.

Jest też dostępne (prawie całe) na stronie http://biecek.pl/Eseje.
Największą zmianą jest dodanie nowego rozdziału o Gramatyce języka wizualizacji danych (głównie ggplot2, ale raczej o logice niż opis konkretnych funkcji). Ten rozdział jeszcze nie jest całkowicie przekonwertowany do formatu HTML, więc na www ukaże się wkrótce. Poniżej krótko opowiem co nowego w pozostałych rozdziałach.

W Perełkach z historii pojawił się nowy podrozdział ,,Polacy nie gęsi”.
Między innymi z informacjami o Atlasie Metod Kartograficznych http://www.educarto.pl/

Czytaj dalej Co nowego w drugim wydaniu Esejów?

Idą święta, czas na ,,Eseje…”


Dla dziecka, które interesuje się ciekawymi tematami?

Dla przyjaciela, na prezent?

Dla szefa w pracy?

Dla samego siebie?

Kolorowe wydanie ,,Esejów o sztuce prezentowania danych”, estetycznie wydane na kredowym papierze, to może być świetny pomysł na prezent!

Ciekawostki historyczne, przykłady złych i dobrych wykresów, tematy związane z percepcją liczba, kolorami czy obrazem. Wiele przykładów z polskich źródeł. To wszystko bogato ilustrowane na 200 stronach w popularno-naukowej formule.

Książkę można kupić w księgarniach na Uniwersytecie i Politechnice Warszawskiej oraz przez internet. Szczegółowe informacje gdzie i jak kupić tę książkę są na tej stronie.

Esej 7: Droga

Przed chwilą, pod adresem www.biecek.pl/ Eseje/indexDroga.html, udostępniliśmy esej o tytule ,,Droga”. Ostatni z serii ,,Wakacje z wizualizacją”.

W tym eseju można znaleźć przykłady ścieżek wizualizacji danych od pierwszego pomysłu, przez różne wariacje, do końcowego rozwiązania. Również przykłady nieklasycznych eksperymentów z danymi.

We wtorek zorganizowaliśmy konkurs związany z tym esejem. W konkursie należało zaproponować artykuł w którym dane przedstawiane są poza ekranem komputera. Otrzymaliśmy kilkanaście bardzo bardzo ciekawych zgłoszeń.

Kilka przykładowych zgłoszeń:

Czytaj dalej Esej 7: Droga

Ostatni esej ze zbioru ,,Ujawniać! Odkrywać! Objaśniać” już w czwartek

DSC_5322

Za dwa dni odkrywamy esej ,,Droga”, kończący serię esejów z książki ,,Ujawniać! Odkrywać! Objaśniać”.

Ostatni rozdział jest poświęcony ścieżkom twórczym, które prowadzą do wizualizacji. Ścieżkach od pierwszego pomysłu, pierwszego szkicu do …… No właśnie, gdzie? Ta droga może być długa, przyjemna, może się nigdzie nie skończyć (chyba, że mamy narzucony deadline).

Mnie osobiście w tej drodze coraz bardziej interesują przypadki, prowadzące do reprezentacji danych w świecie fizycznym. Gdy dane wyskakują z komputera i przeobrażają się w modele 3D, murale, rzeźby czy figurki z klocków LEGO.

DSC_5322a

Stąd też tematyka dzisiejszego, ostatniego w tej serii konkursu.

Aby wziąć udział w konkursie, należy przesłać link do zdjęcia (lub zdjęcie emailem) lub artykułu o danych mających swoją reprezentację poza ekranem komputera.
Czy to jakiegoś niezwykłego wydruku, obrazu, rzeźby, figury, kubka czy czegoś innego.

Reguły:
1. W losowaniu biorą udział wszystkie odpowiedzi, nie ma poprawnych i niepoprawnych!.
2. Jedna osoba może wziąć udział tylko raz w tej zabawie.
3. Liczą się tylko głosy oddane dziś i jutro (21-22 października).
4. Spośród odpowiedzi wylosuję jedną osobę, która otrzyma papierowe wydanie Esejów.

Takie materiały trudniej znaleźć, więc pewnie zgłoszeń będzie mniej, a tym samym każde ze zgłoszeń ma większą szansę na bycie wylosowanym.
Powodzenia w losowaniu. Książka czeka.

[Jeżeli powyższy formularz się nie wyświetla, proszę wysłać odpowiedź przez tę stronę]

Esej 5: Info-pomyłka

Przed chwilą udostępniliśmy esej o tytule ,,Info-pomyłka” pod adresem www.biecek.pl/Eseje/indexPomylka.html. Piąty z serii ,,Wakacje z wizualizacją”.

W tym eseju znaleźć można wiele przykładów błędów w prezentacji danych. Tak celowych manipulacji jak i nieumyślnych potknięć. Wszystkie prezentowane w tym eseju przykłady są z polskiego podwórka, więc lektura powinna być interesująca.

We wtorek zorganizowaliśmy konkurs pośrednio związany z tym esejem. W konkursie należało zaproponować artykuł w którym wykorzystywane są dane. Tym razem otrzymaliśmy 49 zgłoszeń. Co ciekawe każde inne i większość z bardzo różnych tematów (sporo artykułów – ciekawostek, trochę artykułów o polityce, ekonomii i sporcie). Żaden artykuł nie powtórzył się, co dla mnie jest zaskoczeniem (patrz paradoks urodzin, jaka jest szansa, że dwóch studentów z 25 osobowej grupy ma urodziny tego samego dnia?). Ale pozytywnym zaskoczeniem, ponieważ jest więcej materiału do opracowania.

W konkursie wygrał numerek 31, czyli osoba o mailu krzysztof.**********@gmail.com. Gratulujemy! Skontaktujemy się mailowo. Za trzy tygodnie kolejny, ostatni już konkurs.

Ten esej to część zbioru ,,Odkrywać! Ujawniać! Objaśniać!” wydanego przez Fundację, dostępnego już w sprzedaży. O tym jak go kupić można przeczytać na stronie http://biecek.pl/Eseje/ indexZakup.html. Co trzy tygodnie na stronie http://biecek.pl/Eseje/ będziemy publikować kolejny rozdział w postaci elektronicznej, bezpłatnie, na otwartej licencji CC BY&SA.

Dane statystyczne w mediach, konkurs

Czy wykresy służą do manipulowania danymi?
Zazwyczaj (niektórzy powiedzieliby ,,statystycznie”) nie, choć patrząc na niektóre wykresy, nieporadnie prezentujące proste dane, można mieć wątpliwości.

Dobrych wykresów jest coraz więcej, zarówno dlatego, że narzędzia nie pozwalają już popełniać podstawowych błędów, jak i też dlatego, że rośnie świadomość autorów wykresów. Ale wciąż znaleźć można zabawne lub przerażające info-pomyłki i to o nich jest szósty Esej ,,Info-Pomylka”, który odkryjemy za dwa dni.

Czas więc na konkurs.

Wykresy w polskiej prasie pojawiają się coraz częściej, między innymi dlatego, że rośnie dostępność danych, które można pokazać.
Ale nie wszystkie dane okazują się wystarczająco ciekawe by znaleźć się w gazetach lub portalach informacyjnych.
Dzisiejszy konkurs dotyczy właśnie danych liczbowych, które przebijają się do mediów drukowanych lub elektronicznych.

Aby wziąć udział w konkursie, należy znaleźć artykuł z polskojęzycznego portalu informacyjnego, który prezentuje jakieś liczby.
Czy to rankingi, czy wyniki konkursów sportowych, czy poparcie polityczne, czy informacje o demografii czy przestępczości, czy ekonomii, bez znaczenia.

Reguły:
1. W losowaniu biorą udział wszystkie odpowiedzi, nie ma poprawnych i niepoprawnych!.
2. Jedna osoba może wziąć udział tylko raz w tej zabawie.
3. Liczą się tylko głosy oddane dziś i jutro (30 września, 1 października).
4. Spośród odpowiedzi wylosuję jedną osobę, która otrzyma papierowe wydanie Esejów.

Po co?
Pracuję teraz nad zestawem wskazówek dotyczących czytania danych z artykułów prezentowanych w mediach. Okazuje się, że nie zawsze to jest proste, warto pewne rzeczy wyjaśnić.
Ale o jakich zastosowaniach danych w mediach warto opowiedzieć? Tutaj właśnie liczę na Wasze zgłoszenia konkursowe, mam nadzieję z nich odczytać z jakim typem artykułów zazwyczaj kojarzone są dane liczbowe.

Powodzenia w losowaniu. Książka czeka.

[Jeżeli powyższy formularz się nie wyświetla, proszę wysłać odpowiedź przez tę stronę]

Dla nauczycieli na początek roku akademickiego: Zbiór esejów o sztuce prezentowania danych

Okladka
Jeżeli prowadzisz zajęcia związane z prezentacją, czytaniem lub analizą danych, czy to jako doktorant, nauczyciel akademicki, czy nauczyciel w szkole średniej; i chciałbyś otrzymać darmowe, papierowe wydanie ,,Zbioru esejów o sztuce prezentowania danych” to napisz do nas, na adres smarterpoland (na serwerze) gmail.com.

[update:] Z uwagi na liczbę zgłoszeń, oraz liczbę dostępnych promocyjnych egzemplarzy, ta oferta jest już nieaktualna.

W mailu prosimy o informacje:
1. Jakie zajęcia związane z danymi prowadzisz (nazwa, link do www jeżeli istnieje),
2. Gdzie pracujesz (szkoła/uczelnia/wydział),
3. Na jakie imię, nazwisko i adres wysłać Eseje. Adres musi być adresem uczelni/wydziału/szkoły.

Jeżeli znacie nauczycieli akademickich, potencjalnie zainteresowanych tematem prezentacji danych, to udostępnijcie ten post lub prześlijcie go dalej.

Za tydzień rozpoczyna się rok akademicki. Jednym z celów fundacji jest edukacja w obszarze analizy i prezentacji danych. Stąd pomysł, by wyposażyć w papierową wersję Esejów osoby prowadzące zajęcia związane z analizą danych lub wnioskowaniem opartym o dane. Czy to prowadzące zajęcia dla studentów czy dla uczniów szkół średnich. Mam nadzieję, że eseje staną się inspiracją do ciekawego wykładu dla uczniów czy studentów.

Liczba egzemplarzy, które planujemy rozesłać jest ograniczona.

Esej: Od Kuchni

Pod adresem www.biecek.pl/Eseje/ indexKuchnia.html udostępniliśmy esej o tytule ,,Od kuchni”. Piąty z serii ,,Wakacje z wizualizacją” (tak, niektórzy jeszcze mają wakacje).

We wtorek zorganizowaliśmy konkurs związany z tym esejem. W konkursie należało wskazać najładniejszy wykres, z pięciu dostępnych do wyboru. Każdy wykres przedstawiał 36 średnich za pomocą punktów. Każdy wykres wykorzystywał domyślnych ustawienia innej biblioteki/programu, lub zmiany tych ustawień, które można wykonać w 2-3 minuty (oczywiście, każdy z nich można by poprawić, ale nie to było celem).

W zabawie wzięło udział 270 osób. Z tej grupy 68% (183 osoby) uznały, że najbardziej podoba im się wykres wykonany w ggplot2, 8% (22 osoby) wybrały opcje ggplot2 połączoną z biblioteką imitującą minimalizm Tuftego (theme_tufte), 10% (28 osób) wybrało wykres wykonany w Excelu (pomimo problemów z osiami), 11% (29 osób) wybrało wykres przygotowany w Tableau (jedna z bardziej popularnych rysowarek) a 3% (8 osób) wybrało opcje plot.ly

plot_651547531

Pomysł na konkurs pojawił się po lekturze pracy Ihad Inbar, Noam Tractinsky and Joachim Meyer. Minimalism in information visualization: attitudes towards maximizing the data-ink ratio., która pokazuje, że przy całym naszym zachwycie minimalizemem Tuftego, większość osób woli mniej minimalistyczne wykresy. Okazuje się, że w grupie osób, które zechciały wziąć udział w ankiecie imitacja pomysłów Tuftego zajęła drugie miejsce, ale od końca. Zdecydowanym liderem jest domyślny wykres wyprodukowany przez bibliotekę ggplot2 (pomimo swoich wad, oparciu się o kolory nie kształty i to szare tło).

Pozytywnie zaskoczyła mnie liczba komentarzy pod poprzednim postem. Jednym z ciekawych komentarzy była sugestia, by na wykresie wykorzystać paski zamiast punktów (paski lepiej wypełniają obszar wykresu i jest na czym zawiesić oko). I tutaj dochodzimy do eseju ,,od kuchni”. W samym eseju omawiamy różne skale pomiarowe: ilorazową, interwałową i jakościową. Zastanawiamy się jakie charakterystyki pozwalają na poprawne przedstawienie wartości. Jeżeli nie mamy pomiarów w skali ilorazowej, to nie możemy używać pasków. Niestety pomiary PV umiejętności w badaniach PISA czy PIAAC nie są w skali ilorazowej, nie mają naturalnego punktu 0 i nie możemy wykorzystywać długości.

W konkursie wygrał numerek 70, czyli osoba o mailu radek.********@gmail.com. Gratulujemy! Skontaktujemy się mailowo. Niedługo kolejne konkursy.

Ciekawostka: Dlaczego ten esej otwiera 44 zdjęć wieży Eiffela? Byłem jakiś czas temu w Paryżu i chciałem zrobić dobre zdjęcie wieży Eiffela (tak wiem, nuda). Stwierdziłem, że najlepiej będzie zrobić dużo zdjęć wieży i zestawić je obok siebie, by porównać które i dlaczego mi się bardziej podoba.

Ten esej to część zbioru ,,Odkrywać! Ujawniać! Objaśniać!” wydanego przez Fundację, dostępnego już w sprzedaży. O tym jak go kupić można przeczytać na stronie http://biecek.pl/Eseje/ indexZakup.html. Co trzy tygodnie na stronie http://biecek.pl/Eseje/ będziemy publikować kolejny rozdział w postaci elektronicznej, bezpłatnie, na otwartej licencji CC BY&SA.