Wykresy unplugged – ćwicz rysowanie wykresów

Wykresy Unplugged to nasza nowa pozycja poświęcona wizualizacji danych. Pisałem o niej przed świętami (więcej informacji tutaj), ale pierwszy druk miał mały nakład i rozszedł się błyskawicznie.
Nic straconego!
Od kilku dni w księgarniach jest już dodruk. Poniżej krótki opis co znajdziecie w środku tej pozycji oraz gdzie można ją kupić.

W Esejach o wizualizacji danych znaleźć można sporo teorii ale niewiele ćwiczeń. Wykresy unplugged to głównie ćwiczenia (28 stron, A4, pełny kolor). Zeszyt wyposażony jest w 8 kompletów danych i ćwiczeń do samodzielnego wyrysowania. Wyrysowania ołówkiem i kredkami, nie ma co ograniczać się do możliwości nawet najlepszego programu graficznego. Obok ćwiczeń jest też kilka wkładek tematycznych o technikach wizualizacji. To zeszyt ćwiczeń dla każdej kreatywnej osoby, nawet zabieganego dyrektora działu Data Science.

Prace nad wykresami zaczęliśmy w okolicach UseR 2017 (jak widać opracowanie takiej pozycji trwa mniej więcej tyle co ciąża słonia). Książka powstała dzięki współpracy z Ewą Baranowską (entuzjastka D3 i grafiki interaktywnej), Piotrem Sobczykiem (autor między innymi Szychta w danych) oraz studiem graficznym storyvisio.

Wykresy unplugged można kupić w Wydawnictwach Uniwersytetu Warszawskiego, w Księgarni PWN lub znaleźć najtańszego dostawcę na ceneo.

Frajdy z rysowania wykresów!

Wykresy Unplugged – pomysł na prezent pod choinkę

Wizualizacja danych to jedna z tych przyjemnych i pożytecznych czynności, która pozwala nam lepiej zrozumieć otaczający nas świat.

Ale nikt nie rodzi się z umiejętnością odczytywania czy tworzenia wykresów. Tę umiejętność trzeba w sobie wyćwiczyć.

Można oczywiście czytać o wizualizacji (np. w Esejach o wizualizacji danych) lub oglądać wykresy (np. na FlowingData), ale jeszcze lepiej byłoby poznawać wykresy w sposób czynny – tworząc je.

Nowa pozycja o wizualizacji danych

Wykresy Unplugged to książka (28 stron A4, pełny kolor) omawiająca osiem najpopularniejszych typów wykresów. Czterech poświęconych wizualizacji rozkładu (wykres kołowy, łodyga – liście, histogram, pudełko-wąsy) oraz czterech poświęconych relacjom (zmiany, kropkowy, kartogram, mozaika).

Każdy wykres ma swoją rozkładówkę. Na lewej stronie opisywane są ciekawostki, sposób budowy oraz przykład dla danego wykresu, a po prawej stronie są przykładowe dane oraz miejsce na narysowanie własnego wykresu.

Tak! Narysowanie!

W tej książce są ćwiczenia do wykonania z użyciem ołówka (i czasem kredek, ewentualnie kolorowych długopisów).

Do wykresów przygotowane są również ćwiczenia i pytania, pozwalające nam na weryfikacje co łatwiej wyciągnąć z tabelki z liczbami a co z wykresu.

Obok wykresów, w tej książce znajdują się przykładowe rozwiązania i dodatkowe rozkładówki omawiające wybrane zagadnienia teoretyczne (dobór kształtów, kolorów historia wizualizacji).

Zazwyczaj zajęcia z wizualizacji danych oparte są o jakieś programy graficzne, tak by szybko można było coś wyklikać. Ale obecne komputerowe narzędzia są bardzo ograniczające. Dużo energii wchodzi w opanowanie narzędzia zamiast w myślenie o danych. Stąd zrodził się pomysł na zbudowanie książki, uzupełnionej o ćwiczenia, które będzie można wykonać bez komputera. Oto i ona – Wykresy Unplugged.

Jak ją zdobyć?

Książkę można kupić bezpośrednio na stronie Wydawnictw Uniwersytetu Warszawskiego, wkrótce dostępna będzie też w Empiku, Merlinie i sklepiku w Centrum Nauki Kopernik.

Książka kierowana jest dla osób ciekawych świata od 10 do 110 lat.

Książka powstała dzięki współpracy z Ewą Baranowską (entuzjastka D3 i grafiki interaktywnej), Piotrem Sobczykiem (autor między innymi Szychta w danych) oraz studiem graficznym storyvisio.

Seria Beta i Bit

Wykresy Unplugged to część serii Beta i Bit – projektu popularyzującego matematykę, informatykę i wnioskowanie oparte o dane. Na wniosek wydziału MiNI PW, za prace nad tym projektem, otrzymałem Medal Komisji Edukacji Narodowej (!!!).
To się nawet dobrze złożyło, ponieważ z końcem roku do sklepów trafiają dwie pozycje z tej serii, Wykresy Unplugged i W pogoni za nieskończonością.
O tej drugiej napiszę na dniach.

Prace domowe

Dawno już nie prowadziłem przedmiotu, przy którym tyle przyjemności sprawiało mi sprawdzanie prac domowych!

Na przedmiocie ,,Techniki prezentacji danych”, studenci jako prace domowe przygotowują grafiki związane z danymi, które znaleźli w gazetach z ostatniego tygodnia. Niektóre z tych prac są świetne. Poniżej dwie wykonane ostatnio przez Ewę Baranowską i Martę Jóźwik.

Tabela z Bloombergnews Polska

twd2

zamienia się w wykres przedstawiający rekordowe hiperinflacje (dwie z nich dotyczą Polski). Wykres trzeba oglądać w pełnej rozdzielczości (kliknij by otworzyć w pełnej rozdzielczości).

twd

Drugi wykres wyrósł z Pulsu Biznesu.

img_20161118_244049659

Trochę gg-magii i

twd3

Z dziennika nauczyciela akademickiego – Techniki Wizualizacji Danych

Prowadzę w tym semestrze Techniki Wizualizacji Danych na MiNI PW. Omawiamy najróżniejsze narzędzia do tworzenia grafiki statycznej i interaktywnej. Począwszy od ggplot2 przez google vis, D3 po Adobe Illustrator.
Ale w wizualizacji danych to nie narzędzie jest najważniejsze, ale komunikatywność historii, którą się graficznie przedstawia.

Jak ją ćwiczyć?

Akurat tutaj duże nadzieje pokładam w pracach domowych. W ramach ćwiczeń, co tydzień, studenci wyszukują w gazetach czy portalach informacyjnych dane lub wykresy, a następnie przygotowują wizualizacje danych z użyciem narzędzi, które akurat w danym tygodniu omawiamy.

Poniżej pokażę dwie bardzo ciekawe prace domowe z pierwszego tygodnia zajęć (ggplot2).

Pani Ewa Baranowska znalazła w Rzeczpospolitej poniższą tabelę dotyczącą liczby spraw prowadzonych przez prokuratorów w różnych krajach.

I z odrobiną magii w ggplot2 powstał poniższy wykres. Nieporównywalnie czytelniejszy niż ww. tabela. Wyraźnie widać różnice pomiędzy wschodem a zachodem Europy.

Drugą pracę, która przypadła mi do gustu, wykonał pan Maksymilian Mazur. Dane dotyczące walki pomiędzy Danem Hendersonem a Michaelem Bispingiem (tutaj link) przedstawił je za pomocą poniższego wykresu.

Wyraźnie widać różnice pomiędzy 2 i 5 rundą. Nie było jej widać w oryginalnej grafice.

Co nowego w drugim wydaniu Esejów?


Drugie wydanie Esejów trafiło do księgarni internetowych w poprzednim tygodniu.

Jest też dostępne (prawie całe) na stronie http://biecek.pl/Eseje.
Największą zmianą jest dodanie nowego rozdziału o Gramatyce języka wizualizacji danych (głównie ggplot2, ale raczej o logice niż opis konkretnych funkcji). Ten rozdział jeszcze nie jest całkowicie przekonwertowany do formatu HTML, więc na www ukaże się wkrótce. Poniżej krótko opowiem co nowego w pozostałych rozdziałach.

W Perełkach z historii pojawił się nowy podrozdział ,,Polacy nie gęsi”.
Między innymi z informacjami o Atlasie Metod Kartograficznych http://www.educarto.pl/

Czytaj dalej Co nowego w drugim wydaniu Esejów?

Międzynarodowe Standardy Komunikacji Biznesowej – The International Business Communication Standards

Screen Shot 2016-01-05 at 02.31.49
TL;DR
1. Konsorcjum IBCS-A pracuje nad zbiorem standardów The International Business Communication Standards
2. Standardy są otwarte i dostępne na licencji CC na stronie http://www.ibcs-a.org/standards
3. Świetny zbiór konkretnych wskazówek do stosowania w komunikacji biznesowej i nie tylko.

Czytaj dalej Międzynarodowe Standardy Komunikacji Biznesowej – The International Business Communication Standards

Jak głosować przeciw

a1
Na wczorajszym SERze mieliśmy ciekawą dodatkową prezentację (z uwagi na późne zgłoszenie nie uwzględnioną w programie) nt. aplikacji w shiny, która pomaga określić na kogo głosować jeżeli chce się głosować przeciw.

O co chodzi? Istnieją całkiem duże negatywne elektoraty największych partii (pewnie nie tylko największych), które głosują na jedną bo są przeciw tej drugiej. Z jednej strony głosując przeciw można wybrać dowolną partię, ale z drugiej, o czym może część osób nie wiedzieć, nawet jeżeli partia przekroczy prób, to wciąż w danym okręgu może nie dostać żadnego mandatu z uwagi na to w jaki sposób mandaty są przydzielane (ile osób zna metodę D’Hondta). Wiec Karol Klimas przedstawiał aplikację w shiny, która pomaga określać na które partie można glosować w określonym okręgu, jeżeli głosuje się przeciw.

Poniżej gościnny wpis Karola, a każdy obrazek to link do wspomnianej aplikacji.

Czytaj dalej Jak głosować przeciw

Jak oni głosowali – rozwinięcie [btw: dziś Światowy Dzień Statystyki]


Po publikacji wczorajszego wpisu Wizualizacja 6000 głosowań otrzymałem kilka pytań, które sprowadzają się do:
Dlaczego pokazujesz koło i mówisz na nie drzewo?
Czy jest to nawiązanie do jednego z dowcipów o matematykach?

(kilka dobrych dowcipów o matematykach znajdziecie tutaj).
Świetne pytanie! Już wyjaśniam!

A ponieważ obchodzimy dzisiaj Światowy Dzień Statystyki (tak, tak, dzisiaj każda średnia jest bardziej!) więc napiszę też trochę o warsztacie. Zapnijcie pasy, włączcie RStudio i zaczynamy.

Czytaj dalej Jak oni głosowali – rozwinięcie [btw: dziś Światowy Dzień Statystyki]

Jak oni głosowali – wizualizacja ponad 6000 głosowań w sejmie VII kadencji

Screen Shot 2015-10-18 at 14.23.31

W genetyce często wykorzystywaną wizualizacją są drzewa filogenetyczne. Pokazują one strukturę podobieństwa (np. sekwencji DNA) pomiędzy organizmami, genami czy innymi jednostkami.

Zamiast genów porównywać będziemy posłów, a zamiast DNA weźmiemy profil głosów w kolejnych głosowaniach.

Wykorzystamy drzewa filogenetyczne by pokazać strukturę podobieństwa pomiędzy profilami głosowań posłów. W skrócie: dla każdej pary posłów wybieramy ich głosowania i sprawdzamy czy głosowali podobnie, czy nie. Na poniższym wykresie zaznaczamy podobieństwo za pomocą drzewa. Im bliżej (licząc odległość po gałęziach drzewa) są posłowie, im bliższe połączenie pomiędzy posłami, tym bardziej podobnie głosowali.

Co ciekawego z takich drzew można odczytać?

Zacznijmy od drzewa dla wszystkich głosowań.

Czytaj dalej Jak oni głosowali – wizualizacja ponad 6000 głosowań w sejmie VII kadencji