,,Gramatyka języka wizualizacji danych” to nowy rozdział w drugim wydaniu ,,Zbioru esejów o sztuce prezentowania danych”. Jest on już dostępny online na stronie http://biecek.pl/Eseje/indexGramatyka.html.
Ten esej jest oparty głównie o materiały z książki Lelanda Wilkinsona ,,The Grammar of Graphics”, moje doświadczenia z pakietem ggplot2 oraz eksperymenty z narzędziami do wyrażania komunikatów opartych o dane (w tym wykresów statystycznych, ale nie tylko).
To nie są materiały do nauki pakietu ggplot2 (ggplot2 to jedna z implementacji gramatyki języka wizualizacji, być może to najbardziej dojrzała implementacja ale z pewnością nie doskonała, jeszcze). Jest to raczej próba rozłożenia na niezależne części elementów wykresu, które są w niezależny sposób z wykresu odczytywane.
Użycie pakietu archivist pozwoliło na umieszczenie uchwytów oraz instrukcji odtwarzających wszystkie wykresy w tym eseju. Kompletna lista wykresów, kodów R i uchwytów archivista znajduje się tutaj https://rawgithub.com/pbiecek/Eseje/master/GamatykaGrafiki.html.
Gdyby ktoś szukał polskojęzycznych materiałów poświęconych nauce podstaw ggplot2 to polecam ,,Przewodnik po pakiecie R” (tutaj lub tutaj). Angielskojęzycznym materiałów jest wiele, można zacząć od strony domowej samego projektu http://docs.ggplot2.org/current/.
To bardzo interesujące zagadnienie i dobrze, że ktoś to przybliża w języku polskim (moim studentom będzie łatwiej 🙂 ).
Zauważyłem nieścisłość między opisem słownym („51,6% to mężczyźni, a 48,4% to kobiety”), a danymi w tabelce i na wykresie. Nie przeczytałem jeszcze całego eseju, więc nie wiem, może to tak celowo? 😉
To nie było celowe 😉 Dzięki.