Co nowego w drugim wydaniu Esejów?


Drugie wydanie Esejów trafiło do księgarni internetowych w poprzednim tygodniu.

Jest też dostępne (prawie całe) na stronie http://biecek.pl/Eseje.
Największą zmianą jest dodanie nowego rozdziału o Gramatyce języka wizualizacji danych (głównie ggplot2, ale raczej o logice niż opis konkretnych funkcji). Ten rozdział jeszcze nie jest całkowicie przekonwertowany do formatu HTML, więc na www ukaże się wkrótce. Poniżej krótko opowiem co nowego w pozostałych rozdziałach.

W Perełkach z historii pojawił się nowy podrozdział ,,Polacy nie gęsi”.
Między innymi z informacjami o Atlasie Metod Kartograficznych http://www.educarto.pl/

Czytaj dalej Co nowego w drugim wydaniu Esejów?

Z dziennika nauczyciela akademickiego: mapa myśli na koniec kursu?

Screen Shot 2016-02-18 at 19.24.42

Po zakończeniu kursu, jako prowadzący, bardzo chciałbym wiedzieć co studenci zapamiętali a czego nie. Taką informację zwrotną czasem można otrzymać poprzez egzamin. Ale co w sytuacji gdy egzaminu nie ma lub nie jest dla wszystkich (np. egzamin jest tylko na ocenę 5, niższe oceny można dostać na podstawie projektów i prac domowych)?

Poniżej opiszę, co zrobiłem podczas kursu z modeli z efektami mieszanymi. Był to prosty eksperyment, ale myślę, że miał kilka interesujących konsekwencji.

Czytaj dalej Z dziennika nauczyciela akademickiego: mapa myśli na koniec kursu?

Gadki posłów, kto jest aktywny na mównicy, a kto poza nią

TL;DR: Na mównicy najbardziej aktywni są posłowie Nowoczesnej i PSL. Poza mównicą wiele wtrąceń przypada na posłów PiS i PO. Poniższa aplikacja pozwoli Wam zobaczyć jak wyglądają te wtrącenia, ciekawa lektura.

Wspólnie z MamPrawoWiedziec.pl przyglądaliśmy się stenogramom z pierwszych 100 dni działania Sejmu VIII kadencji. Świetnie nadaje się do tego pakiet SejmRP. Sejmowe stenogramy obejmują zarówno wypowiedzi z mównicy, jak i różne wtrącenia z sali.

Jak myślicie, którzy posłowie są najbardziej aktywni na mównicy a którzy poza nią?

Zacznijmy od wykresu dla posłów. Poniżej na osi pionowej zaznaczono liczbę wypowiedzi z mównicy, na osi poziomej liczbę wtrąceń w wypowiedzi innych posłów a kolorem zaznaczono klub.


archivist::aread('mi2-warsaw/sejmRP/UseCase/arepo/d56dddf5c697e89d9d31726055b5d0fe')

Czytaj dalej Gadki posłów, kto jest aktywny na mównicy, a kto poza nią

Why should you backup your R objects?

There is a saying that there are two groups of people: those who are already doing backups and those who will. So, how this is linked with reproducible research and R?

If your work is to analyze data then you often face a need to restore/recreate/update results that you have generated some time ago.
You may think ,,I have a knitr reports for everything!”. That’s great! It will save you a lot of troubles. But to have 100% of warranty for exactly same results you need to have exactly the same environment and same versions of packages.

Do you know how many R packages have been updated during last 12 months?

I took list of top 20 R packages from here, scrap dates of their current and older CRAN releases from here and generate a plot with dates of submissions to CRAN sorted along date of last submission.

Czytaj dalej Why should you backup your R objects?

OMatKo!!!

logo

Takie inicjatywy lubimy.
OMatKo!!! to III Ogólnopolska Matematyczna Konferencja Studentów.
Poniżej zaproszenie od organizatorów.

Rok akademicki ma to do siebie, że w jego trakcie czas płynie w zastraszającym tempie.
Dlatego, wbrew pozorom, zbliżająca się wielkimi krokami kwietniowa konferencja OMatKo!!! (Ogólnopolska Matematyczna Konferencja Studentów) nie jest wcale tak odległym terminem. W natłoku obowiązków, zajęć i innych projektów warto już teraz zakreślić sobie w kalendarzu trzeci weekend kwietnia – to jest 15-17. 04.2016r.

Czytaj dalej OMatKo!!!

PAZUR – 19 lutego

Screen Shot 2016-02-10 at 14.21.15

Poniżej przesyłam informację od Macieja Beręsewicza o najbliższym PAZURze. Spotkanie jest w Poznaniu, ale goście są i z Warszawy i zza wielkiej wody.

Szanowni Państwo,

Katedra Statystyki UEP, Katedra Metod Matematycznych i Statystycznych UP oraz SKN Estymator serdecznie zaprasza na kolejne spotkanie użytkowników R w Poznaniu, które odbędzie się 19 lutego (piątek). Tym razem przewidzieliśmy dwa wystąpienia. Aby wziąć udział w spotkaniu uprzejmie prosimy o wcześniejszą rejestrację przez portal MeetUP.

Czytaj dalej PAZUR – 19 lutego

Drugie wydanie Esejów oraz kilka doświadczeń z procesu wydawania książki

Okladka-724x1024

Dwa dni temu odebrałem z drukarni drugie, rozszerzone o ponad 30 stron, wydanie Zbioru esejów o sztuce prezentowania danych. Od wczoraj jest ono dostępne w księgarni Politechniki Warszawskiej (gmach główny), a niedługo powinno być dostępne w szerszej dystrybucji. Z tej okazji chciałbym podzielić się kilkoma doświadczeniami z pisania i samodzielnego wydawania książki. Może komuś się do czegoś przydadzą.


Czytaj dalej Drugie wydanie Esejów oraz kilka doświadczeń z procesu wydawania książki

Klasyfikacja i regresja z pakietem caret – ściągawka

Pakiet caret (akronim od Classification And REgression Training) to świetne narzędzie do budowy modeli, testowania, wyboru zmiennych i innych zadań często wykonywanych do analizy danych.

W ramach zaliczenia przedmiotu Data Mining dwie osoby przygotowały dwie ściągawki z funkcjonalności tego pakietu. Obie poniżej. Wersje pdf można pobrać po kliknięciu.

Dwustronicowe opracowanie przygotowane przez Neven Piculjan.

I jednostronicowe streszczenie przygotowane przez Ziad Al Bkhetan.

Graficzna prezentacja danych statystycznych – wykresy z opracowania GUS

Screen Shot 2016-01-05 at 00.48.12
TL;DR
1. GUS opracował na licencji CC raport ,,Graficzna prezentacja danych statystycznych”.
2. Jest tam kilka ciekawych grafik.


GUS w ramach współpracy z Gruzją przygotował opracowanie ,,Graficzna prezentacja danych statystycznych” dostępne na tej stronie (raport jest na licencji CC-BY!).

Opracowanie opisane jest jako: podręcznik dobrych praktyk w zakresie udostępniania danych statystycznych, w którym omówiono sposoby graficznej prezentacji danych, ze szczególnym uwzględnieniem map statystycznych oraz analizowania i wizualizowania danych regionalnych za pomocą geograficznych systemów informacji.

W opracowaniu jest dużo ciekawych uwag, wskazówek i komentarzy, warto go przeczytać. Pomimo 177 stron czyta go się bardzo szybko, większość treści to wykresy. Nacisk położony jest na kartogramy i kartodiagramy, można się o nich wiele dowiedzieć. O grafice statystycznej jest tylko kilka stron.

Dziś na blogu kilka wykresów z tego raportu. Wybrałem te, które najbardziej przypadły mi go gustu.

Czytaj dalej Graficzna prezentacja danych statystycznych – wykresy z opracowania GUS