Graficzna prezentacja danych statystycznych – wykresy z opracowania GUS

Screen Shot 2016-01-05 at 00.48.12
TL;DR
1. GUS opracował na licencji CC raport ,,Graficzna prezentacja danych statystycznych”.
2. Jest tam kilka ciekawych grafik.


GUS w ramach współpracy z Gruzją przygotował opracowanie ,,Graficzna prezentacja danych statystycznych” dostępne na tej stronie (raport jest na licencji CC-BY!).

Opracowanie opisane jest jako: podręcznik dobrych praktyk w zakresie udostępniania danych statystycznych, w którym omówiono sposoby graficznej prezentacji danych, ze szczególnym uwzględnieniem map statystycznych oraz analizowania i wizualizowania danych regionalnych za pomocą geograficznych systemów informacji.

W opracowaniu jest dużo ciekawych uwag, wskazówek i komentarzy, warto go przeczytać. Pomimo 177 stron czyta go się bardzo szybko, większość treści to wykresy. Nacisk położony jest na kartogramy i kartodiagramy, można się o nich wiele dowiedzieć. O grafice statystycznej jest tylko kilka stron.

Dziś na blogu kilka wykresów z tego raportu. Wybrałem te, które najbardziej przypadły mi go gustu.

Czytaj dalej Graficzna prezentacja danych statystycznych – wykresy z opracowania GUS

Z dziennika nauczyciela akademickiego

Rysunek ze strony examtime

TL;DR
1. Prowadząc zajęcia ze studentami, jeżeli chcemy poszerzyć warsztat technik znanych studentom, grywalizacja jest ciekawym rozwiązaniem.
2. Grywalizacja jest słabym rozwiązaniem (imho), jeżeli chcemy rozwijać inicjatywę i wspólne uczenie się według modelu wymiany wiedzy wielu do wielu.

Piszę ten wpis, ponieważ brakuje mi dyskusji na temat tego jak usprawniać prowadzenie zajęć z analizy danych. Może tym wpisem taką dyskusję sprowokuję, czy to na tym blogu czy poza nim (czy to z innymi prowadzącymi, czy studentami).
Po dłuższej przerwie, kilka miesięcy temu, wróciłem do pełnowymiarowej dydaktyki. Ostatnio testowałem kilka ,,usprawnień’’ w prowadzeniu zajęć i poniżej podzielę się doświadczeniami.

Czytaj dalej Z dziennika nauczyciela akademickiego

Międzynarodowe Standardy Komunikacji Biznesowej – The International Business Communication Standards

Screen Shot 2016-01-05 at 02.31.49
TL;DR
1. Konsorcjum IBCS-A pracuje nad zbiorem standardów The International Business Communication Standards
2. Standardy są otwarte i dostępne na licencji CC na stronie http://www.ibcs-a.org/standards
3. Świetny zbiór konkretnych wskazówek do stosowania w komunikacji biznesowej i nie tylko.

Czytaj dalej Międzynarodowe Standardy Komunikacji Biznesowej – The International Business Communication Standards

MI^2 rekrutuje

Screen Shot 2015-05-16 at 00.19.57

Jakiś czas temu pisałem o grupie MI^2 (rozpiętej pomiędzy wydziałami matematyki i informatyki MIM UW a MINI PW).

Trwa rekrutacja do projektów planowanych w tej grupie na ferie zimowe lub letnie. Lista aktualnie zgłoszonych projektów znajduje się na tej stronie.

Aby wziąć udział w projektach nie trzeba być studentem żadnego z tych wydziałów, ale trzeba mieć czas, ochotę i chęć mierzenia się z czasem trudnymi problemami związanymi z analizą danych.

Wykresy, Lenin a sprawa polska

thumb_IMG_0530_1024
dr Julian Daszkowski zauważył, że w Esejach o sztuce przedstawiania danych brakuje polskich akcentów. I podsunął mi książkę Ł. Byzowa ,,Graficzne metody w statystyce planowaniu i ewidencji”. To prawdopodobnie pierwsza książka poświęcona prezentacji danych w języku polskim. Oryginał w języku rosyjskim powstał w 1940 roku (!!!), na język polski została przetłumaczona w roku 1951. Dosyć trudno dostać jej egzemplarz, ale na szczęście jeden jest w bibliotece MIM UW (jedyny na UW).

Książka jest genialna. Rozpoczyna ją przedmowa redaktora na temat tego, czy po 11 latach od oryginalnej publikacji, w roku 1951 książka wciąż jest aktualna. A jak się zaraz okaże, duże części są aktualne nawet dziś po 76 latach. W kwestii perspektywy, rok 1940 to dwa lata przed urodzeniem się Edwarda Tufte i 37 lat przed tym jak John Tukey napisał Exploratory Data Analysis. Ok, co wiec znajdziemy w tej nadgryzionej czasem książce?

Czytaj dalej Wykresy, Lenin a sprawa polska

[R + finanse]: Jak przedstawiać zależność między zmiennymi losowymi? (3)

Marcin Pitera

Dzisiaj bardziej ogólnostatystyczny wpis, choć nie bez znaczenia dla matematyki finansowej.

Załóżmy, iż mamy dany n-wymiarowy wektor losowy X=(X_1,\ldots, X_n) i chcemy opisać (czy zobrazować) zależność między zmiennymi brzegowymi, tzn. zmiennymi losowymi X_1, \ldots, X_n. Oczywiście w przypadku matematyki finansowej zagadnienie to jest bardzo istotne. Na przykład informacja o zależności między akcjami pozwala nam na konstruowanie zdywersyfikowanych portfeli finansowych, co często przekłada się na zmniejszony poziom ryzyka, które ponosimy (o analizie Markowitza opowiemy innym razem).

Czytaj dalej [R + finanse]: Jak przedstawiać zależność między zmiennymi losowymi? (3)

EksploRacja danych z krokomierza


Dobrze mieć szwagra. Ostatnio dowiedziałem się od niego, że telefony appla wersji 5s i wyżej, mają koprocesor ruchu. Nic nie trzeba włączać, a on (telefon, nie szwagier) non stop liczy kroki, dystans itp. (o ile oczywiście ma się telefon przy sobie).

To czy i od kiedy liczy, można sprawdzić w aplikacji Health. Poniżej zobaczymy jak te dane wczytać do R i zrobić prostą eksplorację. Poniższy kod jest przetestowany dla iphona, ale pewnie z niewielkimi zmianami będzie działał dla danych z telefonów od innych producentów.

Tutaj są instrukcje jak wysłać sobie dane mailem. Otrzymamy je jako plik xml, zacznijmy od ich wczytania.

Czytaj dalej EksploRacja danych z krokomierza

SER XV – duuuużo R + elastic i pivotTable

W czwartek o godzinie 18, na MINI PW (Warszawa Koszykowa 75 sala 329), zaczynamy piętnasty SER. Tym razem mamy dwóch prelegentów z Wirtualnej Polski.
Dostałem informację, że przed przerwą zimową (w lutym SERa nie będzie) mają zamiar pokazać nam bardzo dużo eRa na żywo.

Na spotkanie można się zapisać przez stronę meetup (na obecną chwilę jest 599 Entuzjastów R, jest więc szansa na bycie sześćsetnym entuzjastą).

Czytaj dalej SER XV – duuuużo R + elastic i pivotTable

Czy przekroczą 55 milionów?

Już jutro finał 24. Wielkiej Orkiestry Świątecznej Pomocy. Z roku na rok WOŚP zbiera coraz więcej środków, w tym roku na wsparcie oddziałów pediatrycznych i opieki medycznej seniorów. Jak myślicie ile pieniędzy uda się zebrać?
Zobaczmy co na ten temat mają do powiedzenia modele liniowe ;-)

Screen Shot 2016-01-09 at 02.34.59

Czytaj dalej Czy przekroczą 55 milionów?

Tabela 1 a pakiet Gmisc

Tworząc raporty często początkowe tabele są do siebie podobne – przedstawiają statystyki opisowe zmiennych. Bardziej złożone statystyki są zazwyczaj później.

W przypadku prac bio-medycznych używa się sformułowania Tabela 1 – czyli pierwsza tabela w artykule, zazwyczaj przedstawiająca statystyki opisowe porównywanych grup (np terapia A/B/C).

Ostatnio odkryłem pakiet Gmisc – fantastyczne wsparcie do szybkiego tworzenia (dobrze wyglądających) tabel prosto z poziomu knitra. Poniższy przykład dotyczy tabeli z podsumowaniem, ale możliwości tego pakietu są znacznie większe.

Przykładowo, taki krótki kawałek kodu (nazwy ważnych zmiennych usunąłem ze zrozumiałych powodów)

Czytaj dalej Tabela 1 a pakiet Gmisc