Konferencja „Big Data – bigger opportunities”, 28-29 kwietnia SGH

12953292_592531930905955_298183681_o

Nasza fundacja została patronem honorowym konferencji ,,Big Data – bigger opportunities” organizowanej przez Studenckie Koło Naukowe Statystyki w SGH i zaplanowanej na 28-29 kwietnia 2016 w Warszawie.

Serdecznie zapraszamy. Poniżej więcej informacji od organizatorów (i zdjęcie organizatorów).

Czytaj dalej Konferencja „Big Data – bigger opportunities”, 28-29 kwietnia SGH

Geostatystyka w R

Screen Shot 2016-04-08 at 22.08.41

R Studio uruchomiło serwis https://bookdown.org/ z otwartymi książkami tworzonymi w R/knitr/pandoc.

Jest już na nim pierwsza polska pozycja!

Jest to ,,Geostatystyka w R”, Jakub Nowosad, 2016, czyli skrypt do zajęć z geostatystyki z UAM.

Na wydziałach matematycznych nie zawsze są zajęcia z geostatystyki, więc warto sobie ten skrypt przejrzeć.

Na GitHubie grupy MI2 założyłem plik z listą polskojęzycznych bezpłatnych materiałów poświęconych R. Jeżeli znacie inne to po prostu je dodajcie przez GitHub. (na wikipedii jest lista książek, ale czasem krótsze opracowania na określony temat mogą być bardzo kształcące).

Co nowego w drugim wydaniu Esejów?


Drugie wydanie Esejów trafiło do księgarni internetowych w poprzednim tygodniu.

Jest też dostępne (prawie całe) na stronie http://biecek.pl/Eseje.
Największą zmianą jest dodanie nowego rozdziału o Gramatyce języka wizualizacji danych (głównie ggplot2, ale raczej o logice niż opis konkretnych funkcji). Ten rozdział jeszcze nie jest całkowicie przekonwertowany do formatu HTML, więc na www ukaże się wkrótce. Poniżej krótko opowiem co nowego w pozostałych rozdziałach.

W Perełkach z historii pojawił się nowy podrozdział ,,Polacy nie gęsi”.
Między innymi z informacjami o Atlasie Metod Kartograficznych http://www.educarto.pl/

Czytaj dalej Co nowego w drugim wydaniu Esejów?

MI^2 rekrutuje

Screen Shot 2015-05-16 at 00.19.57

Jakiś czas temu pisałem o grupie MI^2 (rozpiętej pomiędzy wydziałami matematyki i informatyki MIM UW a MINI PW).

Trwa rekrutacja do projektów planowanych w tej grupie na ferie zimowe lub letnie. Lista aktualnie zgłoszonych projektów znajduje się na tej stronie.

Aby wziąć udział w projektach nie trzeba być studentem żadnego z tych wydziałów, ale trzeba mieć czas, ochotę i chęć mierzenia się z czasem trudnymi problemami związanymi z analizą danych.

Wykresy, Lenin a sprawa polska

thumb_IMG_0530_1024
dr Julian Daszkowski zauważył, że w Esejach o sztuce przedstawiania danych brakuje polskich akcentów. I podsunął mi książkę Ł. Byzowa ,,Graficzne metody w statystyce planowaniu i ewidencji”. To prawdopodobnie pierwsza książka poświęcona prezentacji danych w języku polskim. Oryginał w języku rosyjskim powstał w 1940 roku (!!!), na język polski została przetłumaczona w roku 1951. Dosyć trudno dostać jej egzemplarz, ale na szczęście jeden jest w bibliotece MIM UW (jedyny na UW).

Książka jest genialna. Rozpoczyna ją przedmowa redaktora na temat tego, czy po 11 latach od oryginalnej publikacji, w roku 1951 książka wciąż jest aktualna. A jak się zaraz okaże, duże części są aktualne nawet dziś po 76 latach. W kwestii perspektywy, rok 1940 to dwa lata przed urodzeniem się Edwarda Tufte i 37 lat przed tym jak John Tukey napisał Exploratory Data Analysis. Ok, co wiec znajdziemy w tej nadgryzionej czasem książce?

Czytaj dalej Wykresy, Lenin a sprawa polska

Choinka a SER

ctree

Grudniowy SER był bardzo techniczny i bardzo udany. Prezentacje obu prelegentów można pobrać z GitHuba. Kornel miał kilka animowanych gifów i te będą działały tylko pod Keynote, pdf jest statyczny.

Choinka otwierająca ten wpis została przygotowana w GGplocie przez Czarka Chudziana (kod na GitHub). Wszystkie osoby, które przesłały choinki otrzymają SERowe notesy!

Na koniec roku, jak co roku, przygotowujemy głosowanie na najgorszą infografikę. Mam już kilka niesamowitych kandydatur, ale jeżeli trafiliście na coś wyjątkowo zaciemniającego dane, przekłamującego, zniekształcającego liczby lub po prosty zabawnego to podeślijcie.

Pieczara Pietraszki pod choinkę

Od wczoraj ,,Pieczara Pietraszki” jest dostępna w szerokiej dystrybucji, co oznacza, że można ją kupić w księgarni PWN lub innych internetowych księgarniach.
Czas wysyłki to 24h, więc można jeszcze ją dostać pod choinkę!

,,Pieczara Pietraszki” to opowiadanie z serii Beta i Bit. Dwójka pozytywnych bohaterów pakuje się w rozmaite przygody, z których mogą się wykaraskać dzięki swoim nietypowym zainteresowaniom: programowaniu, matematyce i statystyce. Obok wersji papierowej, można skorzystać również z ebooka lub strony www.
Opowiadanie ,,Pieczara Pietraszki” jest skierowane głównie do dzieci i młodzieży z późnej podstawówki / gimnazjum, ale może się spodobać również kilkukrotnie starszym osobom.

W serii B&B obok opowiadań są też gry, np. gra w konsoli R ,,Włam na Proton”. Już wkrótce w serii kolejne opowiadania i kolejne gry.

Celem tego przedsięwzięcia jest pokazanie młodym ludziom jak ciekawym zawodem jest badacz danych. Chcemy inspirować dzieci i młodzież tematem analizy danych.

Projekt opowiadań z Betą i Bitem jest częściowo realizowany w ramach programu eNgage finansowanego przez FNP.

geom_christmas_tree(): a new geom for ggplot2 v2.0

iris2
Version 2.0 of the ggplot2 package (on GitHub) has a very nice mechanism for adding new geoms and stats (more about it here).
Christmas are coming, so maybe one would like to make his plots more tree’ish?
Below you will find a definition of geom_christmas_tree() geom. It supports following aesthetics: size (number of segments), fill, color, x and y.

With mpg data you can plot a colourful forest.

ggplot(mpg, aes(displ, hwy, fill=manufacturer)) + 
  geom_christmas_tree(size=2)

cars

Czytaj dalej geom_christmas_tree(): a new geom for ggplot2 v2.0

Hack the Proton. A data-crunching game from the Beta and Bit series

logo_eng
I’ve prepared a short console-based data-driven R game named ,,The Proton Game’’. The goal of a player is to infiltrate Slawomir Pietraszko’s account on a Proton server. To do this, you have to solve four data-based puzzles.

The game can be played by beginners as well as heavy users of R. Survey completed by people who completed the beta version of this game shows that the game gives around 15 minutes of fun to people experienced in R and up to around 60 minutes to people that just start programming and using R. More details about the results from beta-version are presented on the plot on the bottom.

PieczaraPieraszki

Czytaj dalej Hack the Proton. A data-crunching game from the Beta and Bit series

Czy dłużej żyją psy czy koty?

hugo

Jakiś czas temu do naszego stada dołączyła świnka morska o imieniu Hugo. Obecność zwierzaka w domu jest, jak się okazuje, świetnym pretekstem aby porozmawiać z dziećmi o losowości, dystrybuancie i ogólnie o rozkładach prawdopodobieństwa.
A zaczęło się to tak:

— Tato, ile lat żyją świnki morskie?
— Średnio od 5 do 7 lat (google).
— A czy inne zwierzęta domowe żyją krócej czy dłużej?
— Najkrócej żyją myszy, od roku do 3, gryzonie ogólnie żyją krótko, ale już takie papugi, potrafią żyć dwadzieścia, czterdzieści lat. A żółwie lądowe nawet 70 (wikipedia+ggplot2).

Czytaj dalej Czy dłużej żyją psy czy koty?