Konkurs na najgorszą grafikę 2015

Zbliża się koniec roku, czas na wybór najgorszej grafiki tego roku. Trzeba przyznać, że laureaci konkursów z poprzedniego roku, sprzed dwóch lat czy sprzed trzech lat stawiają poprzeczkę dosyć wysoko. Ale i w tym roku nie brakuje znakomitych kandydatów.

Zasada jest prosta. Wybieramy wykres, który otrzyma tytuł ,,Zniekształcenie roku 2015”. A więc grafikę najbardziej zniekształcającą przekazywane dane. Na końcu wpisu znajduje się sonda. Głosować można na więcej niż jeden wykres. Aby ułatwić głosowanie, każdy kandydat ma skrótową nazwę.

Rok 2015 był rokiem wyborów (Prezydent, Sejm, Senat), połowa z poniższych zgłoszeń ma jakiś związek z wyborami. Zanim zaczniemy ich prezentację chciałbym zaznaczyć, że pojedyncze wpadki (jak prezentowane poniżej) nie są dowodem stronniczości tego czy innego medium (nie są też dowodem braku stronniczości). Nie ma co więc wysuwać zbyt ogólnych wniosków o mediach, skupmy się na wykresach.

Niech zwycięży najlepszy!

Czytaj dalej Konkurs na najgorszą grafikę 2015

Choinka a SER

ctree

Grudniowy SER był bardzo techniczny i bardzo udany. Prezentacje obu prelegentów można pobrać z GitHuba. Kornel miał kilka animowanych gifów i te będą działały tylko pod Keynote, pdf jest statyczny.

Choinka otwierająca ten wpis została przygotowana w GGplocie przez Czarka Chudziana (kod na GitHub). Wszystkie osoby, które przesłały choinki otrzymają SERowe notesy!

Na koniec roku, jak co roku, przygotowujemy głosowanie na najgorszą infografikę. Mam już kilka niesamowitych kandydatur, ale jeżeli trafiliście na coś wyjątkowo zaciemniającego dane, przekłamującego, zniekształcającego liczby lub po prosty zabawnego to podeślijcie.

Global Innovation Index 2015


W ostatnim numerze Polityki znalazłem odniesienie do rankingu The Global Innovation Index 2015 z jakimś takim smutnym tytułem ,,Polska na szarym końcu Rankingu Innowacyjności 2015”. Czy to jesienna chandra, czy też jest coś na rzeczy? Zobaczmy.

Problem z rankingami mam taki, że często agregują wiele składowych w jeden indeks, który bardzo trudno zinterpretować. Wspomniany indeks innowacyjności to podsumowanie trzypoziomowej hierarchii składowych. Takich jak np. 7.3.4 Liczba wgrań filmów na YouTube lub 4.1.1 Łatwość w otrzymywaniu kredytów lub 1.3.3 Łatwość płacenia podatków. A więc parametry z zupełnie innych światów.

Drugi problem to częsty brak konstruktywnych wniosków w komentarzach. Jeżeli jesteśmy wysoko, komentujący szukają jakich kosmicznych uzasadnień, jeżeli jesteśmy nisko, to użalamy się. Bez sensu. A przecież, jeżeli taki ranking agreguje wiele obszarów, możemy wykorzystać go, aby sprawdzić co jest naszą silną składową, a co jest słabą składową.

Aby ułatwić analizę naszych silnych i słabych stron, na tle innych krajów, przygotowałem poniższą aplikację, pokazującą pozycję w rankingu w 7 głównych podobszarach (w ww. artykule Polityki znajdują się charakterystyki tych podobszarów).

Założę się, że nie zgadniecie co, zgodnie z tym rankingiem, jest najsilniejszą stroną Polski.

Czytaj dalej Global Innovation Index 2015

Pieczara Pietraszki pod choinkę

Od wczoraj ,,Pieczara Pietraszki” jest dostępna w szerokiej dystrybucji, co oznacza, że można ją kupić w księgarni PWN lub innych internetowych księgarniach.
Czas wysyłki to 24h, więc można jeszcze ją dostać pod choinkę!

,,Pieczara Pietraszki” to opowiadanie z serii Beta i Bit. Dwójka pozytywnych bohaterów pakuje się w rozmaite przygody, z których mogą się wykaraskać dzięki swoim nietypowym zainteresowaniom: programowaniu, matematyce i statystyce. Obok wersji papierowej, można skorzystać również z ebooka lub strony www.
Opowiadanie ,,Pieczara Pietraszki” jest skierowane głównie do dzieci i młodzieży z późnej podstawówki / gimnazjum, ale może się spodobać również kilkukrotnie starszym osobom.

W serii B&B obok opowiadań są też gry, np. gra w konsoli R ,,Włam na Proton”. Już wkrótce w serii kolejne opowiadania i kolejne gry.

Celem tego przedsięwzięcia jest pokazanie młodym ludziom jak ciekawym zawodem jest badacz danych. Chcemy inspirować dzieci i młodzież tematem analizy danych.

Projekt opowiadań z Betą i Bitem jest częściowo realizowany w ramach programu eNgage finansowanego przez FNP.

geom_christmas_tree(): a new geom for ggplot2 v2.0

iris2
Version 2.0 of the ggplot2 package (on GitHub) has a very nice mechanism for adding new geoms and stats (more about it here).
Christmas are coming, so maybe one would like to make his plots more tree’ish?
Below you will find a definition of geom_christmas_tree() geom. It supports following aesthetics: size (number of segments), fill, color, x and y.

With mpg data you can plot a colourful forest.

ggplot(mpg, aes(displ, hwy, fill=manufacturer)) + 
  geom_christmas_tree(size=2)

cars

Czytaj dalej geom_christmas_tree(): a new geom for ggplot2 v2.0

[R + finanse]: Jak wczytywać i prezentować dane giełdowe? (1)

Dziś na blogu gościnny wpis przygotowany przez Marcina Piterę. Jest to mam nadzieję, że pierwszy z serii wpisów opisujących przystępnie interesujące zagadnienia związane z analizą danych. W tym przypadku finansowych.

Marcin Pitera

Cześć! W najbliższym czasie przedstawię wam serię wpisów, które pokażą, jak używać R w w kontekście danych finansowych, matematyki finansowej, czy analizy ilościowej. Zajmiemy się na przykład obróbką danych finansowych, optymalizacją portfelową, czy modelami GARCH. W tym wpisie zaczniemy od podstaw, czyli importu oraz prezentacji najczęściej obrabianych danych finansowych, tzn. danych i wykresów typu OHLC (Open-High-Low-Close).

Czytaj dalej [R + finanse]: Jak wczytywać i prezentować dane giełdowe? (1)

SupER notes za (pod?) choinkę


Zbliżają się święta, czas pomyśleć o choince.
A że za trzy dni kolejny SER, więc ogłaszamy konkurs na SupERową choinkę!
(dla inspiracji: rok temu na blogu pokazywaliśmy jak zrobić choinkę w shiny)

Zasady są proste.
Trzeba wysłać do poniedziałku 21 grudnia (tydzień czasu, można wysyłać do końca dnia) choinkę wykonaną w R.
Zresztą, bądźmy otwarci. Choinka może nawet nie być zrobiona w samym R, ale w excelu, scali, pythonie, matlabie lub innym języku, który jest w stanie komunikować się z R.

Może być to tekstowa choinka wypisana na konsoli, może być to graficzna ggchoinka, może być interaktywna, może być to choinka abstrakcyjna, taka jakie znaleźć można na accidental aRt.

Kod choinki (w R lub innym języku) i jej zdjęcie (może być screenshot konsoli lub okienka graficznego) należy wysłać na adres przemyslaw.biecek(at)gmail.com (w tytule proszę wpisać słowo 'Choinka’).

Twórcy najciekawszych choinek otrzymają pod choinkę SupER notesy (100 kartek w linię).

Czy Internet pozwala przewidzieć wyniki wyborów?


Dziś mamy gościnny wpis poświęcony analizie danych wyborczych a na wtorek mamy zaplanowany gościnny wpis poświęcony analizie danych finansowych.

Dzisiejszy wpis przygotował dr Albert Hupa z IRCenter i są do niego dołączone dane z sondaży wyborczych, z Google Trends, z wypowiedzi na mediach społecznościowych, oraz badania CAWI wśród internautów. Dane z różnych źródeł, można trochę się nimi pobawić by zobaczyć czy i jakie są zależności pomiędzy sondażami, dyskusjami w internecie a końcowym wynikiem wyborów.

dr Albert Hupa, prezes IRCenter

Czy Internet pozwala przewidzieć wyniki wyborów?
Nie. To będzie możliwe dopiero wtedy, kiedy wszyscy dorośli Polacy zaczną korzystać z internetu i będą tam interesować się polityką. Jednak Internet pozwala zrozumieć trendy w zainteresowaniach młodszych i/lub bardziej zaangażowanych wyborców. Na dłuższą metę nie chodzi o to, żeby po prostu przewidywać wyniki i mniej płacić za sondaże, tylko o to, żeby móc wpływać na rzeczywistość. IRCenter publikuje dane dla ostatnich Wyborów Parlamentarnych i kilka wniosków z ich analizy.

Czytaj dalej Czy Internet pozwala przewidzieć wyniki wyborów?

GeCONiI – jak budować pakiety, reprodukowalne raporty i aplikacje webowe w R


W poprzednim tygodniu miałem przyjemność prowadzić szkolenie dotyczące różnych ciekawych inżynierskich aspektów programowania w R. Szkolenie było prowadzone dla Akademii GeCONiI na Politechnice Śląskiej.
Dzięki uprzejmości organizatorów mogę podzielić się materiałami ze szkolenia.

Całość jest dostępna na stronie GitHub a poszczególne tematy można znaleźć pod poniższymi linkami

* Budowa pakietów z użyciem devtools
* Odtwarzalne obliczenia, czyli pakiet knitr i archivist
* Jak budować aplikacje webowe, czyli słów kilka o shiny
* Debugowanie i profilowanie kodu R
* Budowa serwisów opartych o pakiet opencpu

Eseje i SERy

Dzisiejszy wpis to cztery splatające się wątki.

Nie ma brzydkich danych – są tylko źle ubrane

Kilkanaście osób wzięło udział w ogłoszonym w zeszłym tygodniu konkursie na hasło reklamujące Eseje. Dwa hasła, które najbardziej przypadły mi do gustu, to ,,Nie ma brzydkich danych – są tylko źle ubrane” i ,,Kto czyta eseje, Ten wody nie leje”. Dziękuję Mateuszowi Pawłowskiemu, Michałowi Lewickiemu oraz autorom pozostałych haseł za świetne propozycje.

Information is beautiful

Na blogu Information is beautiful http://www.informationisbeautiful.net/2015/information-is-beautiful-awards-winners-2015/ przedstawiono wyniki konkursu na najlepszą grafikę z 2015 roku (kilka kategorii, statyczna, interaktywna, zespołowa, czasopismo).
Wiele z zaprezentowanych tam grafik robi olbrzymie wrażenie.
Warto zobaczyć.

SER XIII

Niedawno odbyło się trzynaste spotkanie Entuzjastów R i analizy danych SER + Ubezpieczenia/ SER + Insurance.
Zdjęcia z wydarzenia są na stronie meetup a prezentacje i slajdy na stronie GitHub.
To było jak dotąd nasze największe spotkanie, ale wszystko przed nami.

SER XIV – Modele i Allegro – 17 XII 2015

Na 17 grudnia planujemy jeszcze jedno spotkanie SER. Też tematyczne, tym razem z udziałem prelegentów z Allegro. Będzie można dowiedzieć się jak wygląda infrastruktura i jak wygląda budowa modeli w Allegro oraz jakie problemy są tam rozwiązywane. Obok R będzie można posłuchać o Scala i Spark. Prelegentami będą Paweł Zawistowski i Kornel Kiełczewski, a więcej informacji o prelegentach i tematach na stronie meetup
http://www.meetup.com/Spotkania-Entuzjastow-R-Warsaw-R-Users-Group-Meetup/events/226969517/.

Do zobaczenia!