800px-2012_NAIAS_Red_Porsche_991_convertible_(world_premiere)
       Źródło: wikipedia

Wczoraj zakończył się RECOMB 2015, konferencja poświęcona obliczeniowej biologii molekularnej (z naciskiem na obliczeniowa). Było wiele ciekawych referatów, ale dzisiejszy wpis zainspirowała rozmowa, która przytrafiła mi się przy obiedzie.

Rozmawiając o zależnościach statystycznych, od słowa do słowa pojawiła się hipoteza, że najszybsze samochody to samochody czerwone (oczywiście nie chodzi o wpływ koloru na prędkość ale o połączone preferencje właścicieli dotyczące mocy i koloru). Wyraziłem swoją wątpliwość, której mój rozmówca nie przyjął. A jako ludzie wierzący w dane postanowiliśmy sprawę zbadać głębiej.

W pakiecie PogromcyDanych w zbiorze danych auta2012 dostępne są dane o 200 tys. ofertach sprzedaży aut z roku 2012. Dla większości ofert dostępne są informacje i o kolorze auta i o mocy silnika.

Hmmm, sprawdźmy więc jakiego koloru auta mają najsilniejsze silniki.

Read the rest of this entry »

SupER

Najbliższy SER już 23 kwietnia! Zaczynamy o 18:00 od prezentacji, „Data science deathmatch: R vs. Python”, którą przedstawi Filip Cyprowski. Druga prezentację rozpocznie Filip Stachura o 19:00, tytuł referatu to „Rozproszone obliczenia – SparkR”.

Pomiędzy prezentacjami zapraszamy na pizze i stymulujące rozmowy w kuluarach a o godzinie 20:00 zaczynamy afterparty w Kwadracie (http://www.kwadrat.waw.pl/) ul. Poznańska 7 lok. 8 (wejście od ul. Wilczej).

Serdecznie zapraszamy, udział w spotkaniu jest bezpłatny. Tak jak na poprzednich spotkaniach, aby oszacować ilość jedzenia oraz wielkość sali prosimy o wcześniejszą rezerwacje miejsca i rejestrację za pomocą formularza.

Na spotkanie można też się rejestrować przez stronę meetup.

Kontynuując spisywanie wrażeń z konferencji (patrz wpis sprzed kilku tygodni) dziś mamy gościnny wpis Bartosza Czapiewskiego ze SkuteczneRaporty.pl zbierający wrażenia z konferencji DATA+ organizowanej niedawno przez ComputerWorld.


Big Data + Biznes + Wizualizacja + („travel scientist” * krowa) – czego dowiedzieliśmy się na konferencji DATA+?
Bartosz Czapiewski

(ilustracje przedstawione poniżej pochodzą z prezentacji prezentowanych podczas konferencji DATA+)

W dniach 3-4 marca 2015 r. odbyła się w Warszawie polska edycja konferencji DATA+ poświęconej tematom związanym z big data i analityką biznesową, której organizatorem był ComputerWorld. Pierwszego dnia uczestnicy brali udział w prelekcjach, drugi dzień spędzili biorąc udział w praktycznych warsztatach.

Read the rest of this entry »

PAZUR w Poznaniu

9 kwi
2015

pazur
Dziś kilka słów od Macieja Beresewicza w sprawie planowanego na jutro PAZURa w Poznaniu.


Maciej Beresewicz

SKN Estymator, Katedra Statystyki UEP oraz Katedra Metod Matematycznych i Statystycznych UP serdecznie zaprasza na kolejne spotkanie użytkowników R w Poznaniu, które odbędzie się 10 kwietnia (piątek). Zaplanowaliśmy dla Państwa dwa wystąpienia przygotowane przez pracowników Wydziału Matematyki i Informatyki, Uniwersytetu im. Adama Mickiewicza w Poznaniu. Natomiast kolejne spotkanie zaplanowaliśmy na 24 kwietnia.

Read the rest of this entry »

Przed chwilą ruszył pierwszy kurs z serii Pogromcy Danych.

Dostęp przez stronę http://pogromcydanych.icm.edu.pl/, można logować się kontem na gmailu, facebooku lub na moodlu.

Przed chwilą mieliśmy 1730 osób zgłoszonych uczestników. Liczba ta ciągle rośnie, ale już teraz jest to olbrzymia, mam nadzieję że uda się udźwignąć to zainteresowanie. Około południa zaczniemy rozsyłać maila z przypomnieniami o starcie kursu z oficjalnego emaila pogromcydanych@icm.edu.pl.

pogRomcy danych-plakat-WWW2

coll1r kopia skompresowany dla drupal

Dziś mamy przyjemność poinformować o bardzo ciekawej inicjatywie lubelskiego koła naukowego Palimpsest. Poniżej kilka słów od nich wraz z zaproszeniem na ciekawą konferencję.

Studenckie Koło Informacji Naukowej „Palimpsest” z Uniwersytetu Marii Curie-Skłodowskiej w Lublinie organizuje ogólnopolską konferencję naukową poświęconą problematyce sposobów prezentowania informacji oraz bieżących trendów w tym zakresie. Konferencja odbędzie się 10 kwietnia 2015 roku w godzinach od 9 do 16 w Sali Obrad Rady Wydziału Humanistycznego.

Więcej informacji można znaleźć pod adresami: http://www.palimpsest.umcs.lublin.pl/ i https://www.facebook.com/events/1536259543310858/.

Referenci poruszą zagadnienia związane z estetyką informacji w następujących obszarach tematycznych:

Read the rest of this entry »

W ostatnich dniach od trzech osób (dziękuję Krzysztofowi T., Maciejowi B. i Markowi S.) dostałem link do artykułu ,,prezentującego” liczby zebranych głosów przez kandydatów na prezydenta (źródło gazeta.pl).

Sugeruję przyjrzenie się wykresom z tego artykułu połączone z próbą odnalezienia przynajmniej trzech problemów z prezentacją.

Read the rest of this entry »

Screen Shot 2015-03-26 at 09.19.24

Dwa tygodnie temu pisaliśmy o tym jak z bazy danych o filmach IMDB pobierać dane pakietem rvest. Tydzień temu pokazaliśmy aplikację wytworzoną z pakietem shiny, pozwalającą na porównanie ocen dwóch różnych grup użytkowników. Dzisiaj ostatni odcinek z cyklu IMDB, pokażemy jak używając pakietu ggvis przygotować grafikę, która pojawia się w aplikacji shiny.

Pakiet ggvis wciąż ma mniejszą siłę ekspresji niż jego starszy brat ggplot2. Ale gdy przychodzi do prezentacji danych na stronie internetowej ggvis wygląda po prostu świetnie.

Read the rest of this entry »

W tym roku, podobnie jak i w poprzednim, Fundacja SmarterPoland.pl wspiera rzeczowo i duchowo inicjatywę z Politechniki Wrocławskiej:
V Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych (NOMAD).

W związku z tym kilka zdań od organizatorów tych mistrzostw.

Read the rest of this entry »

Tydzień temu pisałem o pakiecie rvest i o tym jak z jego pomocą pobrać dane o ocenach seriali w zależności od wieku i płci oceniającego.

Dzisiaj kontynuujemy temat. Poniżej można pobawić się aplikacją pozwalającą na porównanie ocen serialów w zależności od tego czy kto ocenia (wiek i płeć oceniającego). Są takie seriale, które wszyscy oceniają wysoko / nisko, a są też takie, które jedni oceniają wysoko a inni nie.

Ciekawe różnice wychodzą gdy się zestawi najmłodszą i najstarszą grupę wiekową lub płcie.

Read the rest of this entry »

top