RBioMeSs + Show me Shiny, czyli ostatnie dwa SERy w 2016


Jutro (czwartek 24 listopada) o 18 w budynku MiNI PW (Koszykowa 75, Warszawa) rozpocznie się XXI Spotkanie Entuzjastów R. Tym razem poświęcony zastosowaniom R, statystyki i informatyki do analizy danych genetycznych i medycznych.

Pierwszym prelegentem będzie Dariusz Ratman z Roche. Tytuł jego prezentacji to: Automating gene expression analysis and visualisation with R/Bioconductor: bringing genomics results to scientists

Drugą prezentację poprowadzą Alicja Szabelska-Beręsewicz, i Joanna Zyprych-Walczak.
Temat: Dyskusja biologa ze statystykiem w towarzystwie R – czyli jak znaleźć przydatne informacje w bezmiarze danych biologicznych.

Czytaj dalej RBioMeSs + Show me Shiny, czyli ostatnie dwa SERy w 2016

RBioMeSs – R, uczenie maszynowe, statystyka medyczna i bioinformatyka

masterR

TL;DR: 24 listopada, w ramach Spotkań Entuzjastów R, odbędzie się spotkanie poświęcone R, bioinformatyce i statystyce medycznej. Więcej informacji tutaj.

LV:
Rozmawiałem ostatnio ze znajomym o ciekawych wyzwaniach związanych z analizą dużych danych. Zaczęło się od wyników w obszarze sieci konwolucyjnych i deep learningu ale zbaczaliśmy na różne tematy gdzie dane są niemałe a wyzwania być może i większe.
Gdy myśleć o klasyfikacji obrazów o rozmiarach 64×64 piksele (4096 piksle) to o ileż bardziej złożona jest predykcja losów pacjenta na bazie ekspresji dla 20 tysięcy genów czy informacji o stanie mutacji/metylacji dla milionów sond (miliony markerów dla każdego pacjenta! to już jest wysokowymiarowa przestrzeń).

Czytaj dalej RBioMeSs – R, uczenie maszynowe, statystyka medyczna i bioinformatyka

eRum i SER

Pierwsza Europejska konferencja użytkowników R (2016) już za nami.

Konferencja była fantastycznie zorganizowana (kudos to Maciej Beręsewicz i cały komitet organizacyjny). Było bardzo dużo ciekawych prezentacji i bardzo bardzo dużo ciekawych ludzi. Bardzo różnorodne środowisko, zarówno biznes jak i akademia, weterani (przyjechał nawet Rob Hyndman z Australii) jak i studenci.
Atmosfera jak z najlepszych edycji useR’ów.

Prezentacje są dostępne na GitHubie. Jest ich naprawdę dużo (i pewnie będą spływać kolejne).
Aby zorientować się od czego zacząć, można zapoznać się z książką abstraktów.

Trochę zdjęć i wrażeń z konferencji można odczytać z twittera.

Z wydarzeń europejskich wracamy do Warszawy.
W przyszłym tygodniu w Warszawie mamy kolejną edycję SERów.
Tym razem w ramach RLadies warsztaty z R.
W sumie 7 grup, cztery wprowadzające do R i trzy poświęcone wizualizacji.
Warsztaty wprowadzające poprowadzą: Agnieszka Tomczyk, Marcin Kosiński, Olga Mierzwa-Sulima, Natalia Potocka.
Warsztaty z ggplot2 poprowadzą: Katarzyna Sobiczewska, Marta Sommer, Przemysław Biecek.

W mojej grupie warsztatowej planuję wykorzystać dane o popularności odcinków seriali telewizyjnych zebranych z portalu IMDB. Ale jeżeli macie pomysł na inne ciekawe dane to dajcie znać.

A już za miesiąc w ramach SERów planujemy spotkanie tematyczne ‘Bio+R‘. Szczególnie zapraszamy osoby zainteresowane biostatystyką i bioinformatyką. Będą przedstawiciele różnych firm, będą ludzie z uczelni, będzie można dowiedzieć się co ciekawego i gdzie można robić z danymi genetycznymi.

Jutro SER a dzisiaj trendy na rynku pracy dla Data Scientistów

Jutro o godzinie 18 na MiNI (Koszykowa 75, Warszawa) zaczynamy 18. (o matko, już osiemnastka!) Spotkania Entuzjastów R. Będzie i o programowaniu z Rcpp i o analizie danych. Można zarejestrować się tutaj.
Zapraszamy!

Współorganizatorka SERów, Olga Mierzwa, miała wczoraj prezentację o rynku pracy dla Data Scientistów. Poniżej kilka zdań od Olgi.

Screen Shot 2016-05-18 at 18.56.29


Olga Mierzwa

Wczoraj odbyło się 15 spotkanie Data Science Warsaw, podczas którego miałam przyjemność opowiadać o trendach na rynku pracy data science na podstawie doświadczeń z współprowadzenia datahero.tech. Na meetup przyszło ok. 80 osób, a oprócz mnie o komunikowaniu danych opowiadali Piotr Arak z Polityka Insight i Vadim Makarenko z BiqData.
Prezentacja “Trendy rynku pracy Data Science” przedstawiała sytuację na rynku pracy w Polsce w oparciu o analizy pracuj.pl i datahero.tech. Pokazała przykładowe informacje jakie można wyciągnąć analizując GitHuba, Stackoverflow oraz Upwork.

Czy jesteś ciekaw jakie funkcje i pakiety R wykorzystują polscy użytkownicy GitHuba?
O co najczęściej pytają użytkownicy na Stackoverflow pracując w R i Pythonie? A co jest już passé?
A może ile zarabia Data Science Freelancer w Polsce czy na świecie?

Prezentacja dostępna jest pod linkiem: http://slides.com/olgamierzwa/deck-1.

Podziękowania dla Grupy MI2 za udostępnienie analiz pracuj.pl.

16-17 maRca pełne eRa. Meetupy w Warszawie, Poznaniu i Krakowie


Tak się ciekawie złożyło, że w przyszłym tygodniu mamy trzy eRowe imprezy.

16 marca o 18.00 w Krakowie odbędzie się #7 Spotkanie Entuzjastów R w Krakowie eRka,
17 marca o 18.00 w Warszawie odbędzie się SER 16 – 90 min z caret, nnet i Google Analytics,
i też 17 marca o 18.00 ale w Poznaniu odbędzie się PAZUR 15 – Tableau + R, PowerBI + R.

Czytaj dalej 16-17 maRca pełne eRa. Meetupy w Warszawie, Poznaniu i Krakowie

SER XV – duuuużo R + elastic i pivotTable

W czwartek o godzinie 18, na MINI PW (Warszawa Koszykowa 75 sala 329), zaczynamy piętnasty SER. Tym razem mamy dwóch prelegentów z Wirtualnej Polski.
Dostałem informację, że przed przerwą zimową (w lutym SERa nie będzie) mają zamiar pokazać nam bardzo dużo eRa na żywo.

Na spotkanie można się zapisać przez stronę meetup (na obecną chwilę jest 599 Entuzjastów R, jest więc szansa na bycie sześćsetnym entuzjastą).

Czytaj dalej SER XV – duuuużo R + elastic i pivotTable

Eseje i SERy

Dzisiejszy wpis to cztery splatające się wątki.

Nie ma brzydkich danych – są tylko źle ubrane

Kilkanaście osób wzięło udział w ogłoszonym w zeszłym tygodniu konkursie na hasło reklamujące Eseje. Dwa hasła, które najbardziej przypadły mi do gustu, to ,,Nie ma brzydkich danych – są tylko źle ubrane” i ,,Kto czyta eseje, Ten wody nie leje”. Dziękuję Mateuszowi Pawłowskiemu, Michałowi Lewickiemu oraz autorom pozostałych haseł za świetne propozycje.

Information is beautiful

Na blogu Information is beautiful http://www.informationisbeautiful.net/2015/information-is-beautiful-awards-winners-2015/ przedstawiono wyniki konkursu na najlepszą grafikę z 2015 roku (kilka kategorii, statyczna, interaktywna, zespołowa, czasopismo).
Wiele z zaprezentowanych tam grafik robi olbrzymie wrażenie.
Warto zobaczyć.

SER XIII

Niedawno odbyło się trzynaste spotkanie Entuzjastów R i analizy danych SER + Ubezpieczenia/ SER + Insurance.
Zdjęcia z wydarzenia są na stronie meetup a prezentacje i slajdy na stronie GitHub.
To było jak dotąd nasze największe spotkanie, ale wszystko przed nami.

SER XIV – Modele i Allegro – 17 XII 2015

Na 17 grudnia planujemy jeszcze jedno spotkanie SER. Też tematyczne, tym razem z udziałem prelegentów z Allegro. Będzie można dowiedzieć się jak wygląda infrastruktura i jak wygląda budowa modeli w Allegro oraz jakie problemy są tam rozwiązywane. Obok R będzie można posłuchać o Scala i Spark. Prelegentami będą Paweł Zawistowski i Kornel Kiełczewski, a więcej informacji o prelegentach i tematach na stronie meetup
http://www.meetup.com/Spotkania-Entuzjastow-R-Warsaw-R-Users-Group-Meetup/events/226969517/.

Do zobaczenia!

Czy jesteś hakeRem danych?

IMG_20151113_140015 (1)
Przygotowałem gRę inspirowaną opowiadaniem Pieczara Pietraszki. Gracz wczuwa się w Bita, który szuka hasła Pietraszki na serwerze Proton (aby później …, co jest dalej, przeczytać można w opowiadaniu).
Aby zdobyć hasło trzeba rozwiązać cztery zagadki oparte o analizę danych.
Poziom zagadek określiłbym jako niebanalny ;-). Nawet dla osób, które już sporo programują.

Aby zagrać w tę gRę należy wykonać dwa kroki.
1. Zainstalować pakiet proton w R.

Czytaj dalej Czy jesteś hakeRem danych?

Warsaw Meetings of R Users / Warszawskie Spotkania Entuzjastów R

highres_437369023

With the summer holiday season coming to an end, we are back with Warsaw Meetings of R Users (Warszawskie Spotkania Entuzjastów R).

Three meetings ahead:

  • September 26 th (this Saturday) – let’s start with data-hack-day (DHD). Having data from Polish Seym (votes and transcripts), we are going to prepare some nice summaries of last cadency. Elections ahead, it is a good time for such statistics. MaszPrawoWiedzieć will support us in this effort. Be prepared for a lot of data cleaning and nice data exploration.
  • October 22 nd (Thursday), we will be talking about R and education. Two excellent speakers in the roster: Adolfo Álvarez (Advanced Customer Analyst at Analyx) and dr hab. Michał Ramsza (SGH).
  • November 26 th (Thursday). Topic for this meeting is ,,R in insurance’’. One of our special guest: Markus Gesmann (Lloyd’s, London). More to come.

You will find more information on our meetup page: http://www.meetup.com/Spotkania-Entuzjastow-R-Warsaw-R-Users-Group-Meetup/.

Thanks go to our partners and sponsors: Revolution Analytix/Microsoft, MINI PW, WLOG Solutions and SmarterPoland.

SER X + warsztaty + zdobądź koszulkę

Za dwa dni, w czwartek, o godzinie 18 rozpocznie się ostatni w tym roku akademickim SER X (strona meetup). Godzinę później rozpoczną się warsztaty z przetwarzania i prezentowania danych (będą one kontynuowane w sobotę). Miejsca na warsztatach dosyć szybko się pokończyły, pozostały już tylko na rlp (R package using the Literate Programming). Wydarzenie jest organizowane wspólnie ze studenckim Kołem Naukowym Data Science.

Czytaj dalej SER X + warsztaty + zdobądź koszulkę