To już 5 lat! Gość specjalny na najbliższym SERze opowie o wyjaśnialnym ML

W najbliższy czwartek o godzinie 18:00 startujemy z 38. spotkaniem Entuzjastów R.
Aż trudno uwierzyć, że minęło już 5 lat od naszego pierwszego spotkania w ICMie. Przez te 5 lat gościliśmy ponad 70 prelegentów, często osoby, które znaliśmy z ciekawych blogów, pakietów czy książek. Większość prelegentów pracuje w Warszawie, ale też byli ciekawi goście z innych miast, krajów czy nawet spoza Europy. Społeczność sympatyków na meetupie przekroczyła niedawno 2000 osób. W kontynentalnej Europie większa jest tylko grupa użytkowników R w Madrycie (niewiele większa, więc kto wie).

Na najbliższym – jubileuszowym – spotkaniu będziemy gościć profesora Marko Robnik-Šikonja z uniwersytetu w Ljubljanie. Autor kilkudziesięciu znanych prac naukowych z obszaru uczenia maszynowego, autor pakietu ExplainPrediction dla programu R. Na SERze opowie o technikach permutacyjnego wyjaśniania złożonych modeli, w szczególności EXPLAIN, IME, LIME czy SHAP.
Super gorący temat opowiedziany przez światowej sławy specjalistę.
Czegóż chcieć więcej na urodziny?

Ach oczywiście.
Będzie też tort!

Zapraszamy wszystkich sympatyków R, SERów czy wyjaśnialnego uczenia maszynowego. Spotykamy się w sali 107 na wydziale MiNI PW (Koszykowa 75, Warszawa).
Najlepiej zaznaczyć obecność przez stronę na meetupe, ułatwi nam to planowanie wielkości tortu. Do zobaczenia!

histoRia R w Polsce @ tRzecie uRodziny SERa

histoRia
Najbliższe Spotkanie Entuzjastów R (9 marca 2017) będzie wyjątkowe. Świętujemy trzecie urodziny SERów i z tej okazji będzie kilka niespodzianek. Zamiast pizzy będą bąbelki i coś słodkiego, zamiast przerwy zrobimy sesje tematycznych okrągłych stolików aby spokojnie porozmawiać z innymi entuzjastami R, a zamiast referatu o tym co aktualnie dzieje się w R będzie referat o przeszłości, o tym jak wyglądały początki R w Polsce.

Mam poprowadzić ten referat, ale przecież nie znam całej historii R.
Mam więc wielką prośbę do Was!
Pomóżcie mi uzupełnić informacje o tym jak wyglądały początki R w Polsce. Kiedy jakie przedmioty pojawiły się na których uczelniach, kiedy w firmach pojawiły się duże i ciekawe rozwiązania/wdrożenia oparte o R, kiedy miały miejsca ciekawe spotkania związane z R. Kiedy działy się ciekawe rzeczy związane z R, co to były za rzeczy i kto je organizował.

Założyłem na GitHubie stronę do której można dodawać interesujące ciekawostki związane z historią R (https://github.com/mi2-warsaw/SER/blob/master/histoRia/README.md).
Jeżeli wiecie o aktywności, która powinna się w tym zestawieniu znaleźć, proszę dopiszcie, albo przez nowe issue, albo nowy pull request albo przez wysłanie mi emaila na adres przemyslaw.biecek na serwerze gmail.
Mogą to być wydarzenia z już wymienionych typów a mogą to być całkowicie nowe rzeczy.

Dziękuję i do zobaczenia na SERze!

RBioMeSs + Show me Shiny, czyli ostatnie dwa SERy w 2016


Jutro (czwartek 24 listopada) o 18 w budynku MiNI PW (Koszykowa 75, Warszawa) rozpocznie się XXI Spotkanie Entuzjastów R. Tym razem poświęcony zastosowaniom R, statystyki i informatyki do analizy danych genetycznych i medycznych.

Pierwszym prelegentem będzie Dariusz Ratman z Roche. Tytuł jego prezentacji to: Automating gene expression analysis and visualisation with R/Bioconductor: bringing genomics results to scientists

Drugą prezentację poprowadzą Alicja Szabelska-Beręsewicz, i Joanna Zyprych-Walczak.
Temat: Dyskusja biologa ze statystykiem w towarzystwie R – czyli jak znaleźć przydatne informacje w bezmiarze danych biologicznych.

Czytaj dalej RBioMeSs + Show me Shiny, czyli ostatnie dwa SERy w 2016

RBioMeSs – R, uczenie maszynowe, statystyka medyczna i bioinformatyka

masterR

TL;DR: 24 listopada, w ramach Spotkań Entuzjastów R, odbędzie się spotkanie poświęcone R, bioinformatyce i statystyce medycznej. Więcej informacji tutaj.

LV:
Rozmawiałem ostatnio ze znajomym o ciekawych wyzwaniach związanych z analizą dużych danych. Zaczęło się od wyników w obszarze sieci konwolucyjnych i deep learningu ale zbaczaliśmy na różne tematy gdzie dane są niemałe a wyzwania być może i większe.
Gdy myśleć o klasyfikacji obrazów o rozmiarach 64×64 piksele (4096 piksle) to o ileż bardziej złożona jest predykcja losów pacjenta na bazie ekspresji dla 20 tysięcy genów czy informacji o stanie mutacji/metylacji dla milionów sond (miliony markerów dla każdego pacjenta! to już jest wysokowymiarowa przestrzeń).

Czytaj dalej RBioMeSs – R, uczenie maszynowe, statystyka medyczna i bioinformatyka

eRum i SER

Pierwsza Europejska konferencja użytkowników R (2016) już za nami.

Konferencja była fantastycznie zorganizowana (kudos to Maciej Beręsewicz i cały komitet organizacyjny). Było bardzo dużo ciekawych prezentacji i bardzo bardzo dużo ciekawych ludzi. Bardzo różnorodne środowisko, zarówno biznes jak i akademia, weterani (przyjechał nawet Rob Hyndman z Australii) jak i studenci.
Atmosfera jak z najlepszych edycji useR’ów.

Prezentacje są dostępne na GitHubie. Jest ich naprawdę dużo (i pewnie będą spływać kolejne).
Aby zorientować się od czego zacząć, można zapoznać się z książką abstraktów.

Trochę zdjęć i wrażeń z konferencji można odczytać z twittera.

Z wydarzeń europejskich wracamy do Warszawy.
W przyszłym tygodniu w Warszawie mamy kolejną edycję SERów.
Tym razem w ramach RLadies warsztaty z R.
W sumie 7 grup, cztery wprowadzające do R i trzy poświęcone wizualizacji.
Warsztaty wprowadzające poprowadzą: Agnieszka Tomczyk, Marcin Kosiński, Olga Mierzwa-Sulima, Natalia Potocka.
Warsztaty z ggplot2 poprowadzą: Katarzyna Sobiczewska, Marta Sommer, Przemysław Biecek.

W mojej grupie warsztatowej planuję wykorzystać dane o popularności odcinków seriali telewizyjnych zebranych z portalu IMDB. Ale jeżeli macie pomysł na inne ciekawe dane to dajcie znać.

A już za miesiąc w ramach SERów planujemy spotkanie tematyczne ’Bio+R’. Szczególnie zapraszamy osoby zainteresowane biostatystyką i bioinformatyką. Będą przedstawiciele różnych firm, będą ludzie z uczelni, będzie można dowiedzieć się co ciekawego i gdzie można robić z danymi genetycznymi.

Jutro SER a dzisiaj trendy na rynku pracy dla Data Scientistów

Jutro o godzinie 18 na MiNI (Koszykowa 75, Warszawa) zaczynamy 18. (o matko, już osiemnastka!) Spotkania Entuzjastów R. Będzie i o programowaniu z Rcpp i o analizie danych. Można zarejestrować się tutaj.
Zapraszamy!

Współorganizatorka SERów, Olga Mierzwa, miała wczoraj prezentację o rynku pracy dla Data Scientistów. Poniżej kilka zdań od Olgi.

Screen Shot 2016-05-18 at 18.56.29


Olga Mierzwa

Wczoraj odbyło się 15 spotkanie Data Science Warsaw, podczas którego miałam przyjemność opowiadać o trendach na rynku pracy data science na podstawie doświadczeń z współprowadzenia datahero.tech. Na meetup przyszło ok. 80 osób, a oprócz mnie o komunikowaniu danych opowiadali Piotr Arak z Polityka Insight i Vadim Makarenko z BiqData.
Prezentacja „Trendy rynku pracy Data Science” przedstawiała sytuację na rynku pracy w Polsce w oparciu o analizy pracuj.pl i datahero.tech. Pokazała przykładowe informacje jakie można wyciągnąć analizując GitHuba, Stackoverflow oraz Upwork.

Czy jesteś ciekaw jakie funkcje i pakiety R wykorzystują polscy użytkownicy GitHuba?
O co najczęściej pytają użytkownicy na Stackoverflow pracując w R i Pythonie? A co jest już passé?
A może ile zarabia Data Science Freelancer w Polsce czy na świecie?

Prezentacja dostępna jest pod linkiem: http://slides.com/olgamierzwa/deck-1.

Podziękowania dla Grupy MI2 za udostępnienie analiz pracuj.pl.

16-17 maRca pełne eRa. Meetupy w Warszawie, Poznaniu i Krakowie


Tak się ciekawie złożyło, że w przyszłym tygodniu mamy trzy eRowe imprezy.

16 marca o 18.00 w Krakowie odbędzie się #7 Spotkanie Entuzjastów R w Krakowie eRka,
17 marca o 18.00 w Warszawie odbędzie się SER 16 – 90 min z caret, nnet i Google Analytics,
i też 17 marca o 18.00 ale w Poznaniu odbędzie się PAZUR 15 – Tableau + R, PowerBI + R.

Czytaj dalej 16-17 maRca pełne eRa. Meetupy w Warszawie, Poznaniu i Krakowie

SER XV – duuuużo R + elastic i pivotTable

W czwartek o godzinie 18, na MINI PW (Warszawa Koszykowa 75 sala 329), zaczynamy piętnasty SER. Tym razem mamy dwóch prelegentów z Wirtualnej Polski.
Dostałem informację, że przed przerwą zimową (w lutym SERa nie będzie) mają zamiar pokazać nam bardzo dużo eRa na żywo.

Na spotkanie można się zapisać przez stronę meetup (na obecną chwilę jest 599 Entuzjastów R, jest więc szansa na bycie sześćsetnym entuzjastą).

Czytaj dalej SER XV – duuuużo R + elastic i pivotTable

Eseje i SERy

Dzisiejszy wpis to cztery splatające się wątki.

Nie ma brzydkich danych – są tylko źle ubrane

Kilkanaście osób wzięło udział w ogłoszonym w zeszłym tygodniu konkursie na hasło reklamujące Eseje. Dwa hasła, które najbardziej przypadły mi do gustu, to ,,Nie ma brzydkich danych – są tylko źle ubrane” i ,,Kto czyta eseje, Ten wody nie leje”. Dziękuję Mateuszowi Pawłowskiemu, Michałowi Lewickiemu oraz autorom pozostałych haseł za świetne propozycje.

Information is beautiful

Na blogu Information is beautiful http://www.informationisbeautiful.net/2015/information-is-beautiful-awards-winners-2015/ przedstawiono wyniki konkursu na najlepszą grafikę z 2015 roku (kilka kategorii, statyczna, interaktywna, zespołowa, czasopismo).
Wiele z zaprezentowanych tam grafik robi olbrzymie wrażenie.
Warto zobaczyć.

SER XIII

Niedawno odbyło się trzynaste spotkanie Entuzjastów R i analizy danych SER + Ubezpieczenia/ SER + Insurance.
Zdjęcia z wydarzenia są na stronie meetup a prezentacje i slajdy na stronie GitHub.
To było jak dotąd nasze największe spotkanie, ale wszystko przed nami.

SER XIV – Modele i Allegro – 17 XII 2015

Na 17 grudnia planujemy jeszcze jedno spotkanie SER. Też tematyczne, tym razem z udziałem prelegentów z Allegro. Będzie można dowiedzieć się jak wygląda infrastruktura i jak wygląda budowa modeli w Allegro oraz jakie problemy są tam rozwiązywane. Obok R będzie można posłuchać o Scala i Spark. Prelegentami będą Paweł Zawistowski i Kornel Kiełczewski, a więcej informacji o prelegentach i tematach na stronie meetup
http://www.meetup.com/Spotkania-Entuzjastow-R-Warsaw-R-Users-Group-Meetup/events/226969517/.

Do zobaczenia!

Czy jesteś hakeRem danych?

IMG_20151113_140015 (1)
Przygotowałem gRę inspirowaną opowiadaniem Pieczara Pietraszki. Gracz wczuwa się w Bita, który szuka hasła Pietraszki na serwerze Proton (aby później …, co jest dalej, przeczytać można w opowiadaniu).
Aby zdobyć hasło trzeba rozwiązać cztery zagadki oparte o analizę danych.
Poziom zagadek określiłbym jako niebanalny ;-). Nawet dla osób, które już sporo programują.

Aby zagrać w tę gRę należy wykonać dwa kroki.
1. Zainstalować pakiet proton w R.

Czytaj dalej Czy jesteś hakeRem danych?