SER XV – duuuużo R + elastic i pivotTable

W czwartek o godzinie 18, na MINI PW (Warszawa Koszykowa 75 sala 329), zaczynamy piętnasty SER. Tym razem mamy dwóch prelegentów z Wirtualnej Polski.
Dostałem informację, że przed przerwą zimową (w lutym SERa nie będzie) mają zamiar pokazać nam bardzo dużo eRa na żywo.

Na spotkanie można się zapisać przez stronę meetup (na obecną chwilę jest 599 Entuzjastów R, jest więc szansa na bycie sześćsetnym entuzjastą).

Dwie prezentacje pracowników działu IT R&D Grupy Wirtualna Polska.

————————————————————–

#1 prezentacja: pivotTable w R / live-coding

# Prelegent:

Karol Kubicki – data artist czerpiący inspirację z problemów rekomendacji artykułów na stronach głównych WP.PL i O2.PL. Tajniki rzeźby umysłu zgłębiał na Uniwersytecie Jagiellońskim na kierunku matematyka. Przez rok wykonywał wielkie i znane w świecie data science 4D (Data Processing, Data Quality, Data Analysis) w firmie SAS, po czym na fali inspiracji przeniósł się do Grupy WP. W procesie twórczym wykorzystuje takie narzędzia jak Hive, Python, czy Bash, ale dłutem, które nadaje nie tylko główny kształt, ale i wyraz jego dziełom jest oczywiście R.

# Opis:

Tabele przestawne są jednym z najwygodniejszych narzędzi do eksploracji danych. W R można je tworzyć za pomocą pakietu rpivotTable. Opowiem o tym jak go używać, jakie są jego silne strony i ograniczenia. Ponadto pokaże jak przechowywać informacje o stanie aplikacji shiny w URLu, co istotnie polepsza użyteczność pivot-a przy dzieleniu się wynikami.

————————————————————–

#2 prezentacja: elastic w R

# Prelegent:

Paweł Cejrowski – data craftsman, zafascynowany wyzwaniami ogromnych wolumenów danych. Absolwent matematyki finansowej na Politechnice Gdańskiej. Obecnie rozwija programistyczne rzemiosło na studiach informatycznych na wydziale ETI tejże uczelni. Rozpoczynał swoją zawodową karierę pomagając w usprawnianiu hurtowni danych jednego z banków, by po krótkiej przygodzie z projektami klasy enterprise dołączyć do zespołu R&D Grupy Wirtualna Polska. Na co dzień pisze w Scali, dostarczając systemy czasu rzeczywistego odpowiedzialne za optymalizację treści wyświetlanych na stronach WP. W czasie wolnym rozwija zainteresowanie zwinnymi metodykami wytwarzania oprogramowania oraz austriacką szkołą ekonomii.

# Opis:

Elasticsearch jest rozproszoną i wysoce niezawodną wyszukiwarką zorientowaną na przechowywanie dokumentów. Pozwala na przetwarzanie danych w czasie rzeczywistym, zachowując przy tym prostotę skalowalności i wysoką wydajność. W prezentacji przedstawione zostanie wykorzystanie tego narzędzia oraz jego integracja z R przy pomocy pakietu ‘elastic’.

2 myśli na temat “SER XV – duuuużo R + elastic i pivotTable”

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">