Big Data, R i useR.

Tydzień temu podczas konferencji use!R miałem przyjemność zapoznać się z treścią szkolenia ,,Programming with Big Data in R”. Materiały dostępne tutaj.

Materiał prezentowane podczas szkolenia są również dostępne w postaci 80-stronicowej winietki/ilustracji ,,Speaking Serial R with a Parallel Accent”.
W skrócie zbiór pakietów pbd* zawiera między innymi:
– pdbMPI [pracujący z MPICH, OpenMPI] kilkukrotnie szybszy niż Rmpi
– pbdNCDF4 [operacje na plikach w zrównoleglonych systemach plików]
– pbdDMAT [operacje na macierzach z użyciem ScaLAPACK (Scalable Linear Algebra PACKage)].

Wiele się dzieje na styku HPC Big Data i R. I dobrze.

Co do wrażeń z samej konferencji. Było kilka bardzo interesujących referatów (z wizualizacji danych o mapach i skali Likerta, z analizy danych o ultraszybkiej alternatywie do MCMC, z inżynierii oprogramowania o pakietach data.table, zmianach w 3.0.1 itp). Część z tych tematów przedstawię w kolejnych wypisach, są bardzo ciekawe i warto o nich napisać trochę więcej. O ile zaproszone referaty były na wysokim poziomie, o tyle widać było, że organizatorzy bardziej postawili na stronę towarzyską konferencji niż na dopracowanie szczegółów organizacyjnych. Poprzednie edycje miały lepiej przygotowane sesje, bardziej zsynchronizowane referaty, trzymające się ustalonej długości i kolejności. Na tej konferencji kolejność referatów potrafiła się zmienić, podczas przerw kawowych było też więcej piwa i wina niż na wszystkich poprzednich konferencjach useR razem wziętych, co w pewnym sensie odzwierciedlało priorytety organizatorów.

Miłym akcentem było spotkanie sporej grupy polaków. Dr Zdzisław Piasta przyjechał z liczną grupą studentów i doktorantów. Było też kilka osób z innych miast. Na materiałach reklamowych Revolution Analitics można było znaleźć odbitki plakatów z konferencji WZUR. To duża zmiana w stosunku do poprzednich edycji useR.

Wciąż useR pozostaje dla mnie najprzyjemniejszą z konferencji, wiele osób o podobnych do moich zainteresowaniach. Konferencji, na której spotkać można i ludzi z przemysłu i akademii, jednak bez pustosłowia (spotykanego na niektórych konferencjach biznesowych) i bez zadęcia (spotykanego na niektórych konferencjach naukowych). Konferencją na którą przyjeżdżają zarówno weterani jak i nowi użytkownicy. Duża liczba nowych użytkowników jest pewnego rodzaju gwarancją, że nie zamienia się to w towarzystwo wzajemnej adoracji.

Za rok Los Angeles.