Miesiąc temu ruszył MI2DataLab, kuźnia/warsztat z narzędziami do analizy danych.
Dzisiaj mieliśmy pierwszą, po oficjalnym otwarciu, obronę pracy magisterskiej w grupie MI2.
Aleksandra Paluszyńska z MIM UW obroniła pracę Structure mining and knowledge extraction from random forest with applications to The Cancer Genome Atlas.
W pracy opisała metodologię stojącą za opracowanym przez nią pakietem randomForestExplainer. Pakiet służy do wizualnej diagnostyki lasów losowych. Analizy ważnych zmiennych, ważnych interakcji, brzegowych zależności itp.
Pracę przeczytać można tutaj.
Pakiet można pobrać i zainstalować z CRAN lub GitHuba.
Krótka winietka opisująca pakiet jest dostępna tutaj.
Z pakietu warto skorzystać – już żaden las losowy nie będzie miał przed nami tajemnic.