Na MiNI prowadzę w tym semestrze przedmiot ,,R i duże dane”. W ramach pierwszego projektu studenci w grupach opracowali systemy do monitorowania w mediach (portale informacyjne, facebook, twitter) tego ile i co się mówi o kandydatach na prezydenta. Sześć grup, sześć różnych podejść do tematu, większość grup zebrało po kilkaset MB najróżniejszych wypowiedzi / artykułów / komentarzy.
Co ciekawego z tego wynikło?
W takim gąszczu danych kryje się sporo historii. Przykładowo, gdy spojrzeć na skumulowaną liczbę artykułów, w których pada nazwisko któregoś z kandydatów w podziale na portale informacyjne (rysunek poniżej), to okazuje się, że do pierwszej tury najczęściej w artykułach pojawiali się B. Komorowski (szczególnie w Interii i Wirtualnej Polsce) i A. Duda (szczególnie w NaTemat, Onet i TVN24). Są takie portale (WPolityce) gdzie praktycznie nie pojawiali się inni kandydaci. Z porównanych portali, jedynie na Wirtualnej Polsce można było dosyć często poczytać o kimś innym, przy czym tym kimś innym był zazwyczaj P. Kukiz lub J. Korwin.
Czytaj dalej R, Big Data i Efekt Pawła Kukiza