Prace domowe

Dawno już nie prowadziłem przedmiotu, przy którym tyle przyjemności sprawiało mi sprawdzanie prac domowych!

Na przedmiocie ,,Techniki prezentacji danych”, studenci jako prace domowe przygotowują grafiki związane z danymi, które znaleźli w gazetach z ostatniego tygodnia. Niektóre z tych prac są świetne. Poniżej dwie wykonane ostatnio przez Ewę Baranowską i Martę Jóźwik.

Tabela z Bloombergnews Polska

twd2

zamienia się w wykres przedstawiający rekordowe hiperinflacje (dwie z nich dotyczą Polski). Wykres trzeba oglądać w pełnej rozdzielczości (kliknij by otworzyć w pełnej rozdzielczości).

twd

Drugi wykres wyrósł z Pulsu Biznesu.

img_20161118_244049659

Trochę gg-magii i

twd3

Jak szybko urosnę? Czyli co ma wspólnego Singapur i BetaBit


Ze strony projektu BetaBit można pobrać plik pdf z opowiadaniem ,,Jak szybko urosnę?”. Pierwszym opowiadaniem ze zbioru ,,Jak długo żyją Muffinki?”. Niedługo pojawią się wersje elektroniczne kolejnych opowiadań.
Przez stronę projektu można też zakupić papierową wersję opowiadań lub komiksów.


Tematem przewodnim pierwszego opowiadania jest pytanie: kiedy będę wystarczająco wysoki/wysoka aby móc przejechać się kolejką górską? Szybkie kolejki mają ograniczenie na minimalny wzrost i czasem nawet stanie na palcach nie pomaga. A ten temat to świetna wymówka by porozmawiać o rozkładach wzrostu różnych dzieci w tym samym wieku.

Ale co wspólnego ma to opowiadanie z Singapurem?

Jakiś czas temu znajoma z Centrum Nauki Kopernik przywiozła mi z singapurskiego Art Science Museum książeczkę do pracy z dziećmi pod tytułem ,,Big Band Data”.
A co jest w środku? Ćwiczenia praktyczne na pracę z danymi, wizualizację, planowanie procesu analizy danych od ich zebrania po modelowanie.

O tak! Umiejętność korzystania z danych jest w rozwiniętych gospodarkach równie potrzebna jak umiejętność pisania i czytania. Trzeba więc pokazywać od młodych lat co i jak można z danymi zrobić.

Czasem spotykam się z głosami marud, że to pieśń przyszłości i trzeba poczekać jeszcze z 50 lat. Ale właśnie przykład z Singapuru pokazuje, że nie ma na co czekać.
Dzieci są ciekawe świata a ten można im pokazać przez pryzmat liczb.
Ale jeżeli można w Singapurze to można też w Polsce!

Więcej o projekcie BetaBit i dostępnych w nim materiałach można przeczytać na stronie http://betabit.wiki/.

Z dziennika nauczyciela akademickiego – Techniki Wizualizacji Danych

Prowadzę w tym semestrze Techniki Wizualizacji Danych na MiNI PW. Omawiamy najróżniejsze narzędzia do tworzenia grafiki statycznej i interaktywnej. Począwszy od ggplot2 przez google vis, D3 po Adobe Illustrator.
Ale w wizualizacji danych to nie narzędzie jest najważniejsze, ale komunikatywność historii, którą się graficznie przedstawia.

Jak ją ćwiczyć?

Akurat tutaj duże nadzieje pokładam w pracach domowych. W ramach ćwiczeń, co tydzień, studenci wyszukują w gazetach czy portalach informacyjnych dane lub wykresy, a następnie przygotowują wizualizacje danych z użyciem narzędzi, które akurat w danym tygodniu omawiamy.

Poniżej pokażę dwie bardzo ciekawe prace domowe z pierwszego tygodnia zajęć (ggplot2).

Pani Ewa Baranowska znalazła w Rzeczpospolitej poniższą tabelę dotyczącą liczby spraw prowadzonych przez prokuratorów w różnych krajach.

I z odrobiną magii w ggplot2 powstał poniższy wykres. Nieporównywalnie czytelniejszy niż ww. tabela. Wyraźnie widać różnice pomiędzy wschodem a zachodem Europy.

Drugą pracę, która przypadła mi do gustu, wykonał pan Maksymilian Mazur. Dane dotyczące walki pomiędzy Danem Hendersonem a Michaelem Bispingiem (tutaj link) przedstawił je za pomocą poniższego wykresu.

Wyraźnie widać różnice pomiędzy 2 i 5 rundą. Nie było jej widać w oryginalnej grafice.

Uczę, bo lubię?

screen-shot-2016-09-26-at-21-57-43

,,Uczę, bo lubię?’’ to tytuł wykładu inaugurującego nowy rok akademicki Uniwersytetu Otwartego Uniwersytetu Warszawskiego. Zazwyczaj unikam wykładów inaugurujących, ponieważ sam wykład trwa krócej niż poprzedzające go ceremonie uroczystego powitania połowy sali (tutaj doszła jeszcze ceremonia rozdania nagród). Ale znak zapytania w tytule skusił mnie na kampus główny UW i cieszę się, że na ten wykład trafiłem.

Punktem centralnym wykładu było pytanie, dlaczego robimy to co robimy, czyli dlaczego nauczyciele akademiccy uczą.

Jedni uczą, bo muszą (nie mają stanowisk naukowych, a na naukowo-dydaktycznych trzeba wyrobić pensum), inni uczą, bo chcą. Ale chcieć mogą z różnych powodów, jedni lubią robić show (a tutaj rzesza widzów), inni lubią poczucie władzy (wystawianie ocen), innym może podobać się stabilność zatrudnienia (choć z tą jest różnie).
Są też tacy, którzy uczą z rzemieślniczą starannością robienia porządnie tego co robią. Oraz tacy, którzy po prostu lubią mówić o tym co ich interesuje. Są wreszcie tacy, którzy lubią pracować z młodymi ludźmi, którzy lubią potyczki intelektualne ze studentami. Powodów jest pewnie bez liku, tyle co nauczycieli, niektóre bardziej inne mniej wzniosłe.

Gdy przyjrzeć się w jakiej roli nauczyciele występują w filmach, książkach czy serialach to wizerunek nauczyciela jest różny, od Siłaczki Żeromskiego, przez Alcybiadesa Niziurskiego po postawy z zachodnich filmów takich jak John Keating w Stowarzyszeniu Umarłych Poetów.

Te generyczne wizerunki zazwyczaj mało pasują do nauczycieli akademickich matematyki, którzy wydają się być osobnym plemieniem wśród nauczycieli. Jakim? Bardzo ciekawy wizerunek dydaktyka i naukowca przedstawiony jest w filmie Przestrzenie Banacha (o Stefanie Banachu), który polecił mi znajomy po ww wykładzie.
Warto zobaczyć przed nadchodzącym rokiem akademickim.

screen-shot-2016-09-26-at-23-07-40

Dzień Popularyzacji Matematyki – w czwartek 15 IX 2016 – MiNI PW

screen-shot-2016-09-10-at-08-18-10

Już w czwartek (15 IX) na MiNI PW w godzinach 11-17 odbędzie się druga edycja Dnia Popularyzacji Matematyki.

Miejsca na warsztatach pozostały już nieliczne, ale na wielu wykładach jeszcze miejsca są.

Screen Shot 2016-06-08 at 18.42.39

Przejrzeć listę wykładów i warsztatów oraz zapisać można się przez stronę http://dpm.mini.pw.edu.pl/?q=og/1.
Jest wiele ciekawych propozycji.

A na 14:50-15:50 planowana jest MiNI gra terenowa ,,Łamacze Wykresów” w rozszyfrowywanie wykresowych łamigłówek.

Mecze Matematyczne

Podczas wakacji dowiedziałem się o bardzo ciekawej inicjatywie, tj. o Dolnośląskich Meczach Matematycznych. Temat w sam raz na 1. września.

Dolnośląskie Mecze od kilkunastu lat organizuje Małgorzata Mikołajczyk z UWr. Od kilku lat rozgrywane są też mecze w ligach na Pomorzu i Wielkopolsce. W rozgrywkach udział biorą 10 osobowe zespoły, które wystawiają zainteresowane szkoły. Rozgrywki są prowadzone w ligach dla podstawówek, gimnazjów i liceów. W poprzednim roku można było się zgłaszać do końca października. Zespoły spotykają się parami aby rozegrać mecz. Zwycięzcy przechodzą dalej i tak aż do finałów.

Dokładny regulamin meczu znajduje się tutaj. Poniżej opiszę kilka cech, które najbardziej przypadły mi do gustu.

1) Zespoły mają po 10 osób. Zespoły mają godzinę na opracowanie rozwiązań, ale rozwiązania prezentowane są indywidualnie. Jedna osoba może przedstawić tylko jedno rozwiązanie. Wprowadza to do rozgrywki ciekawy element optymalizacji, gdzie zespół musi ustalić kto będzie prezentował które rozwiązanie.

2) W ocenie rozwiązania liczy się nie tylko końcowy wynik, ale (a nawet przede wszystkim) ścieżka wnioskowania i uzasadnienie wyniku. Jeżeli zaprezentowane wnioskowanie ma słabe strony (lub znacznie prostsze rozwiązanie), to drużyna przeciwna może je wytknąć przejmując część punktów. Konieczność argumentacji rozwiązania oraz analiza tej argumentacji ma niesamowitą wartość edukacyjną.

3) W tej rozgrywce matematycznej planowanie i praca zespołowa jest bardzo istotna aby wygrać mecz. To jest najbardziej niesamowity element całej rozgrywki. W zawodach ,,zespołowych” w których brałem kiedyś udział, wkład drużyny nie był taki ważny. Zespół mógł mieć jednego silnego zawodnika by mieć dobre wyniki. W DMM każde zadanie przedstawia inna osoba, więc nawet jeżeli część drużyny jest silniejsza to musi wyjaśnić reszcie cześć rozwiązań.

Przyznacie, ciekawa inicjatywa. Czy znacie coś podobnego w Warszawie?

BetaBit#3: nowa mini gra dla przyjaciół funkcji lm()

Wakacje w pełni. Dla tych, którzy chcieliby rozerwać się przy konsoli RStudio, mamy nową mini-grę z serii BetaBit. Gra nazywa się regression() i może być sporym wyzwaniem, o ile nie jest się bliskim przyjacielem funkcji lm().

Aby zagrać, należy zainstalować i włączyć wersję 1.3 pakietu BetaBit. Np. poleceniami

install.packages("BetaBit")
library("BetaBit")

Grę opracował Tomasz Żółtak. Podczas gry, w ramach wakacyjnego stażu, Beta i Bit pomagają profesorowi Pearsonowi w analizie pewnych danych edukacyjnych. Po rozwiązaniu wszystkich zadań prof. Pearson uraczy nas sentencją, która jest rozwiązaniem gry.

Przyjemnej rozrywki!

Osobom, które przyślą do końca sierpnia ww. sentencję wraz z rozwiązaniami zadań, prześlę kubek Bety (pierwsze 5 poprawnych zgłoszeń) lub opowiadania BetaBit (pozostałe rozwiązania).

Bez względu na to czy uda się czy nie rozwiązać wszystkie etapy, będę zobowiązany za wnioski, pomysły i komentarze dotyczące tej lub pozostałych gier z serii.

Rozwiązania i komentarze można wysyłać na przemyslaw.biecek na serwerze gmail.com.

Z pamiętnika nauczyciela akademickiego

Jedną z zaproszonych prelegentek na useR 2016 była Deborah Nolan z referatem ,,Statistical Thinking in a Data Science Course’’. Dora jest profesorem na Berkeley, zajmuje się między innymi technikami nauczania statystyki i napisała świetną książkę ,,Teaching Statistics: A Bag of Tricks’’. Jest też orędowniczką wizualizacji danych i poznawania statystyki przez eksperyment. W swoim referacie poruszyła kilka kwestii, które są mi bliskie i które uważam za ważne, więc poniżej przedstawię je miksując z własnymi doświadczeniami z prowadzenia zajęć w poprzednim semestrze. Całą prezentacje Dory można obejrzeć tutaj a grafiki w tym wpisie pochodzą z jej prezentacji.

Swoją drogą, podczas useR zorganizowane były dwie sesje poświęcone nauczaniu statystyki z użyciem R, jedną nawet miałem przyjemność moderować. Lista referatów z tych sesji znajduje się tutaj. Można też obejrzeć nagrania.

Wróćmy do prezentacji Dory.
Jedną z praktyk dotyczących nauczania statystyki z którą chciała się rozliczyć, jest podejście, że analiza eksploracyjna i wizualizacja danych jest dla dzieci, można tego uczyć w przedszkolu, ale nie wypada uczyć tego matematyków na studiach. Na studiach jest miejsce wyłącznie na teorię. Słowo wyłącznie jest tu użyte dosłownie. Nie jeden z nas doświadczył zajęć ze statystyki w których nie pojawiły się żadne [!] dane. Zdaniem Dory teoria jest bardzo ważna, ale drogą do niej są doświadczenia i intuicje zrodzone z EDA.

Czasem, nawet jeżeli dane się pojawiają, to często w charakterze obiadu w puszce. Dane tak przygotowane by zastosować do tych konkretnych danych jedną, jedyną właściwą, konkretną metodę, pokazać wyniki i lecieć dalej.
Tymczasem prawdziwa analiza danych dla niebanalnych problemów wygląda zupełnie inaczej.
Czasem w ogóle nie wiadomo co trzeba zrobić. A nawet jeżeli już wiadomo co zrobić to często nie wiadomo jaką metodą. Samo ustalanie co i jak może stanowić najtrudniejszy problem, który jest do rozwiązania.

Ok, wiemy już, że na zajęciach ze statystyki chcemy użyć danych i że chcemy by problemy były niebanalne. Jak to zrobić? Pomysł jest w sumie prosty, wprowadzić projekty oparte o współczesne, duże, bogate, złożone dane, związane z otwartymi pytaniami badawczymi.

Skąd brać takie projekty? Na naszych zajęciach na MIM UW czy MiNI PW udało się nawiązać współpracę z Ministerstwem Zdrowia, firmą Applica, działem badawczym Centrum Nauki Kopernik, Entuzjastami Edukacji i zespołem USOSa. Każdy z partnerów dał zbiór danych i wsparcie przy pozyskaniu wiedzy dziedzinowej. Dużych i ciekawych danych było więc sporo, do danych były dołączone dosyć otwarte problemy do rozwiązania.
Każdy projekt miał trzy fazy, co pozwoliło na stopniowe usprawnianie opracowanego rozwiązania, podsłuchanie tego co zrobiły inne grupy i ewentualne zaadaptowanie ich rozwiązań. Miłym bonusem była możliwość zaproszenia ekspertów dziedzinowych ze współpracujących instytucje na prezentacje projektów, dzięki czemu można wymienić się doświadczeniami z analiz (udało się między innymi zaprosić dyrektora IBE, capo di tutti capi USOSa, zrobić prezentacje w CNK).
[btw: Teraz szukam partnerów do projektów na przyszły rok, więc jeżeli Wasza firma/organizacja robi ciekawe rzeczy z ciekawymi danymi to zapraszam do kontaktu].

Co ciekawe, dyskusja po referacie Dory krążyła wokół obawy (wspólnej dla wielu krajów) ,,Ale nasi przełożeni są matematykami, nasi koledzy są matematykami, nasi studenci są matematykami, czy im się to spodoba?”. Odpowiedź prowadzącej była prosta. Jednym się spodoba, innym nie. Ale warto dać studentom trochę różnorodności. Bo na obecnie przematematyzowanej statystyce osoby preferujące doświadczalne podejście do analizy danych mogą nie znaleźć inspiracji. Może więc warto im pokazać, że analiza danych ma wiele oblicz i różne oblicza kręcą różne osoby.

Jak te projekty przyjeli moi studenci? Czy chciało im się spędzać godziny nad projektem, by sprawdzać co tam jeszcze można z tych danych wycisnąć? Czy studentom przyzwyczajonym do dowodzenia twierdzeń takie zajęcia mogą się w ogóle spodobać jeżeli za problemem do analizy nie stoi Google albo Microsoft?

Jednym tak innym nie. Znaleźli się studenci traktujący projekty jako zło konieczne. Wczytaj dane, wytrenuj las losowy, pokaż wynik, zapomnij. Ale trafiły się grupy robiące z danymi cuda. Na statystyce II znalazły się grupy, które do predykcji używały modeli mieszanych, regresji Poissona czy thin plate splines, choć żadnej z tych metod nie omawialiśmy na wykładzie [!!! i o to chodzi]. Na R i Duże Dane kilka zespołów wykorzystało łańcuchy markowa (których nie omawialiśmy na naszych zajęciach) i wywiązała się dyskusja czy założenia tej metody są w określonej sytuacji spełnione czy nie.

Jaka jest więc pointa? Dajmy studentom trochę różnorodności. Obok klasycznych matematycznych wykładów ze statystyki zróbmy miejsce na trochę szaleństwa w eksploracje danych mniej lub bardziej na oślep licząc, tak by uczyć się poruszać w gąszczu prawdziwych problemów. A nuż im się ten gąszcz spodoba.

StatTuba a PolakPotrafi

Wspólnie z Agnieszką Tomczyk na serwisie crowdfundingowym PolakPotrafi uruchomiliśmy kampanię ‘Jak zważyć psa linijką’. Celem jest przygotowanie materiałów warsztatowych do lekcji statystyki w szkołach, powkładanie ich do 25 StatTub i rozesłanie po Polsce.

StatTuba to tuba z komiksami, materiałami do pracy własnej, scenariuszem lekcji dla nauczyciela matematyki. Z taką tubą zainteresowany nauczyciel może samodzielnie poprowadzić lekcję o regresji liniowej.

Krótkie jednominutowe wprowadzające video powyżej, a więcej informacji znajduje się na stronie https://polakpotrafi.pl/projekt/jak-zwazyc-psa-linijka.

Pomóc można nam wspierając finansowo kampanię lub rozsyłając informację o niej do szerszego grona osób.

Na wspieranie jest ponad miesiąc czasu. Jeżeli się uda, to pierwsze StatTuby wyruszą na 1 września.