IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych

Miło nam poinformować, że Fundacja SmarterPoland.pl została w tym roku sponsorem IV Niezależnych Ogólnopolskich Mistrzostw w Analizie Danych (w skrócie NOMAD)! Przedsięwzięcie to, chociaż stosunkowo młode, gromadzi studentów zainteresowanych praktycznym wykorzystaniem statystyki w ciekawych zadaniach, oraz naprawdę duże grono licealistów, którzy traktują kombinatorykę jako coś więcej jak niepotrzebny dział edukacji. NOMAD, czyli jedyne tego rodzaju zawody statystyczne, opiera się na formule ACM ICPC, i pozwala na pisanie odpowiedzi na zadania w wybranym języku: C/C++, Python, Mono Basic, Pascal, Octave a co chyba najciekawsze, w R i SAS Analytics Pro.

Czytaj dalej IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych

[Przegląd prasy] Młodzież a polityka – badanie CBOS

Jakiś czas temu pisałem, że największą zaletą fundacji jest to, że przyciągają one osoby o ciekawych pomysłach i pomagają w realizacji tych pomysłów. Mamy więc koleje potwierdzenie tej opinii. Jakiś czas temu zgłosiła się do nas pani Paula Cybowska z propozycją pomocy w prowadzeniu ,,przeglądu prasy” związanego ze zbieraniem i analizą danych. Dziś pierwsza notatka poświęcona ciekawym badaniom prowadzonym przez CBOS.

Według sondażu CBOS, przeprowadzonego w listopadzie i grudniu 2013 zainteresowanie młodzieży polityką, w porównaniu do ostatnich lat, maleje.

Paula Cybowska

Żródło: http://www.cbos.pl/PL/wydarzenia/34_konferencja/2_Mlodziez_2013-Zainteresowanie_polityka_i_poglady_polityczne.pdf

Czytaj dalej [Przegląd prasy] Młodzież a polityka – badanie CBOS

Making Sense of Data

Na zachodzie popyt na wszystko co ma w nazwie ‘Data’ rośnie.
Za popytem idą różnorakie rozwiązania, w tym kursy MOOC.

Google uruchomi jutro kurs ‘Making Sense of Data’ podczas którego będzie można poznać podstawowe pojęcia dotyczące analizy danych i szukania związków pomiędzy danymi.
Więcej informacji tutaj.

Zastanawiające jest tylko ‘Knowledge of statistics is not required’. Jutro dowiemy się co też będzie w materiałach do kursu.

Reklamówka:

Ile kosztuje człowiek? Co widać w danych o edukacji? czyli o tysiącach dolarów i euro do wygrania.

W czasach, gdy posiadanie dużych danych staje się coraz prostsze i tańsze, rośnie zapotrzebowanie na wyłuskiwanie z tych danych interesujących zależności i czytelne prezentacje zależności opisywanych przez dane.

Dziś będzie o dwóch konkursach, w których mając pomysł na wizualizacje można wygrać niemałe pieniądze.

Na potrzeby okładki przyszłej książki ,,Knowledge is Beautiful” uruchomiono konkurs na wizualizacje danych przedstawiających cenę życia człowieka w różnych epokach. W zależności od płci, wieku, umiejętności, miejsca czy epoki cena waha się od niecałych 100$ do 100 000$.
Jak znaleźć w tych danych historię i ją pokazać?
Więcej informacji tutaj: http://www.informationisbeautifulawards.com/challenge/.
Trzy kategorie, w sumie można wygrać ponad 3 000 USD.
Nie trzeba być projektantem, jest też konkurs na sam pomysł (napkin category).

Drugi konkurs będzie oficjalnie ogłoszony za miesiąc, ale może kogoś zainteresują wstępne informacje.
OECD ogłosi konkurs na wizualizacje danych PISA 2012 z użyciem programu R.
Zwycięzca wyłoniony będzie podczas konferencji useR 2014 (w tym roku Kalifornia).
Będą dwie kategorie (nagroda publiczności i ekspertów), do wygrania 1000 Euro.
Konkurs będzie polegał na wizualnej prezentacji odpowiedzi na pytania badawcze, lista pytań pytań pojawi się wkrótce, ale można już ćwiczyć zabawę z danymi, do pobrania https://github.com/pbiecek/PISA2012lite.

20 minut o edukacji i wnioskach z badania PISA

Czy możecie wygospodarować 20 minut wolnego czasu? Jeżeli tak to obejrzyjcie poniższego TEDa. Zaręczam że warto.

O edukacji oraz użyteczności danych w rozmowach o edukacji opowiada Andreas Schleicher, który jest kierownikiem zespołu PISA (badania umiejętności 15-latków) i kilku innych projektów edukacyjnych (badania nauczycieli TALIS / edukacja dorosłych PIAAC itp) w OECD.

Pomijając fakt, że Andreas jest charyzmatycznym statystykiem (mnie to wystarcza by go słuchać), mówi też o bardzo ciekawych tematach:
– O nierównych szansach w edukacji oraz tym jak niektóre kraje pracują nad zwiększeniem / zmniejszeniem różnic.
– O tym jak biedną Koreę stać na inwestowanie w dobrych nauczycieli (mają większe klasy co podwójnie się opłaca).
– O tym jak ważne w edukacji było odejście od rozliczania nauczycieli z realizacji podstawy programowej, do wspierania nauczycieli by rozwijali się i eksperymentowali (patrz też dyskusja o nauce w Polsce).
– O tym gdzie kierowani są najlepszy nauczyciele i dyrektorzy w Finlandii (do najtrudniejszych szkół by mogli się wykazać).
I wielu innych ciekawych tematach.

Tak więc przed wami Andreas i prezentacja ,,Use data to build better schools”.

Btw: dziś w OECD organizowanych jest TEDx, na którym również występuje Andreas. Jak tylko to nagranie znajdzie się w Internecie to o nim napiszę.

Drugi SER [Spotkanie Entuzjastów R]

Zainteresowanie pierwszym Spotkaniem Entuzjastów R przerosło nasze oczekiwania. Mając 42 chętnych oraz salę z 14 krzesłami, musieliśmy zamknąć rejestrację na kilka dni przed wydarzeniem.
Tym razem będziemy mieć większą salę, przesyłajcie więc informacje o spotkaniu znajomym.

Drugie Spotkanie Entuzjastów R odbędzie się 20 marca w WARSZTAcie, przestrzeni wypożyczanej NGOsom w samym środku Warszawy, a dokładniej na placu Konstytucji 4.
Zaczynamy o 17:15.

Przed nami dwa bardzo ciekawe referaty: o przetwarzaniu napisów w R oraz o pracy z biblioteką shiny (szczegóły na plakacie poniżej).

Osoby planujące przyjść na spotkanie prosimy o wcześniejszą rejestracje z użyciem tego linku lub poniższego formularza.

Rejestracja zakończona

Osoby chcące pomóc przy organizacji kolejnych spotkań są mile widziane i proszone o kontakt emailowy.

PISA a status ekonomiczny, społeczny i kulturowy

Bohaterem dzisiejszego wpisu jest jądrowy estymator gęstości.

Analizując dane znajduje się czasem zaskakujące zależności. Nie zawsze wiadomo co z nimi zrobić. Poniżej opiszę takie znalezisko, które wydaje się być interesujące, choć jeszcze nie jestem pewien dlaczego. Materiał w sam raz na blog.

Badanie PISA na podstawie kwestionariusza ucznia ocenia status ESCS rodziny (skrót od Economic, Social and Cultural Status), który agreguje informacje o zamożności i edukacji rodziców jak i o stanie posiadania dóbr kultury (książek, obrazów, itp). Sztuczny jednowymiarowy indeks, ale ponieważ wiadomo, że zamożność rodziny koreluje z wynikami uczniów, więc często go się uwzględnia w analizach z powodu wygody (po co dodawać do modelu 10 zmiennych gdy można jedną?).

Ciekawe jest nie tylko śledzenie zależności pomiędzy wynikami uczniów a indeksem ESCS ale również oglądanie jak rozkład ESCS zmienia się pomiędzy kolejnymi badaniami.

Nie można porównywać bezpośrednich wartości ESCS ponieważ w każdym badaniu PISA są one inaczej normowane (coraz więcej krajów bierze udział w badaniu), ale można porównywać kształty rozkładów.

Rozkład indeksu ESCS dla 15-latków z Polski w roku 2003 wyglądał tak:

Czytaj dalej PISA a status ekonomiczny, społeczny i kulturowy