Wydatki na badania i rozwój w Polsce jako procent PKB, czyli test na spostrzegawczość lub wtorkowy czarny humor

Kilka dni temu na stronach Obywateli nauki pojawił się wpis traktujący o poziomie finansowania nauki w Polsce wraz z propozycjami zmiany, czyli zwiększenia nakładów na naukę. Co prawda nie uważam by samo podniesienie wydatków na naukę było rozwiązaniem. Ważna a może nawet ważniejsza jest wizja w które działy nauki inwestować. Obu stronom (i inwestującym obywatelom i dofinansowywanym naukowcom) żyłoby się lepiej z taką wizją.

Ale zamiast pisać o wizjach dzisiaj napiszę o czymś uchwytnym, czyli o tym jak wielkość wydatków na badania i rozwój (research and development, w skrócie R&D) planowanych w Polsce wygląda na tle krajów rozwiniętych. I również na co w Polsce są wydawane pieniądze na naukę.

Czytaj dalej Wydatki na badania i rozwój w Polsce jako procent PKB, czyli test na spostrzegawczość lub wtorkowy czarny humor

Młodzi XXL, Eurostat a problem nadwagi i otyłości

Dzisiaj będzie o wizualizacji danych o otyłości w Polsce. Ale ponieważ jest to prawdopodobnie początek ciekawego (mam nadzieję) eksperymentu, pozwólcie, że zacznę od szerszego wprowadzenia.

Zaczęło się od żony. Podsunęła mi artykuł z Polityki ,,Otyli za młodu” (na stronie www tytuł to ,,Młodzi XXL”). Poruszono w nim bardzo ciekawe zjawisko jakim jest otyłość u dzieci i młodzieży. Niestety (dla mnie) opisywano w bardzo specyficzny sposób. Tzn kilka szokujących statystyk, np. ,,w ciągu ostatnich 30 lat liczba dzieci z nadwagą w Warszawie wzrosła 10 razy” (to ile ona teraz wynosi?) połączonych z dramatycznymi wypowiedziami dzieci w wieku 11-12 lat, które z powodu nadwagi wylądowały w poradni pediatrycznej. I o ile pochylanie się nad historiami kilku wybranych dzieci z pewnością powoduje, że artykuł wzbudza wiele emocji, to moim zdaniem ten zabieg utrudnia zrozumienie jak właściwie wygląda ten problem, w jakim wieku pojawiają się problemy z nadwagą i jakiej części społeczeństwa to dotyka. Innymi słowy ten artykuł wygenerował ciekawość informacji, ale tej ciekawości u mnie nie zaspokoił.

Z drugiej strony miesiąc temu na seminarium ,,Infografika i prawo” Instytutu Prawa i Społeczeństwa INPRIS poznałem Magdę Małczyńską-Umeda (zgodnie z opisem na Jej blogu: dizajnerkę i konsultantkę w dziedzinie komunikacji wizualnej), która ma na koncie wiele ciekawych infografik. Rozmawiając ostatnio, przyszło nam do głowy, że ciekawym eksperymentem byłoby zderzenie podejścia infografika i statystyka do przedstawiania informacji/danych na jakimś wybranym problemie. Eksperyment wygląda na ciekawy i dlatego, że ciekawe co z tego wyjdzie i ciekawe jak do tego co wyjdzie się dojdzie. Do zespołu przydałby się jeszcze ,,researcher” (czy jest jakieś dobre polskie tłumaczenie?), który pozyska dobre dane, ale ponieważ takiej osoby tymczasowo brak więc będziemy bazować na danych dostępnych w Eurostacie.

Podsumowując, razem z Magdą postaramy się przedstawić jak wygląda problem otyłości, będziemy bazować na danych z Eurostatu i będziemy pokazywać kolejne kroki powstawania wizualizacji.

Pierwsza wersja będzie wersją statystyka, czyli moją. W Eurostacie można znaleźć dane o otyłości (określanej na podstawie BMI) dla lat 2002 i 2008, dla kilkunastu państw (niestety nie wszystkich), w podziale na grupy wiekowe, płeć i wykształcenie. Poszukiwanie historii zacznijmy więc od kilku prostych zestawień.

Dla danych o Polsce z roku 2008 zobaczmy jaki procent osób ma niedowagę (BMI <18.5), prawidłową wagę (BMI 18.5-25), nadwagę (BMI 25-30) i otyłość (BMI >30).

Powyżej 35 roku życia te statystyki wyglądają przerażająco, poniżej 1/3 mężczyzn ma prawidłową masę ciała.

Ok, drążmy dalej. Weźmy grupę wiekową 25-34 lata i zobaczmy jak niedowaga i nadwaga wygląda dla grup o różnym stopniu wykształcenia (a więc i prawdopodobnie dochodów).

Kobiety z wyższym wykształceniem mają najczęściej prawidłową wagę ciała spośród porównywanych grup. U mężczyzn trendu pomiędzy wykształceniem a BMI nie widać.

Zobaczmy jeszcze jak wyglądała struktura niedowagi/otyłości w roku 2008 i 6 lat wcześniej w roku 2002, przyjrzymy się grupie wiekowej 25-34 lata.

Najbardziej wyraźnie widać zmianę w strukturze otyłości u mężczyzn. Procent mężczyzn w wieku 25-34 o prawidłowej masie ciała zmienił się z 56% na 42% w ciągu 6 lat. Jeżeli taki trend się utrzyma to założenie o wydłużającej się średniej długości życia okaże się szybko nieprawdziwe.

A na koniec zupełnie inny eksperymentalny obrazek. Dla każdej z czterech grup (niedowaga/prawidłowa waga/nadwaga/otyłość) zobaczmy jak zmienił się przez 6 lat procent kobiet i procent mężczyzn ,,wpadających” w daną kategorię (wszystkie grupy wiekowe i wykształcenia).

Po przyjrzeniu się np. drugiemu panelowi można zobaczyć, że na Węgrzech procentowo przybyło i kobiet i mężczyzn o prawidłowej masie ciała (strzałka w prawo do góry) ale w większości z prezentowanych krajów, coraz mniej i mężczyzn i kobiet ma prawidłową masę ciała (strzałka w lewo dół). W przypadku Polski najbardziej widać to dla mężczyzn (strzałka w lewo o ponad 25%).

Mapa Wydatków Państwa a wizualizacja danych klockami Lego, czyli LEGOdataVis

Bilans tego weekendu to dziesięć złożonych zestawów Lego Technic, Cobi i Metalowych Klocków (metalowe belki wraz z śrubkami do skręcania). Dawno już nie wkręciłem tylu śrubek. Niestety po kilkunastu godzinach odkryłem, że same klocki mogą się znudzić. Jeżeli jednak lubisz Lego i lubisz wizualizować dane to możesz wykorzystać efekt synergii używając klocków aby wizualizować dane!!!

Czytaj dalej Mapa Wydatków Państwa a wizualizacja danych klockami Lego, czyli LEGOdataVis

Zrób to sam – PISA 2009 DIY, od podszewki…

(… kontynuacja wtorkowego wpisu Tomasza Owczarka)

Zgodnie z zapowiedzią, w dzisiejszym wpisie pokażę, w jaki sposób dokonywać prostych modyfikacji w zaprezentowanej wizualizacji. Wpis ten jest przeznaczony przede wszystkim dla osób, które chciałyby wykorzystać ją w celach dydaktycznych (wcześniej dostosowując do swoich potrzeb), a które nie miały wcześniej do czynienia z Tableau czy innymi podobnymi narzędziami. Pozostałych mam nadzieję zainteresować krótkim opisem programu Tableau Public i swoimi wrażeniami związanymi z jego użytkowaniem. Dla osób, które poczują się zachęcone do zapoznania się z Tableau, zamieszczam subiektywny wybór linków do materiałów na jego temat. Jeśli natomiast wśród czytelników znajdą się tacy, którzy już z niego korzystali ,,jeszcze zanim to było modne”, namawiam do dzielenia się uwagami :).

Na wszelki wypadek zaznaczę, że nie jestem w żaden sposób związany z firmą Tableau Software (a szkoda :) ). Głównym celem wpisu nie jest promowanie produktu określonego producenta (to raczej efekt uboczny), tylko popularyzacja narzędzia edukacyjnego utworzonego za jego pomocą. Wszystkie zamieszczone w tekście opinie są moimi prywatnymi, wygłoszonymi z nieprzymuszonej w żaden sposób (ani kijem, ani marchewką) woli. A jedyną moją korzyść stanowić będzie pozytywna reakcja czytelników :)

Czytaj dalej Zrób to sam – PISA 2009 DIY, od podszewki…

Zrób to sam – PISA 2009 DIY, czyli łatwe w użyciu narzędzie do eksploracji danych

Dzisiaj na blogu pierwszy gościnny wpis. Pierwszy, ponieważ mam nadzieję, że ciekawych gościnnych wpisów z czasem będzie więcej. Autorem tego jest Tomasz Owczarek. Przedstawi on wrażenia z organizowanego przez fundację projektu wakacyjnego związanego z analizą danych PISA 2009. A również, a może przede wszystkim, przedstawi narzędzie, które wykonał, a które pozwala na eksplorację przez niespecjalistę danych z badania PISA. Świetne narzędzie, które można użyć do zaspokojenia własnej ciekawości, ale również można je wykorzystać do zainteresowania innych analizą danych, np na wprowadzających zajęciach z analizy danych. Tak proste w użyciu że można użyć nawet w gimnazjum, tak ciekawe, że nadaje się do pokazywania studentom na uczelniach wyższych.


Kliknij by otworzyć narzędzie.

Czytaj dalej Zrób to sam – PISA 2009 DIY, czyli łatwe w użyciu narzędzie do eksploracji danych

Czego chce premier, czyli co IBM Many Eyes widzi w przemówieniu premiera Donalda Tuska.

Drugie expose premiera Donalda Tuska wywołało sporo komentarzy. W mediach znajdują się analizy jak czytać gesty premiera, czy premier stał na jednej czy dwóch nogach, czy był zmęczony, czy był pewny siebie itp.
Aby uzupełnić te szczegółowe analizy przyjrzymy się treści wystąpienia.

Czytaj dalej Czego chce premier, czyli co IBM Many Eyes widzi w przemówieniu premiera Donalda Tuska.

Uogólnione modele addytywne z parametrem położenia, skali i kształtu a siatki centylowe

Dzisiejszy wpis będzie bardzo krótki. Ostatnio pisałem o siatkach centylowych dla wzrostu i wieku i z tymi najczęściej się spotykamy. Konstruowane są też siatki centylowe dla innych parametrów, np. dla ciśnienia skurczowego i rozkurczowego. Takie siatki pozwalają na identyfikację dzieci potencjalnie chorych lub narażonych na nadciśnienie.

Rok temu moja dyplomantka ‘Anna Lis’ obroniła pracę magisterską w której opisywała jak wykorzystać uogólnione modele addytywne z parametrem położenia, skali i kształtu do konstrukcji siatek kwantylowych dla ciśnienia skurczowego i rozkurczowego. Oczywiście wszystko z użyciem pakietu R.

Samo modelownie jest niebanalne. Są i funkcje sklejane i modele addytywne i rozkłady z parametrem kształtu i skali. Przeczytać o nim można we wspomnianej pracy magisterskiej dostępnej na stronie Pracowni Analiz Statystycznych w tym pliku (piąty rozdział). Praca powstała przy współpracy z Instytutem Pomnik – Centrum Zdrowia Dziecka.

I refleksja na koniec. Na debacie podczas festiwalu nauki ktoś z sali pytał czy statystyka to nauka. Filozoficzne pytanie na które trudno wyczerpująco odpowiedzieć. Ale mnie spodobała się odpowiedź ,,jaka różnica czy to nauka czy nie, nowoczesna statystyka jest potrzebna by większość innych działów nauki mogło się rozwijać.”