Konkurs na najgorszą prezentację danych w roku 2013

Rok temu przeprowadziliśmy konkurs na najgorszą prezentację danych roku 2012. Kandydatów było ośmiu a wybór był trudny. Przewagą kilku głosów wygrał bardzo dziwny wykres paskowy. O konkursie i wynikach przeczytać można tutaj ,,Konkurs na najgorszą prezentacje danych z roku 2013”.

Czas powtórzyć ten konkurs na zbiorze wykresów z roku 2013. Do wyboru jest osiem wykresów przedstawionych poniżej. Dla każdego kandydata dodałem krótki opis i odnośnik do dłuższego opisu. Na dole strony znajduje się sonda do której gorąco zapraszam. Można oddać jeden głos, ale można w nim wskazać kilka odpowiedzi. Podobnie jak w ubiegłym roku, autor zwycięskiego wykresu (o ile uda się go zidentyfikować) otrzyma książkę o wizualizacji danych i tytuł twórcy najgorszej wizualizacji 2013.

W tegorocznym zestawieniu ponad połowa wykresów została opracowana przez ministerstwa. Paradoksalnie, odczytuję to jako pozytywny sygnał. Dobrze, że rządzący chcą w czytelny sposób i w oparciu o liczby komunikować co się dzieje. Z czasem mam nadzieję, że będą to robić coraz lepiej (bo teraz robią to źle).

Kandydat nr 1. Piramida finansowa (Ministerstwo Finansów)

Piramida przedstawiająca propozycje finansowe PiS, ale wykonana przez Ministerstwo Finansów kierowane przez PO. Pomijając sposób wyznaczania liczb, problem z tym wykresem polega na tym, że proporcje na nim przedstawione nie odpowiadają proporcjom prezentowanym liczb (plus punkt w konkursie za sugestywny dobór kształtu i kolorów). Wykres szerzej opisany w tym wpisie.

Kandydat nr 2. Ile można zarobić w ZUS (Ministerstwo Pracy)

Oczywiście w ZUS zarabiają tylko pracownicy ZUS, oczekiwanie na waloryzacje składek to nie zarabianie. Więc za poczucie humoru widoczne w tytule, tej grafice, opracowanej przez Ministerstwo Pracy, należą się dodatkowe punkty.
A techniczny problem z tym wykresem polega na nieodpowiednich proporcjach długości słupków do przedstawianych liczb. Temat szerzej opisany w tym wpisie.

Kandydat nr 3. Wydatki na badania i rozwój (Ministerstwo Nauki)

Jak pokazać duże wzrosty? Zsumować dane z kilku lat. Poniższy wpis pokazuje, że prognozowane wydatki na badania i rozwój w latach 2013-2016 będą wyższe niż te w roku 2012. Szkoda tylko, że po podzieleniu prognoz przez liczbę lat okazuje się, że lepiej to już było.
Szerzej opisany w tym wpisie.

Kandydat nr 4. Najbardziej aktywni (Ministerstwo Nauki)

Ten wykres pokazuje dwa współczynniki. Względem ,,liczba zgłoszonych wniosków” jesteśmy na pozycji 15 na 27 państw, względem ,,współczynnik sukcesu” na pozycji 21 na 27 państw. Nie przeszkadza to autorowi w oznaczeniu nas jako ,,najbardziej aktywnych”. Ciekawe jak autor nazwie kraje z końca listy, ,,średnio/bardzo aktywne”? Szerzej opisany w tym wpisie.

Kandydat nr 5. Mamy więcej, ale o ile więcej? (Kancelaria Prezesa Rady Ministrów)

Ponownie problem z wykresami paskowymi na skali bez zera. Dobierając różne zakresy wartości na osiach uniemożliwiono porównanie w jakich obszarach zyskamy więcej a w jakich mniej.
Szerzej opisany w tym wpisie.

Kandydat nr 6. Ile zyskamy w OFE (Gazeta.pl)

Prawy wykres ma inną skalę niż środkowy. Na prawym jedna kratka to 10% a na środkowym 5%. W tej perspektywnie 15% zysk z OFE wygląda jak 6,9% zysk z ZUS.
Temat szerzej opisany w tym wpisie.

Kandydat nr 7. Wykresy paskowe, ciąg dalszy (IIBR)

Jak czytać poniższe wykresy paskowe? Dlaczego one wszystkie mają tą samą szerokość? Dlatego, że zmienia się wysokość pudełek. Gdyby jeszcze trochę bardziej ścisnąć te pudełka to zupełnie nic nie dałoby się odczytać z tego wykresu.

Kandydat nr 8. Robisz to źle, reklama (Ergo Hestia)

I coś z branży reklamowej, imho jedna z gorszych reklam opartych o liczby jaką widziałem. Pomijam już to, że wykresy paskowe są w pseudo-trzech wymiarach, że oś pozioma jest niewłaściwa i że brakuje zera.
Tutaj jest problem z pomysłem. Zamiast pokazywać, że klienci się najmniej skarżą lepiej by było pokazać, że są najbardziej zadowoleni[dlaczego skreślone? patrz dyskusja poniżej] Zamiast pokazywać słupki o długości związanej z ze wskaźnikiem skarg lepiej zaproponować kreatywny sposób przedstawienia w pozytywnym świetle małej liczby skarg (komunikat dłuższy pasek = lepiej jest łatwiejszy i działa szybciej niż odczytanie że w tym przypadku jest odwrotnie). Nawet słupki odpowiadające 100-wskaźnik skarg wyglądałyby lepiej, ale z pewnością da się to przedstawić lepiej niż słupkami.

Które z tych grafik zasługują na miano najgorszej prezentacji danych 2013?

Wybierz najgorszą wizualizację danych w roku 2013

View Results

Loading ... Loading ...

PISA 2012 a wielkość miasta, poziom edukacji rodziców czy płeć uczniów

Ostatnio wiele się mówi o wynikach z badania PISA 2012. Polscy uczniowie wypadli w tym badaniu bardo dobrze, można te wyniki wykorzystać w budowaniu marki Polski jako kraju ludzi wyedukowanych. Dla gospodarki to spora szansa – pozostaje mieć nadzieję, że będzie wykorzystana. Największe wrażenie robi tempo poprawy wyników przez naszych uczniów. Poniżej chciałbym napisać o wynikach, które nie znalazły się w raportach OECD, ale z punktu widzenia naszego kraju są bardzo ciekawe:

Wielkość miasta

Zobaczmy jak wyglądają wyniki uczniów w dużych miastach, średnich miastach i małych miasteczkach. W większości krajów uczniowie z większych miast mają lepsze wyniki. Składa się na to wiele czynników, między innymi dzieci w dużych miastach to częściej dzieci biznesmenów i specjalistów – osób zamożniejszych mających większy dostęp do zasobów edukacyjnych. W większych miastach jest też organizowanych więcej inicjatyw edukacyjnych.

Powyższy wykres przedstawia promil rozwiązanych zadań przez różne grupy uczniów. W tym przypadku te grupy odpowiadają wielkości miasta w którym zlokalizowana jest szkoła – czy to wioska, małe, średnie czy duże miasto. Każdy wiersz odpowiada grupie uczniów ze szkół zlokalizowanych w mieście o danej wielkości.

Każda szara kropka to jeden kraj, czerwona kropka to pozycja Polski. Dzięki temu możemy zobaczyć jak wygląda pozycja Polski względem innych krajów w danej wielkości miasta. Czerwony prostokąt pośrodku oznacza 50% krajów o najbardziej średnich wynikach, dzięki temu łatwiej się zorientować, czy Polska jest w górnym kwartylu, czy bliżej środka rozkładu.

Po prawej stronie zaznaczono pozycje Polski w rankingu, biorąc pod uwagę tylko daną kategorię wielkości miasta. Dla dużych miast, zamieszkałych przez ponad milion mieszkańców (w Polsce to tylko Warszawa) zajmujemy drugie miejsce na 33 kraje, w przypadku średnich miast – piąte miejsce na 41 krajów itp. Nie wszystkie kraje z badania PISA mają bardzo duże lub bardzo małe miasta, dlatego liczba krajów w rankingu jest różna w różnych wierszach. W tym podsumowaniu uwzględniono tylko kraje biorące udział w PISA 2003 i PISA 2012, a więc 44 kraje z 69 krajów które brały udział w PISA 2012.

Co widzimy? 15-latki z Warszawy mają wyniki znacznie lepsze niż 15-latki z innych ponad milionowych miast. Rozwiązali oni średnio 65% zadań z matematyki (* to ważona średnia, patrz wyjaśnienie na końcu wpisu). W mniejszych miastach ten wskaźnik wynosi około 50% rozwiązanych zadań. Średnio 15-latkowie z Polski osiągnęli bardzo dobre wyniki, a im większe miasto tym ta średnia jest (względnie) wyższa.

Powyższy wykres prezentuje wyniki dla czytania ze zrozumieniem i nauk przyrodniczych. Co ciekawe w czytaniu i przyrodzie uczniowie z Warszawy mają pierwsze miejsce w kategorii dużych miast (pierwsze na 33 kraje, tu nie ma wszystkich 69 krajów z PISA 2012). Na górze wykresu przedstawione są „gap size” – wielkości różnic w wynikach pomiędzy uczniami z dużych i małych miast. W Polsce te różnice są duże.

Wyniki a poziom edukacji rodziców

Edukacja rodziców jest przedstawiona w skali ISCED, gdzie ISCED 1 – wykształcenie podstawowe a ISCED 5 – wykształcenie wyższe, ISCED 6 – stopień doktora.

Jak widzimy dzieci rodziców o wyższym wykształceniu mają średnio wyższe wyniki. Ten „bonus” w przypadku Polski jest większy niż w innych krajach. Przy okazji można zauważyć jak te rankingi ujawniają trudności w porównywaniu wyników. Patrząc na rezultaty dzieci przez pryzmat edukacji rodziców, Polska wypada na pozycjach 7./12./15., czyli niżej, niż gdy dzieliliśmy je ze względu na wielkość miasta. Wynika to z różnych udziałów dużych i małych miast w różnych krajach.

Wyniki a płeć uczniów

Na wyniki można spojrzeć przez pryzmat podgrup określonych przez płeć. Co ciekawe, dziewczyny są w wyższym centylu, gdy porównywać je z dziewczynami z innych krajów. Bardzo pozytywny jest niski „gender gap” w przyrodzie i matematyce. O ile przewaga dziewczyn w czytaniu ze zrozumieniem jest „regułą” w każdym kraju, o tyle stereotypowe postrzeganie chłopców jako lepszych z matematyki jest prawdziwe tylko w niektórych krajach. W Polsce ta różnica jest (średnio) mała.

* Z uwagi na sposób losowania uczniów do badania PISA, struktura uczniów w badaniu może być inna niż struktura uczniów w kraju. Aby uwzględnić te różnice, każdy uczeń ma wagę opisującą na ile jest on reprezentatywny dla całej populacji. Wszelkie średnie i frakcje są liczone z uwzględnieniem tych wag.

Konkurs ,,okładka” zakończony

1
2
set.seed(1313); sample(1:96, 4, replace=FALSE)
# [1] 85 37 67 46

W ten sposób wybrałem cztery z 96 maili otrzymanych w ramach konkursu okładkowego. Zdecydowałem się na cztery osoby zamiast wcześniej planowanych dwóch, ponieważ i liczba zgłoszeń i wartość zgłaszanych komentarzy znacznie przewyższyła moje oczekiwania. Bardzo dziękuję wszystkim za pomoc!

Wylosowane numerki należały do Dariusza P., Grzegorza S., Dominika M. i Marty M. Wylosowani powinny już otrzymać maila z pytaniem o adres do wysyłki.

Które okładki były wybierane?
Okładka A – 14, B – 15, C – 13, D – 10, E – 12, F – 32 razy.

Okładka F podobała się częściej, ale patrząc na całą pulę głosów zebrała tylko 1/3 wszystkich głosów.
Dużym zaskoczeniem był dla mnie brak jednego faworyta. Byłem przekonany, że osobie maczającej palce w tworzenie okładki trudno na chłodno ocenić, która jest lepsza od której (stąd apel o pomoc) ale, że istnieje ta jedna, która będzie się podobać większości (stąd nadzieja na wyłonienie faworyta w sondażu). To przekonanie zostało zderzone z wynikami eksperymentu.

Do druku wysłany zostanie projekt wykonany na bazie otrzymanych uwag. Mnie się on bardzo podoba, bardziej niż każda z wyjściowych propozycji, mam nadzieję, że i Wam się spodoba.

A na koniec kilka słów o historii, czyli o puchaczu z okładek pierwszego i drugiego wydania. Puchacz pojawia się na okładkach różnych książek o R, np. ,,R Cookbook” wydanego przez O’Reilly trzy lata po premierze ,,Przewodnika…’. Sama grafika z okładki to stereogram. Aby zobaczyć go w trzech wymiarach trzeba rozszczepić wzrok.
Jak zrobić taki stereogram? Oczywiście w R 😉

Poniżej przepis

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
 
w1 = rnorm(40,0,0.2) 
w2 = rnorm(40,0,0.2)
w3 = rnorm(40,0,0.2)
 
x = w1 - 0.01
y = w2/2 + 0.4
z = 0.5 -w3/ (1 + w1^2 + w2^2)
 
# puchacz z lewej
 
par(mar=c(0,0,0,0))
plot(c(-2,2),c(-0.2,2),type="n",xlab="",ylab="",bty="n",xaxt="n",yaxt="n")
 
xx = seq(-1.2,1.2,0.01)
lines(xx - (1 - xx^2)/25 + 1/50, 1-xx^6      ,lwd=3,col="grey90")
lines(xx - (1 - xx^2)/25 + 1/50, 1-xx^4      ,lwd=3,col="grey50")
lines(xx - (1 - xx^2)/25 + 1/50, 1-abs(xx^3) ,lwd=3,col="grey30")
lines(xx - (1 - xx^2)/25 + 1/50, 1-xx^2      ,lwd=3,col="grey20")
lines(xx - (1 - xx^2)/25 + 1/50, 1-abs(xx)   ,lwd=3,col="grey10")
 
curve(cos(30*x)/20, -0.75, -0.3,add=T, lwd=3,col="red")
curve(cos(30*x)/20, 0.75, 0.3,add=T, lwd=3,col="red")
 
text(0.55,0.35,expression(y==1-abs(x)),srt=-60, col="grey10")
text(0.63 + 0.01,0.47,expression(y==1-x^2),srt=-67, col="grey20")
text(0.9  + 0.02, 0.55,expression(y==1-x^6),srt=-80, col="grey50")
 
xt = x+z/25
 
points(xt,y, pch=19, cex=0.7)
#data.ellipse(x,y,add=T,plot.points=F,levels=c(0.4,0.85), center.cex=0)
 
# puchacz z prawej
 
par(mar=c(0,0,0,0))
plot(c(-2,2),c(-0.2,2),type="n",xlab="",ylab="",bty="n",xaxt="n",yaxt="n")
 
#arrows(-1.5,-0.2,-1.5,2,lwd=3,angle=15, length=0.5)
arrows(-1.5,0,-1.5,2,lwd=3,angle=15, length=0.5)
axis(2,line=-5.3,at=seq(0,1.6,0.02),labels=F,tcl=-0.3)
axis(2,line=-5.3,at=seq(0,1.6,0.1),labels=F,tcl=-0.5)
axis(2,line=-5.3,at=seq(0.2,1.6,0.2),labels=T,tcl=-0.8,las=2,cex.axis=0.8)
 
xx = seq(-1.2,1.2,0.01)
lines(xx + (1 - xx^2)/25 - 1/50, 1-xx^6      ,lwd=3,col="grey90")
lines(xx + (1 - xx^2)/25 - 1/50, 1-xx^4      ,lwd=3,col="grey50")
lines(xx + (1 - xx^2)/25 - 1/50, 1-abs(xx^3) ,lwd=3,col="grey30")
lines(xx + (1 - xx^2)/25 - 1/50, 1-xx^2      ,lwd=3,col="grey20")
lines(xx + (1 - xx^2)/25 - 1/50, 1-abs(xx)   ,lwd=3,col="grey10")
 
curve(cos(30*x)/20, -0.75, -0.3,add=T, lwd=3,col="red")
curve(cos(30*x)/20, 0.75, 0.3,add=T, lwd=3,col="red")
 
text(0.55,0.35,expression(y==1-abs(x)),srt=-60, col="grey10")
text(0.63 - 0.01,0.47,expression(y==1-x^2),srt=-67, col="grey20")
text(0.9  - 0.02, 0.55,expression(y==1-x^6),srt=-80, col="grey50")
 
xt = x-z/25
 
points(xt,y, pch=19, cex=0.7)
#data.ellipse(x,y,add=T,plot.points=F,levels=c(0.4,0.85), center.cex=0)

PISA 2012 – w jakich kategoriach poprawiliśmy nasze wyniki

Na początku grudnia opublikowano wyniki z badania PISA 2012, które dotyczyły umiejętności 15-latków z różnych krajów. Polscy uczniowie wypadli dobrze w tych badaniach, ale bardziej niż dobry wynik cieszy systematyczna (obserwowana przez ostatnie 12 lat) poprawa poziomu umiejętności.

Dziś napiszemy o tym w jakich obszarach umiejętności rosły najszybciej. Ale zanim napiszę o wynikach, kilka zdań o metodologii: Analizie poddamy 29 krajów które brały udział w badaniach PISA 2003 i PISA 2012. Te badania są odległe o 9 lat, oba skupione na matematyce, co znaczy że większość z pytań w tych dwóch edycjach dotyczyła matematyki.
Ponadto wybierzemy tylko te zadania, które rozwiązywano zarówno w teście z roku 2003 i z roku 2012. Czyli będziemy sprawdzać jak liczba poprawnych odpowiedzi na dokładnie to samo pytanie zwiększyła się po dziewięciu latach. Każde pytanie jest sklasyfikowane ze względu na dziedzinę wiedzy – czy pytanie dotyczy matematyki czy nauk przyrodniczych? Jeżeli matematyka, to czy to pytanie z algebry czy z rachunku prawdopodobieństwa? Jakich kompetencji to pytanie wymaga – szukania połączeń, czy reprodukcji?

Czytaj dalej PISA 2012 – w jakich kategoriach poprawiliśmy nasze wyniki

Konkurs a Przewodnik po pakiecie R, wydanie trzecie

Trzecie wydanie ,,Przewodnika po pakiecie R” będzie dostępne za kilka dni. W ostatniej chwili stwierdziłem, że warto zmienić projekt okładki. Projektant przygotował kilka propozycji, bardzo liczę na to, że pomożecie mi wybrać.

Co trzeba zrobić? Spośród poniższych sześciu okładek trzeba wybrać najlepszą [co by to nie znaczyło]. Następnie należy napisać do mnie maila która to, najlepiej z krótkim, jednozdaniowym uzasadnieniem.

Aby wysłać maila wystarczy kliknąć tutaj

Spośród osób, które wyślą maila z propozycją wylosuję dwa egzemplarze trzeciego wydania!
Powinny dotrzeć do szczęśliwych zwycięzców pod choinkę.
Konkurs jest otwarty do jutra (wtorku 10 grudnia) wieczorem.
Drukarnia czeka.

Odwoływać można się za pomocą liter A – C dla pierwszego rzędu (od lewej A do prawej C) i liter D – F dla drugiego rzędu (od lewej D do prawej F).


Dziś zaprezentowano pierwsze wyniki i dane z badania PISA 2012

W roku 2012 w ponad 70 gospodarkach (czasem miasta/regiony z jednego kraju traktowane są osobno, stąd nazwa gospodarka) przeprowadzono badanie PISA, polegające na testowaniu umiejętności matematycznych, czytania ze zrozumieniem i znajomości nauk przyrodniczych u 15 latków.

Dane te były analizowane przez spory zespół analityczny, a dziś o godzinie 11 czasu paryskiego upubliczniono pierwszą część danych i wyników.

Streszczenie wyników znaleźć można na stronie http://www.compareyourcountry.org/chart.php?project=pisa&page=0&cr=oecd&lg=pl (to wersja polskojęzyczna).

O szczegółowych wynikach będziemy jeszcze nie raz pisać na tym blogu.
Poczekam tylko aż opadną emocje, związane z porównywaniem pozycji w rankingach i przyjdzie czas na głębsze refleksje co się u nas zmienia.
Rosną aspiracje uczniów, rośnie średnia wyników, rozwarstwia się status socjoekonomiczny uczniów, co to oznacza?