Czy Jaś do Zuzi ma się tak jak John do Susan? Czyli o różnicach i brakach różnic.

 

W poniedziałkowym wpisie pisałem o tym jaki procent kobiet można spotkać w finałach OM, na wydziale MIMUW, w sejmie lub w gronie ekspertów NCN. Temat, który pojawił się w komentarzach do tego wpisu to linki do raportów o średnio równych lub lepsze wynikach kobiet w testach gimnazjalnych i średnio niższych zarobkach w branży IT (i pewnie wielu innych).

Dzisiaj napiszę kilka zdań nt. różnic pomiędzy wynikami chłopców i dziewcząt w różnych testach. Nazwa ‘efekt płci’ jest być może myląca, ponieważ nie jest oczywiste czy różnice które się pojawią są konsekwencją samej płci i związanej z nią biologii, czy też różnicom w traktowaniu, wychowaniu, motywowaniu do nauki itp.

Plan jest następujący: Pokażę wyniki z testów gimnazjalnych, ponarzekam na złą prezentacje graficzną tych wyników i nadużywanie nieszczęsnej, niczego nie mówiącej średniej. Porównam te wyniki z wynikami testu SAT, który zdaje w Ameryce wielu 17-18 latków, przetłumaczę kilka interesujących komentarzy różnych badaczy studiujących temat różnic w osiągach w edukacji. Okazuje się bowiem, że jest to bardzo gorący temat i z olbrzymiej liczby dostępnych publikacji można wyłowić czasem bardzo rozbieżne wyniki.

Testy podsumowujące gimnazjum

Zaczniemy od wyników z raportu Centralnej Komisji Egzaminacyjnej z roku 2011 podsumowującego wyniki gimnazjalistów kończących edukację w gimnazjum, a więc osób średnio w wieku 16 lat. Raport jest bardzo rozbudowany, ale na nasze potrzeby przyjrzymy się wynikom z części humanistycznej i z części matematyczno-przyrodniczej przytaczając wyniki w rozbiciu na płeć.

 

[Rysunek 1. Procent uczniów, którzy uzyskali określoną liczbę punktów z części humanistycznej w podziale na płcie. Ewidentnie dziewczęta maja średnio wyższą liczbę punktów niż chłopcy]

[Rysunek 2. Procent uczniów, którzy uzyskali określoną liczbę punktów z części matematyczno-przyrodniczej w podziale na płcie. Na pierwszy rzut oka nie widać różnic. Średni wynik dziewcząt jest wyższy niż średni wynik chłopców.]

Dodatkowo w raporcie przedstawione są średnie wyniki testu dla dziewcząt i chłopców. Średnie wyniki dla dziewczynek są wyższe w obu częsciach, dla testu humanistycznego znacząco, dla testu matematyczno-przyrodniczego nieznacznie.

Jest kilka interesujących kwestii związanych z wynikami testów gimnazjalnych, przedstawię je w punktach.

  • Rozkład ocen. W przypadku wyników z części humanistycznej rozkład dla każdej z płci przypomina krzywą Gaussa, co sugeruje jednorodną populację w której końcowy wynik to składowa wielu niezależnych czynników, które się ma lub nie ale w sumie wychodzi taki symetryczny dzwon. W części matematycznej jest inaczej. Brak Gaussowskości, brak symetrii może wynikać z tego że populacja jest niejednorodna (grupy osób w rożnym stopniu pracujących nad matematyką) albo z tego, że czynniki które się sumuje nie są niezależne. Która z tych przyczyn ma miejsce można sprawdzić jedynie mając odpowiedzi cząstkowe, więc na razie tego tematu nie będę rozwijał.
  • Sposób porównywania rozkładów. Do porównywania rozkładów wyników autorzy raportu zdecydowali się na porównywanie gęstości. Może one i ładnie wyglądają na rysunku, ale ich użyteczność jest praktycznie zerowa. W przypadku wyników z części humanistycznej przewaga dziewcząt jest tak wyraźna, że jak by jej nie przedstawić byłoby ją widać. Ale w części matematyczno-przyrodniczej sposób prezentacji uniemożliwia porównanie tego co ciekawe. I tutaj pojawia się pytanie co może być ciekawe.
    •  Jedną z ciekawych rzeczy to która płeć na częściej najgorsze wyniki. Np. spójrzmy na 5% gimnazjalistów o najgorszych wynikach – te osoby powinny nie są gotowe by żyć w świecie liczb, może koedukacja nie jest dobra, może należy te osoby inaczej uczyć – i zobaczmy która płeć tam dominuje. Dokładnie nie da się tych proporcji odczytać, ale wygląda na to, że wśród najgorszych gimnazjalistów z egzaminu matematyczno-przyrodniczego jest więcej chłopców.
    • Drugą ciekawą informacją to która płeć ma najlepsze wyniki. Spójrzmy na 5% gimnazjalistów o najlepszych wynikach – te osoby mają szansę zostać głównymi architektami, projektantami, budowniczymi itp, zobaczmy która płeć tu dominuje. Z wykresu nie da się odczytać dokładnie  tych proporcji odczytać, ale wygląda na to, że wśród najlepszych gimnazjalistów z egzaminu matematyczno-przyrodniczego jest więcej chłopców.
  • W obu powyższych przypadkach te różnice nie są duże, ale pokazują, że patrzenie na średnie albo porównywanie gęstości to nie jest najlepsze rozwiązanie. Lepiej byłoby pokazywać kwantyle lub dystrybuanty. Może dystrybuanta nie wygląda równie ładnie graficznie, ale interesujących informacji niesie więcej.

Testy SAT MATH

Zobaczmy jak wyglądają wyniki z egzaminów w Ameryce. Ameryka to dobry przykład ponieważ po pierwsze tam wszystko jest mierzone a po drugie jest tam sporo osób, które potrafią mierzyć i potrafią z pomiarów wyciągać wnioski.
Najczęściej przedstawianymi w literaturze wynikami są wyniki z egzaminów SAT (zgodnie z wikipedią ta nazwa była kiedyś skrótem ale już nie jest, jest pustym akronimem, dlatego jej nie rozwijam). Ten test robi się najczęściej w wieku 17-18 lat, nie jest obowiązkowy w skali kraju ale jest wymagany podczas przyjęcia na wiele uczelni. Dla mnie wyniki z tego testu są o tyle interesujące, że różnią się znacząco od wyników z testów gimnazjalnych w Polsce. Zobaczmy wyniki części matematycznej testu SAT
[Rysunek 3. Średnie wyniki testu SAT MATH w kolejnych latach dla kobiet i mężczyzn. Na podstawie An Empirical Analysis of the Gender Gap in Mathematics. Wybór skali jest tendencyjny, możliwe do uzyskania wartości to od 0 do 600.]
Na wynikach testu SAT MATH widać znacznie wyższe wyniki mężczyzn niż kobiet. Czym różnią się porównywane populacje polskich gimnazjalistów i amerykańska?
  • wiekiem. Gimnazjaliści robią test dwa lata wcześniej. Dwa lata to nie jest dużo dla dorosłych, ale akurat tutaj trafimy w okres dojrzewania, który u dziewczynek jest w 9-16 roku życia a u chłopców w 10-18 roku życia. Dojrzewanie może mieć to znaczący wpływ na wyniki, bez dodatkowych informacji nie jesteśmy jednak go w stanie uwzględnić.
  • powszechnością wykonywania testu. Test gimnazjalny zdają wszyscy gimnazjaliści, więc praktycznie cała młodzież. Test SAT wykonują osoby planujące dalszą edukację, co w stanach oznacza, osoby bardzo dobre albo mające pieniądze na dalszą edukację.
  • jednorodnością populacji. Populacja w Polsce jest bardziej jednorodna genetycznie niż w populacja w Ameryce.
  • kultura, klimat itp.
Ciekawą dyskusję przeprowadzono tutaj na temat efektu powszechności testu. Tzn. część badaczy uważała, że wyniki pomiędzy kobietami a mężczyznami w teście SAT można wyjaśnić tym, że mniej kobiet ten test zdaje. Tymczasem jest odwrotnie. Tz kiedyś proporcje kobiet do mężczyzn zdających test SAT były bardziej równe niż teraz ale też średnie różnice w wynikach były kiedyś bardziej różne niż są teraz.
Narzekałem sporo na średnie, później chwaliłem ludzi zza oceany, że potrafią oni liczyć a tym czasem prezentuję średnie dla wyniku SAT MATH. Ok, czas na poprawę.
W artykule The Gender Gap in Secondary School Mathematics at High Achievement Levels porównywane są wyniki testu SAT z wynikami bardziej wymagających testów, mianowicie konkursów matematycznych organizowanych przez ACM. Po drugie, zamiast patrzeć na średnie, porównuje się udział kobiet w grupie osób mających x% najlepszych wyników.
Tak się to robi!
Zobaczmy wykres
[Rysunek 4. Udział kobiet (os OY) w grupie osób o x% najlepszych wyników (oś OX). Na podstawie artykułu tutaj]
Z rysunku 4 można odczytać trend im wyżej odcinamy tym więcej mężczyzn będzie w odciętej grupie. Czy taki podobny trend obserwuje się w wynikach z gimnazjów nie wiadomo, ponieważ tam badacze zdecydowali się na pokazywanie gęstości.

Podsumowanie

Chciałbym dostać się jakoś do wyników z gimnazjum i z matur, może jesteście w stanie jakoś mi pomóc?
Ciekawe byłoby porównanie wyników z testu gimnazjalnego i wyników z matur.
Ciekawe byłoby też określenie jak motywacja do nauki wpływa na wyniki, i czy można zidentyfikować efekt motywowania dziecka do nauki.

Ważny komentarz

Porównywanie rozkładów wyników to ciekawe zadanie dotyczące dużych populacji. Może być użyteczne w planowaniu systemu edukacji (np. zasadności koedukacji). Nie należy jednak przeceniać tych efektów gdy mówi się o jednostkach. To, że jest większa obecność mężczyzn w grupie osób, które mają wysokie wyniki SAT MATH nie miało wpływu na fakt, że jedyną osoba z dwoma nagrodami Nobla w dwóch różnych dziedzinach nauk przyrodniczych jest kobieta Maria Skłodowska-Curie. To, że kobiety mają więcej punktów z części humanistycznej nie miało wpływu na fakt, że najlepszym polskim poetą jest mężczyzna Zbigniew Herbert*.

 

* Oczywiście w przypadku poetów jest to zupełnie subiektywne odczucie.

Kobiety kochają matematykę

W poprzednim tygodniu w środę odbyły się Flaszki, o których pisałem między innymi w tym wpisie (lokalne wydarzenie w stylu TED talks). Dwa wystąpienia poświęcone były nierównościom w szansach na dobrą pracę w IT dla kobiet. Drugie z wystąpień prowadzone było przez Kamilę Sidor, współzałożycielkę założycielkę serwisu Geek Girls Carrots. Pytanie, będące szkieletem prezentacji, brzmiało ,,Dlaczego jest tak mało kobiet w IT?”. Padły liczby: wśród najlepszych uczniów z matematyki w szkole średniej 50% to kobiety, a w branży IT kobiet jest 10% [Alek J podesłał ten link z dyskusją nt. tego wystąpienia]. Hmmm, w mojej głowie zaszczepiło się pytanie.

W gronie kobiet które znam są zarówno takie, które spełniają się pracując w domu przy dzieciach, jak i takie, które są prezesami, dyrektorkami, czy naukowcami. To jednak może nie jest najbardziej reprezentatywna grupa, spójrzmy więc na szanse kobiet szerzej. W najbliższy czwartek będzie 8 marca, święto kobiet. Może jest to dobry czas by spojrzeć z boku na liczby dotyczące różnic w traktowaniu kobiet. Nie szukając w nich dowodów na poparcie lub odrzucenie jakiejś tezy.

Dzisiaj przyjrzę się liczbie kobiet w gronie finalistek olimpiady matematycznej, liczbie kobiet studiujących na Wydziale Matematyki i Informatyki Uniwersytetu Warszawskiego, kobietom w polityce i kobietom w nauce. Temat kobiet planowany jest tez na wpisy środowy i piątkowy, więc jeżeli znacie ciekawe statystyki/opracowania dotyczące tego tematu to podzielcie się nimi w komentarzach.

Kobiety w gronie finalistek Olimpiady Matematycznej

W różnych pozycjach książkowych przeczytać można o większych umiejętnościach matematycznych wśród chłopców. Czy jest to jednak wynikiem wyłącznie propagandy? Nie mamy żadnych możliwości oddzielenia wpływu umiejętności matematycznych związanych z płcią a wpływu z różnic w traktowaniu młodych chłopców i młodych dziewczynek. Pozostaje tylko zobaczyć jaki jest stan obecny i jaki trend obserwuje się w ostatnich latach. Najchętniej przyjrzałbym się wynikom z matur, ale nie mam do nich dostępu. Zobaczmy więc jak wyglądają sukcesy kobiet w finałach Olimpiady Matematycznej.

Na stronach Olimpiady Matematycznej, można znaleźć listy finalistów z kolejnych lat wraz z informacją jaką szkołę finaliści reprezentują. Te dane zostały przetworzone, w wyniku czego dodałem nowy zbiór danych oraz wykonałem poniższą wizualizację.

[Rysunek 1. Podsumowanie obecności kobiet wśród finalistek Olimpiady Matematycznej. Górny wykres przedstawia udział kobiet w gronie finalistek z różnych województw. Procent kobiet wśród finalistek waha się od 1.4% do 17.8% czyli dosyć znacząco, ale trudno znaleźć wyraźny wzorzec przestrzenny, tłumaczący te różnice w udziale finalistek. Lewy dolny obrazek przedstawia zależność pomiędzy wielkością miasta a procentem kobiet wśród finalistów z tego miasta. Wielkość mierzona jest liczbą finalistów. Zauważyć można tendencję, że im większe miasto tym większy procent finalistów to kobiety. Niewielu jednak miastom udaje się przekroczyć 10% udziału kobiet. Ostatni wykres pokazuje procent kobiet w gronie finalistek jako funkcję roku w którym olimpiada miała miejsce. Zaznaczono trend liniowy jak i zastosowano lokalne wygładzanie.]

Patrząc na te wyniki zauważyć można dwie rzeczy. Po pierwsze zdecydowana większość finalistów to mężczyźni, kobiet wśród finalistów jest obecnie około 6-8%. Po drugie z czasem procent kobiet wzrasta, podobnie procent kobiet wśród finalistów wzrasta wraz z wielkością miasta, które reprezentują. Co sugeruje uwalnianie się potencjału kobiet tam gdzie indoktrynacja jest prawdopodobnie mniejsza. Do jakiej wartości można ,,dojść” mam nadzieję że się okaże.

Kobiety w gronie studentów Wydziału Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego

Zobaczmy teraz ile kobiet spotkamy wśród studentów na wydziale MIM UW. Dobry wydział na dobrej uczelni, dwa kierunki: matematyka i informatyka.

[Rysunek 2. Procent studentek wśród wszystkich studiujących na wydziale MIMUW, jako funkcja roku urodzenia. Dorysowano krzywą regresji liniowej aby podkreślić trend.]

Procent kobiet wśród studentów rośnie z czasem. Kryteria przyjęcia są takie same dla obu płci, więc zmieniające się proporcje świadczą o rosnącym zainteresowaniu kobiet studiowaniem matematyki i informatyki na solidnym poziomie.

Oczywiście procent kobiet wśród studentów różni się pomiędzy tymi dwom kierunkami. Ponieważ program studiów na wydziale MIMUW jest bardzo elastyczny, trudno jest jednoznacznie policzyć udział kobiet wśród studentów matematyki i informatyki osobno (są studia jednoczesne, ludzie się przepisują itp). Z grubsza na informatyce udział kobiet to małe kilkanaście procent a na matematyce jest to ponad 30%. Ale jak pisałem dokładne liczby trudno przytoczyć bez bezpośredniego dostępu do USOSa.

Kobiety wśród posłów VI kadencji Sejmu RP

Można zapytać, czy 25% kobiet w ostatnich rekrutacjach na wydział MIMWU to dużo czy mało. Porównajmy ją z udziałem kobiet w Sejmie VI kadencji.

Tutaj pozwolę sobie na mały komentarz. Określenie płci jest proste na podstawie imienia. Zazwyczaj wystarczy sprawdzić czy ostatnia litera imienia to ‘a’. Popularnie wymieniane wyjątki to Bonawentura i Maria, tak więc w przypadku posłanek należy do tej reguły dopisać jeszcze jeden wyjątek, mianowicie Nelli.

W sejmie mamy więc 95 kobiet i 355 mężczyzn co daje 21% udziału kobiet w sejmie. Przypomnijmy, że wprowadzony półtora roku temu parytet wymagał by na listach wyborczych znajdowało się przynajmniej 35% kobiet.

Tak więc pomimo parytetu, w sejmie jest procentowo mniej kobiet niż wśród studentek matematyki i informatyki! 

Kobiety wśród ekspertów NCN

Jakiś czas temu przedstawialiśmy analizę listy ekspertów oceniających wnioski w konkursach na granty dla naukowców. Eksperci powinni być przedstawicielami najlepszych naukowców z różnych dziedzin. Wśród ekspertów NCN z roku 2011 kobiet było 109 a mężczyzn 406. Co daje 21% udziału kobiet wśród reprezentantów najlepszych naukowców.

Kobiety wśród moich dyplomantów

Od kilku lat prowadzę Pracownią Analiz Statystycznych i Konsultingu (PASIK, link tutaj) w ramach której studenci piszą u mnie pracę dyplomowe. Jaki procent z dyplomantów to kobiety?
Okazuje się, że 72%.  I jest to wynik najbliższy 50% ze wszystkich liczb przedstawionych w tym wpisie.

 

Wizualizacja budżetu NFZ na rok 2012

Jakiś czas temu dostałem od Krzyśka  T. bogaty zbiór linków do zbiorów danych dotyczących służby zdrowia. Jeden z tych linków prowadził do serwisu dla lekarzy http://www.medicamo.pl, na którym w sekcji do pobrania znajduje się sporo interesujących zbiorów danych i opracowań.

Jeden ze zbiorów danych to plan finansowy narodowego funduszu zdrowia na rok 2012. Ponieważ wizualizacja budżetów to ciekawy temat stwierdziłem, że przedstawię graficznie ten plan, może coś ciekawego uda się w nim zobaczyć. Wolałbym przedstawić graficznie budżet na naukę, ale niestety nie udało mi się znaleźć tego budżetu w formacie, który nadawałby się do obróbki (jedynie źle sformatowany pdf).

Tak więc bierzemy ten zbiór danych, do wizualizacji wykorzystamy interaktywny moduł Bubble Tree z pakietu oprogramowania opracowanego przez http://www.openspending.org/ (warto spojrzeć na tę stronę, bo jest tam wiele ciekawych wizualizacji różnych budżetów).

Kliknięcie na poniższy obrazek otworzy interaktywną wizualizację. Po jej otwarciu interesujący podział można uzyskać klikając ‘Koszty realizacji zadań’ -> ‘Koszty świadczeń zdrowotnych’.


Pewnie interesuje was, a gdzie w tym jest R?
Otóż Bubble Tree oczekuje opisu budżetu w formacie json, w tym przypadku R był wykorzystany by zamienić opis w pliku xls na json.