Kobiety kochają matematykę

W poprzednim tygodniu w środę odbyły się Flaszki, o których pisałem między innymi w tym wpisie (lokalne wydarzenie w stylu TED talks). Dwa wystąpienia poświęcone były nierównościom w szansach na dobrą pracę w IT dla kobiet. Drugie z wystąpień prowadzone było przez Kamilę Sidor, współzałożycielkę założycielkę serwisu Geek Girls Carrots. Pytanie, będące szkieletem prezentacji, brzmiało ,,Dlaczego jest tak mało kobiet w IT?”. Padły liczby: wśród najlepszych uczniów z matematyki w szkole średniej 50% to kobiety, a w branży IT kobiet jest 10% [Alek J podesłał ten link z dyskusją nt. tego wystąpienia]. Hmmm, w mojej głowie zaszczepiło się pytanie.

W gronie kobiet które znam są zarówno takie, które spełniają się pracując w domu przy dzieciach, jak i takie, które są prezesami, dyrektorkami, czy naukowcami. To jednak może nie jest najbardziej reprezentatywna grupa, spójrzmy więc na szanse kobiet szerzej. W najbliższy czwartek będzie 8 marca, święto kobiet. Może jest to dobry czas by spojrzeć z boku na liczby dotyczące różnic w traktowaniu kobiet. Nie szukając w nich dowodów na poparcie lub odrzucenie jakiejś tezy.

Dzisiaj przyjrzę się liczbie kobiet w gronie finalistek olimpiady matematycznej, liczbie kobiet studiujących na Wydziale Matematyki i Informatyki Uniwersytetu Warszawskiego, kobietom w polityce i kobietom w nauce. Temat kobiet planowany jest tez na wpisy środowy i piątkowy, więc jeżeli znacie ciekawe statystyki/opracowania dotyczące tego tematu to podzielcie się nimi w komentarzach.

Kobiety w gronie finalistek Olimpiady Matematycznej

W różnych pozycjach książkowych przeczytać można o większych umiejętnościach matematycznych wśród chłopców. Czy jest to jednak wynikiem wyłącznie propagandy? Nie mamy żadnych możliwości oddzielenia wpływu umiejętności matematycznych związanych z płcią a wpływu z różnic w traktowaniu młodych chłopców i młodych dziewczynek. Pozostaje tylko zobaczyć jaki jest stan obecny i jaki trend obserwuje się w ostatnich latach. Najchętniej przyjrzałbym się wynikom z matur, ale nie mam do nich dostępu. Zobaczmy więc jak wyglądają sukcesy kobiet w finałach Olimpiady Matematycznej.

Na stronach Olimpiady Matematycznej, można znaleźć listy finalistów z kolejnych lat wraz z informacją jaką szkołę finaliści reprezentują. Te dane zostały przetworzone, w wyniku czego dodałem nowy zbiór danych oraz wykonałem poniższą wizualizację.

[Rysunek 1. Podsumowanie obecności kobiet wśród finalistek Olimpiady Matematycznej. Górny wykres przedstawia udział kobiet w gronie finalistek z różnych województw. Procent kobiet wśród finalistek waha się od 1.4% do 17.8% czyli dosyć znacząco, ale trudno znaleźć wyraźny wzorzec przestrzenny, tłumaczący te różnice w udziale finalistek. Lewy dolny obrazek przedstawia zależność pomiędzy wielkością miasta a procentem kobiet wśród finalistów z tego miasta. Wielkość mierzona jest liczbą finalistów. Zauważyć można tendencję, że im większe miasto tym większy procent finalistów to kobiety. Niewielu jednak miastom udaje się przekroczyć 10% udziału kobiet. Ostatni wykres pokazuje procent kobiet w gronie finalistek jako funkcję roku w którym olimpiada miała miejsce. Zaznaczono trend liniowy jak i zastosowano lokalne wygładzanie.]

Patrząc na te wyniki zauważyć można dwie rzeczy. Po pierwsze zdecydowana większość finalistów to mężczyźni, kobiet wśród finalistów jest obecnie około 6-8%. Po drugie z czasem procent kobiet wzrasta, podobnie procent kobiet wśród finalistów wzrasta wraz z wielkością miasta, które reprezentują. Co sugeruje uwalnianie się potencjału kobiet tam gdzie indoktrynacja jest prawdopodobnie mniejsza. Do jakiej wartości można ,,dojść” mam nadzieję że się okaże.

Kobiety w gronie studentów Wydziału Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego

Zobaczmy teraz ile kobiet spotkamy wśród studentów na wydziale MIM UW. Dobry wydział na dobrej uczelni, dwa kierunki: matematyka i informatyka.

[Rysunek 2. Procent studentek wśród wszystkich studiujących na wydziale MIMUW, jako funkcja roku urodzenia. Dorysowano krzywą regresji liniowej aby podkreślić trend.]

Procent kobiet wśród studentów rośnie z czasem. Kryteria przyjęcia są takie same dla obu płci, więc zmieniające się proporcje świadczą o rosnącym zainteresowaniu kobiet studiowaniem matematyki i informatyki na solidnym poziomie.

Oczywiście procent kobiet wśród studentów różni się pomiędzy tymi dwom kierunkami. Ponieważ program studiów na wydziale MIMUW jest bardzo elastyczny, trudno jest jednoznacznie policzyć udział kobiet wśród studentów matematyki i informatyki osobno (są studia jednoczesne, ludzie się przepisują itp). Z grubsza na informatyce udział kobiet to małe kilkanaście procent a na matematyce jest to ponad 30%. Ale jak pisałem dokładne liczby trudno przytoczyć bez bezpośredniego dostępu do USOSa.

Kobiety wśród posłów VI kadencji Sejmu RP

Można zapytać, czy 25% kobiet w ostatnich rekrutacjach na wydział MIMWU to dużo czy mało. Porównajmy ją z udziałem kobiet w Sejmie VI kadencji.

Tutaj pozwolę sobie na mały komentarz. Określenie płci jest proste na podstawie imienia. Zazwyczaj wystarczy sprawdzić czy ostatnia litera imienia to 'a’. Popularnie wymieniane wyjątki to Bonawentura i Maria, tak więc w przypadku posłanek należy do tej reguły dopisać jeszcze jeden wyjątek, mianowicie Nelli.

W sejmie mamy więc 95 kobiet i 355 mężczyzn co daje 21% udziału kobiet w sejmie. Przypomnijmy, że wprowadzony półtora roku temu parytet wymagał by na listach wyborczych znajdowało się przynajmniej 35% kobiet.

Tak więc pomimo parytetu, w sejmie jest procentowo mniej kobiet niż wśród studentek matematyki i informatyki! 

Kobiety wśród ekspertów NCN

Jakiś czas temu przedstawialiśmy analizę listy ekspertów oceniających wnioski w konkursach na granty dla naukowców. Eksperci powinni być przedstawicielami najlepszych naukowców z różnych dziedzin. Wśród ekspertów NCN z roku 2011 kobiet było 109 a mężczyzn 406. Co daje 21% udziału kobiet wśród reprezentantów najlepszych naukowców.

Kobiety wśród moich dyplomantów

Od kilku lat prowadzę Pracownią Analiz Statystycznych i Konsultingu (PASIK, link tutaj) w ramach której studenci piszą u mnie pracę dyplomowe. Jaki procent z dyplomantów to kobiety?
Okazuje się, że 72%.  I jest to wynik najbliższy 50% ze wszystkich liczb przedstawionych w tym wpisie.

 

Kim są eksperci z Narodowego Centrum Nauki? Część 3

Wczoraj przedstawiłem rozkłady liczby cytowań i liczby publikacji dla ekspertów NCN z różnych dziedzin. Aplikacja ,,Publish or Perish” liczy wiele różnych interesujących współczynników. Dziś pokażę rozkłady dwóch popularnych współczynników, czyli h-indeks oraz średniej liczby autorów na publikację dla ekspertów.

 
Lista dziedzin w porządku określonym przez liczbę ekspertów (linki do poniższych wykresów):
biologia, nauki chemiczne, fizyka, medycyna, informatyka, ekonomia, nauki weterynaryjne, nauki historyczne, automatyka i robotyka, nauki prawne, nauki filologiczne, mechanika, matematyka, biologia medyczna, nauki medyczne, geografia, geologia, nauki filozoficzne, nauki farmaceutyczne, socjologia, inzynieria materialowa, technologia chemiczna, nauki o sztukach pieknych, zootechnika, psychologia, pedagogika, naukiopolityce, inzynieria i ochrona srodowiska, budowa i eksploatacja maszyn, organizacja i zarzadzanie, agronomia, telekomunikacja, technologia zywnosci i zywienia, astronomia, nauki teologiczne.

Kim są eksperci z Narodowego Centrum Nauki? Część 2

Dwa dni temu w tym wpisie opisałem zbiór danych który zebrałem by zobaczyć kim są eksperci oceniający wnioski w ramach konkursu NCN z roku 2011. Dzisiaj na wykresach pokażę liczby publikacji i liczby cytowań w podziale na dziedziny.

Każdy z poniższych wykresów odpowiada jednej dziedzinie wymienionej w bazie danych Ludzie Nauki. Na wykresie przedstawiono charakterystyki ekspertów z danej dziedziny. Każdy punkt odpowiada jednemu ekspertowi, punkty mogą mieć różne kształty oraz różne kolory.

Kształt punktu zależy od tego czy ekspert jest inżynierem czy nie, inżynierów oznaczyłem trójkątami, nie inżynierów kołami.

Kolor punktu odpowiada identyfikowalności eksperta. Problemy z identyfikacją mogą mieć dwa źródła. Pierwsze poważniejsze, dotyczy około 4% przypadków, gdy istnieją przynajmniej dwa różne wpisy w bazie danych Ludzie Nauki wskazujące na osoby o tym samym imieniu, nazwisku i stopniu/tytule naukowym. Nie sposób odgadnąć która z tych osób jest naszym ekspertem, więc do analiz włączone są wszystkie ,,możliwe osoby”. Zwiększa to liczbę osób nieznacznie. Drugi problem dotyczy bazy danych ,,Publish or Perish”. Jeżeli istnieją przynajmniej dwie osoby o tym samym imieniu i nazwisku to niesposób automatycznie rozróżnić ich dorobków. Dla takiej grupy osób policzyć można jedynie sumę wszystkich publikacji i sumę wszystkich cytowań. Bardzo często zdarza się, że eksperta udało się dokładnie zidentyfikować po stopniu/tytule naukowym ale nie udało się oddzielić publikacji imienników. Na czarno i jasno-czerwono zaznaczeni są eksperci, którzy na podstawie bazy Ludzie Nauki mają unikatową kombinację imienia i nazwiska. Na szaro i ciemno-czerwono eksperci dla których jest więcej niż jeden wpis, przez co potencjalnie ich charakterystyki zostały błędnie zawyżone przez połączenie wyników różnych osób.

Kolorem jasno/ciemno-czerwonym zaznaczono kobiety, kolorem czarnym/szarym mężczyzn. W przypadku kobiet, wiele z nich ma podwójne nazwisko, co też może wpłynąć na statystyki cytowań i publikacji, dane te należy traktować poglądowo.

Zielonymi przerywanymi liniami zaznaczam mediany dorobku ekspertów, których udało się jednoznacznie zidentyfikować.

Update: ponieważ otrzymałem informacje, że rysunki w formacie svg nie u wszystkich poprawnie się wyświetlają, więc zamieniłem je na png, po kliknięciu otworzą się rysunki w postaci wektorowej.

 
Lista dziedzin w porządku określonym przez liczbę ekspertów (linki do poniższych wykresów):
biologia, nauki chemiczne, fizyka, medycyna, informatyka, ekonomia, nauki weterynaryjne, nauki historyczne, automatyka i robotyka, nauki prawne, nauki filologiczne, mechanika, matematyka, biologia medyczna, nauki medyczne, geografia, geologia, nauki filozoficzne, nauki farmaceutyczne, socjologia, inzynieria materialowa, technologia chemiczna, nauki o sztukach pieknych, zootechnika, psychologia, pedagogika, nauki o polityce, inzynieria i ochrona srodowiska, budowa i eksploatacja maszyn, organizacja i zarzadzanie, agronomia, telekomunikacja, technologia zywnosci i zywienia, astronomia, nauki teologiczne.

Kim są eksperci Narodowego Centrum Nauki?

Pieniędzy na naukę w Polsce jest mało (jeżeli porównać z zachodnimi sąsiadami), dlatego dzielenie tych pieniędzy budzi zazwyczaj emocje i burzliwe dyskusje. W przypadku pierwszego konkursu grantowego organizowanego przez NCN (Narodowe Centrum Nauki) tych emocji było sporo, krytykowano miedzy innymi wybór recenzentów i ekspertów. Tak się złożyło, że NCN nie ujawniło listy recenzentów ale ,,prawie” ujawniło listę ekspertów. Piszę ,,prawie” ponieważ lista ekspertów przedstawiona na tej stronie jest bez podziału na panele, przez co mało użyteczna. W prasie znaleźć można pojedyncze głosy (jak np ten) przekonujące czytelnika, że eksperci mają znaczący dorobek, ale te informacje dotyczą jednego panelu i bez nazwisk trudno je zweryfikować.

Więc plan na ten tydzień to przyjrzenie się bliżej ekspertom NCN. Nie mam zamiaru oceniać osób, ponieważ w wielu przypadkach ich dorobek jest o rząd lub rzędy wielkości większy niż mój, chciałbym jedynie pokazać jak wygląda dorobek ekspertów z rożnych dziedzinach. Ponieważ dane zbierane były automatycznie więc podczas zbierania zdarzyć się mogło, że komuś niedoszacowano albo przeszacowano. Dlatego nie ma sensu oceniać jednostek, ale można przyjrzeć się całej populacji. Mam nadzieję, że informacje o dorobku ekspertów będą użyteczne nie tylko w kontekście konkursów NCN, ale też młodym ludziom dadzą wyobrażenie jak wyglądają dorobki osób w kraju uznanych. Koniec końców, do wykonania tych wizualizacji użyłem danych z trzech źródeł, z których każde starało się dostęp do danych ograniczyć, więc samo wyciąganie danych było dobrą zabawą.

Skąd są dane ?

Informacje o imionach i nazwiskach ekspertów wyciągnięte są z tego dokumentu.

Aby nie analizować ekspertów z różnych dziedzin w jednym worku z bazy danych Ludzie Nauki OPI wyciągnąłem informację o dziedzinie w której pracują eksperci (około 4% osób nie udało mi się jednoznacznie zidentyfikować ponieważ kilka osób ma identyczne imię, nazwisko i tytuł). Należy podkreślić, że dziedzina wskazana w bazie OPI nie musi mieć nic wspólnego z panelem w którym ekspert zasiadał. Dzięki podziałowi na dziedziny unikniemy mieszania humanistów ze ścisłowcami.

Mała modyfikacja programu Publish or Perish (zobacz tutaj) pozwoliła na ściągnięcie informacji o g-liczbie cytowań, g-liczbie publikacji i g-h-indeksie oszacowanych na bazie Google Scholar. Piszę g-* ponieważ ta wyszukiwarka ma tendencje do zawyżania wskaźników. Jest jednak łatwym do weryfikacji punktem odniesienia.

Co w danych piszczy?

Dzisiejszy wpis to rozgrzewka opisująca jakie dane są zebrane. Dzisiaj będzie mnie interesowało to jaki stopień naukowy i jakie dziedziny znajdziemy wśród ekspertów. Przyszłe analizy liczby cytowań i h-indeksu będziemy przeprowadzać osobno dla każdej z dziedzin.

Rozkład stopni naukowych wśród ekspertów jest następujący:
prof. dr hab. (298), dr hab. (87), prof. dr hab. inz. (76), dr hab. inz. (26), dr (13), ks. dr hab. (3), dr inz. (3), prof. (2), ks. prof. dr hab. (2), przew. kwal. II (1), prof. przew. kwal. II (1), prof. dr inz. (1), prof. dr hab. przew. kwal. I (1), o. prof. dr hab. 1.
Zobaczmy jak te liczby wyglądają w rozbiciu na dziedziny.

[Update: Przedstawiona jest poniżej wersja rastrowa, po kliknięciu na wykres otworzy się wersja wektorowa, skalowalna, znacznie lepiej wyglądająca.]

Rysunek 1. Dziedziny w których pracują eksperci NCN. W kolejnych wierszach przedstawiono dziedziny KBN w których pracują eksperci. Ponieważ są eksperci pracujący w kilku dziedzinach, więc suma wszystkich liczb w nawiasach jest większa niż liczba ekspertów. Najczęściej współwystępujące pary dziedzin połączone są linią po prawej stronie. Po lewej stronie kolorami oznaczono skład tytułów i stopni ekspertów z danej dziedziny. Jaśniejsze kolory odpowiadają osobom bez inżyniera, ciemniejsze osobom z inżynierem. Osoby ,,tylko” z habilitacją są zaznaczane na zielono, profesorowie na niebiesko.

Wszystkich dziedzin jest sporo, ale dla części jest niewielu reprezentantów, przez co w dalszych analizach skoncentrujemy się na najliczniejszych dziedzinach do socjologi włącznie.

Dziś pokażę jeszcze rozkład płci ekspertów w każdej z dyscyplin.

Rysunek 2. Rozkład płci ekspertów NCN w rozbiciu na dziedziny.