W tym artykule Polityki przeczytałem, że ponad 3 tysiące uczniów nie dostało się do żadnej z wybranych szkół średnich w Warszawie. Pomimo wysiłku szkół by przyjąć możliwie wielu uczniów.
Marcin Luckner (MiNI PW) przesłał mi ciekawą analizę progów punktowych w różnych oddziałach w Warszawie. Poniżej umieszczam wybrane wykresy po drobnych zmianach. Dane pochodzą z serwisu edukacja.warszawa.pl. Przy okazji też będziemy mogli porównać kilka sposobów pokazywania rozkładów.
W powyższych danych znajduje się informacja ile punktów było potrzeba aby dostać się do wskazanego oddziału we wskazanej szkole średniej. W rozbiciu na typ szkoły i na to czy rekrutowały się dzieci z podstawówek czy gimnazjów.
Poniższy wykres (histogram) pokazuje jak wyglądają progi punktowe w różnych typach oddziałów. Na wykresie nie ma szkół sportowych, ponieważ tam były dodatkowe punkty sprawnościowe i trudno te progi porównać.
W różnych mediach można znaleźć informację o uczniu, który miał 190 punktów i nie dostał się do żadnej wybranej szkoły. Ale były też szkoły, które miały znacznie niższe progi przyjęcia. Bardzo wiele oddziałów miało progi przyjecia w okolicy 160 punktów.
John Tukey lata temu zaproponował by rozkłady opisywać za pomocą piątki liczb – min, max, mediana i kwartyle. To 5 liczb które dzieli wartości na 4 równe przedziały. Można je pokazać za pomocą wykresów pudełkowych.
Poniżej mamy wykresy pudełkowe z rozkładem progów punktowych podziałem na dzielnice. Im szersze pudełko tym więcej szkół jest w danej grupie. Najwyższe progi były w szkołach w Śródmieściu (ponad połowa oddziałów miała próg przyjęcia powyżej 165 punktów). łatwiej było się dostać do szkół średnich na Pradze czy w Ursusie.
Okazuje się, że i moją i Marcina ulubioną techniką pokazywania rozkładów jest dystrybuanta empiryczna. Wykres poniżej pokazuje jaki procent oddziałów ma prób przyjęcia mniejszy niż x.
Przykładowo szara linia odpowiada progowi 150 punktów. Tyle punktów wystarczyły by dostać się do praktycznie wszystkich oddziałów integracyjnych, ale już tylko do około 60% oddziałów ogólnych (1 na 3 oddziały ogólne ma wyższy prób punktowy), do około 33% oddziałów w szkołach dwujęzycznych (2 na 3 oddziały w szkołach dwujęzycznych ma wyższy próg przyjęcia). Nie wystarczy na szkoły z międzynarodową maturą.
To jaki jest Wasz ulubiony sposób pokazywania rozkładów?
Warto byloby pokazać dynamike zmian np. z ostatnich 10 lat
Dystrybuanta empiryczna jest dla mnie tak samo informacyjna jak empiryczna gestosc rozkladu, jednoczesnie o wiele trudniejsza do czytania – potrzebuje dobrych kilka sekund, by odczytac te informacje, ktora z wykresu empirycznej gestosci moj mozg zczytalby „w mgnieniu oka”.
Z dystrybuanty łatwiej odczytać kwantyle.
Gdyby postawić problem na zasadzie: mam 150 punktów. Do jakiej liczby szkół bym się dostał?
Mnie łatwiej odczytać odpowiedź z ecdfa niż z gęstości
(choć może to tylko obnaża moje ograniczone umiejętności wizualnego całkowania).
Ale wizualnie znacznie bardziej wolę gęstość/histogramy.
Ciekawe dane 🙂
Dla uściślenia – klasy dwujęzyczne i te z międzynarodową maturą powinny być na innym wykresie, ze względu na to, że w nich obowiązywał dodatkowy egzamin z języka, z którego można było dostać kilkadziesiąt punktów. Znam przypadek ucznia, który nie dostałby się do klasy ogólnej przy progu 185, ale dostałby się do klasy dwujęzycznej przy progu 199.