Analiza zróżnicowania dochodów bardzo mnie interesuje. To jednak większy temat i poświęcimy mu więcej czasu kiedy indziej. Dziś chciałbym podzielić się jednym wykresem, na którym zobaczymy jak wyglądał rozkład dochodu netto ankietowanego w zależności od wieku i w zależności od płci, tak w roku 2003 jak i w roku 2011. Oczywiście złotówka dzisiaj i wtedy to dwie różne złotówki, nie sposób przeliczyć siły nabywczej teraz i wtedy bo zależy ona od koszyka zakupów. Inaczej wyglądała zmiana cen artykułów luksusowych, inaczej zmiana cen jedzenia a inaczej zmiana cen mieszkań. W każdym razie na potrzeby tego rysunku wykorzystam wskaźnik inflacji dla tych 8% wynoszący 23.7% (na podstawie http://blog.opiekuninwestora.pl/index.php/inflacja/). Więc przedstawiane ceny to albo ceny podane w roku 2011, albo ceny podane w roku 2003 i skorygowane o inflacje.
W poniższych ilustracjach nie analizujemy osobno osób żyjących samotnie (tzw singli), par bez dzieci (DINKs) i par z dziećmi, choć pewnie pomiędzy tymi trzema grupami są znaczne różnice, ale nie wszystko na raz.
Ciągła linia to wygładzona ocena mediany, przerywana to kwantyl rzędu 90%.
Dużych niespodzianek nie ma, ale niektóre wyniki są ciekawe.
Po pierwsze, nawet po uwzględnieniu inflacji zarobki wzrosły (nie tylko ankietowanych, bo to jest oczekiwane, ale tez rozkład zarobków w grupie wiekowej np 30 latków). I to wzrosły znacznie. Oby związane to było z większa produktywnością a nie spadkiem wartości złotówki.
Po drugie kobiety zarabiają mniej. Dotyczy to i medianowych zarobków i kwantyla 90%.
Po trzecie, i chyba najciekawsze, w roku 2011 wyraźnie widać, że najwyższe dochody uzyskują osoby w wieku 30-40 lat.
Biorąc pod uwagę, że oś oY jest logarytmiczna, zarówno osoby młodsze jak i starsze zarabiają znacznie mniej. U kobiet ten okres wyższych dochodów kończy się wcześniej niż u mężczyzn, ale u obu płci kończy się czy to patrząc na medianę czy na kwantyl 90%.
Inaczej było w roku 2003. Nie było wtedy tak dużych dysproporcji związanych z wiekiem, szczególnie jeżeli porównywać mediany dochodów. Ciekawe czy to zróżnicowanie będzie się jeszcze pogłębiało.
To pierwsza ilustracja. Czas na dokładniejsze drążenie tematu. Kierunków badania czynników różnicujących wysokość dochodów jest dużo. Może macie propozycje od czego zacząć?
Hej!
Z ciekawości: na jak licznej grupie osób i w jaki sposób przeprowadzana była ankieta?
W roku 2003 na pytanie o dochod odpowiedzialo 8649 osob,
W roku 2011 odpowiedzialo na to pytanie 23176,
W tym 1817 osob odpowiedzialo i w roku 2003 i 2011.
W roku 2011 w rozbiciu na lata liczba odpowiedzi:
wiek l.odpowiedzi
(10,20] 1397
(20,30] 3473
(30,40] 3418
(40,50] 3503
(50,60] 4803
(60,70] 3468
(70,80] 2240
(80,90] 823
(90,100] 49
Co do przeprowadzania badania: Losowano gospodarstwa domowe a óźniej ankietowano wszystkie osoby z tych gospodarstw. Więcej o metodologi zbierania danych przeczytać można na stronie diagnoza.com.
Nic odkrywczego pewnie nie zaproponuję, ale czy da się wyciągnąć z tych danych następujące informacje:
* wg miejsca zamieszkania
* wg sektora gospodarki (usługi, przemysł, rolnictwo)
* wg wykształcenia
* wg stażu pracy (niby im ktoś starszy, to większy staż, ale w Polsce różnie z tym bywa 🙂
* wg rodzaju zatrudnienia (etat, własna firma/samozatrudnienie etc.)
* wg stanu cywilnego
Taka mała burza mózgu 🙂
Dziekuje za sugestie, wlasnie nad tym pracuje i kolejne obrazki powinny pojawic sie na dniach.
Zrobic wykresy pudelkowe jest prosto, gorzej jest kontrolowac zmienne zaklocajace (np. strukture wiekowa itp).
Problem z rodzajem zatrudnienia jest tez taki, ze pelne informacje o brazy i stanowisku podane sa jedynie dla od kilkuset do tysiaca osob (zalezy jaki filtr jeszcze dodac).
Ale mozna zobaczyc jak dochody roznia w zaleznosci od stanu cywilnego, miejsca zamieszkania czy wyksztalcenia i to juz wkrotce u nas 😉
Ciekawe też jest zwiększenie dochodów (szczególnie u mężczyzn) osób najstarszych (po 75-80 r.ż.) To superspecjaliści oraz rentierzy: zostali w populacji badanej po „odsianiu” wszystkich „normalnych”, którzy wymarli (czy dlatego, że mieli niskie dochody, czy też dlatego mieli niskie dochody, bo genetycznie byli skazani na krótsze, mniej „produktywne” życie – to już inna sprawa; z przedstawionych danych nie da się tego wywnioskować). Podobnie jest np. z występowaniem otępienia (demencji), która to wartość rośnie od ok. 55 r.ż. systematycznie, żeby nagle zacząć spadać u osób po 80 r.ż. Pozostali bowiem przy życiu tylko „odporni” na demencję, reszta już nie żyje.