Istnieje wiele naturalnych metod planowania płci dziecka (oparta o kalendarz, pole magnetyczne, dietę itp), jednak większość z nich ma zerową (a w najlepszym przypadku kilkuprocentową) skuteczność.
Okazuje się jednak, że istnieją metody znacznie skuteczniejsze, choć niespodziewane. Udało się je odkryć dzięki analizom Big Data danych z międzynarodowego badania PISA 2012. Poniżej przedstawiamy wyniki dla Polski, ale podobne otrzymuje się dla praktycznie każdego kraju. To nie może być przypadek!
Analiza zależności pomiędzy płcią dziecka a liczbą książek w domu wykazuje istotną statystycznie (bardzo istotną, p-wartość dla hipotezy o niezależności jest poniżej 0.0001, czyli marzenie dla wielu badaczy).
Poniżej przedstawiamy wyniki ilorazu szans na chłopca w zależności od liczby książek w domu, wyznaczonego z użyciem regresji logistycznej. Kody w R pozwalające na odtworzenie poniższych wyników znajdują się tutaj: https://github.com/pbiecek/SmarterPoland_blog/tree/master/2014/1kwiecien (nie mogę napisać na urodzenie chłopca, ponieważ PISA bada 15-letnich nastolatków, więc jest to szansa na spotkanie 15-letniego chłopca lub dziewczyny w domu w którym mieszka jakiś 15-latek w zależności od liczby książek).
Na powyższym wykresie przedstawiono ile razy szansa na chłopca jest większa od szansy na dziewczynkę w zależności od liczby książek w domu. Kropki oznaczają ilorazy szans na chłopca w danej grupie, wartość liczbowa ilorazu przedstawiona jest nad kropką. Wokół kropki przedstawiony jest 95% przedział ufności dla oceny ilorazu szans. Jeżeli ten przedział nie zawiera wartości 1, to znaczy że na poziomie 0.05 szansa na chłopca jest istotnie różna niż szansa na dziewczynkę w danej grupie. Gwiazdkami kodowano istotność różnic, trzy gwiazdki oznaczają p-wartość poniżej 0,001.
Wnioski nasuwają się same.
Jeżeli chcemy chłopca, to należy pozbyć się książek z domu. Im mniej tym lepiej! Jeżeli zejdziemy poniżej 10 książek, to szansa na chłopca zwiększy się o 50%! Jeżeli chcemy zwiększyć szansę na dziewczynkę, należy mieć w domu od 100 do 200 książek (uwaga: gazety i instrukcje obsługi się nie liczą, były wykluczone z pytania w badaniu PISA 2012).
Dalsze analizy pozwalają nawet określić jakiego rodzaju książki (proza/poezja/książki techniczne) pozwalają na jeszcze większe zwiększenie szans na określoną płeć!
Proszę wybaczyć, ale jaki jest sens mówić o wpływie tej zmiennej, podczas gdy ona wyjaśnia ledwie 1% zmienności posiadania dziecka? Mowa oczywiście o r2.
Polecam spojrzeć do kalendarza i zobaczyć którego dziś mamy. 🙂
Co tam kalendarz, skoro wyniki są istotne! 😉
Od razu przypomniał mi się odcinek xkcd: http://xkcd.com/882/
@Zenon: Podoba mi się fragment '1% zmienności posiadania dziecka’. Czyż język statystyczny nie jest tajemniczy?
@tomek: co więcej, te trzy gwiazdki (***) to p-wartość < 0.001 !!! To nie może być przypadek 😉
xkcd świetny.
btw. do pełni szczęście w tytule mogło się pojawić wyrażenie „data science” 😀