New York Times: Osoby z dziećmi śpią o kilkanaście minut dziennie mniej niż bezdzietne. Czyżby?

The New York Times jest zazwyczaj chwalony za wizualizacje oparte o dane. Jedną z takich prezentacji przedstawię poniżej. Zacznę od zachwytu by po kilku paragrafach znaleźć dziurę w całym. Brzmi interesująco?

Tydzień temu, podczas konferencji useR, Hadley Wickham pokazał kilka interesujących, jego zdaniem wzorcowych, wizualizacji. Jedna z nich bardzo wpadła mi w oko. Link do niej poniżej. Ta interaktywna wizualizacja pokazuje jak różne grupy ludzi spędzają czas. Ile i kiedy śpią, jedzą, pracują, bawią się, oglądają telewizję itp.

Można porównywać różne grupy osób pod kątem ile czasu przeznaczają na prace domowe (średnio kobiety 2x więcej niż mężczyźni), w jakich godzinach zazwyczaj pracują,  czasu przeznaczają na edukację (np. warto zobaczyć w podziale na grupy wiekowe). Bardzo interaktywna, zachęca czytelnika do zabawy w szukanie interesujących zależności. Na pierwszy rzut oka bardzo ładnie przygotowana infografika.

zachęcam do poklikania!

Na chwilę odłóżmy na bok tę infografikę. Jakiś czas temu słuchałem wywiadu z polską dziennikarką, która zapytana o zespół do opracowania infografiki powiedziała, że w pierwszej kolejności zatrudniłaby grafika. Statystyk by się przydał w drugiej kolejności, ale z pewnością nie będzie na niego środków. Opinia ta jest zgodna niestety z opinią większości osób, że infografika powinna być ładna, przykuwająca uwagę a niekoniecznie prezentująca dane. Estetyka przed poprawnością.

Do czego to prowadzi? Mamy ładne, cukierkowe grafiki, które zniekształcają obraz rzeczywistości lub w bardziej optymistycznym przypadku nic o rzeczywistości niewiele mówią.

A jak to stwierdzenie ma się do prezentowanej infografiki? Zobaczmy czy można z niej odczytać czy ilość i godziny snu różnią się w zależności od tego czy ma się dziecko, dwójkę lub więcej dzieci, czy też nie ma się dzieci. Osoby które przeżyły narodziny dziecka prawdopodobnie są przekonane, że przy małym dziecku ilość snu poważnie spada. A co na to nasza infografika?

Dowiedzieć możemy się z niej, że średnio osoby bezdzietne śpią o 10 minut dłużej niż osoby z jednym dzieckiem i o 14 minut niż osoby z dwójką dzieci.

Czyżby?

Jaki jest problem z tą analizą? Nie uwzględnia ona zróżnicowania porównywanych grup pod względem innych cech. Np. wieku. Otóż osoby młodsze średnio śpią dłużej (co zresztą wyraźnie widać na tej wizualizacji). Średnio osoby bez dzieci są młodsze niż osoby z dziećmi (dzieci się ,,nabywa” z wiekiem). A więc porównując osoby bezdzietne z osobami z dziećmi obserwujemy równocześnie różnice w długości snu wynikającą z różnic w średnim wieku obu grup. Aby dowiedzieć się czy i o ile posiadanie dziecka skraca czas na sen należałoby w analizie uwzględnić i wyeliminować wiek i inne ,,zakłócające” cechy badanych. Można to zrobić używając np modeli liniowych. Problem w tym, że sam grafik tego nie zrobi, do tego potrzebny ktoś z choć podstawowym przygotowaniem analitycznym. Szkoda też że nie rozdzielono osób dzietnych na osoby z najmłodszym dzieckiem do 4 lat  i osoby ze starszymi dziećmi. Myślę, że małe dziecko versus duże dziecko bardziej różnicuje tryb życia niż jedno versus dwa i więcej.

Pointa? Apelując do polskich gazet. Może zamiast zatrudniać tylko grafika warto wygospodarować choć 20% etatu dla statystyka? Może prezentacja będzie mniej piękna ale jest szansa, że będzie przedstawiała właściwie efekt obserwowany w danych. A przecież o to chodzi, by się czegoś dowiedzieć, a nie o to by nacieszyć się estetyką wykresu.

BTW: New York Times i Guardian mają świetne zespoły przygotowujące wizualizacje danych. Pracują one w szalenie krótkim czasie, łatwo więc później szukać dziury w całym. Nie zmienia to jednak faktu, że zespoły obu gazet wykonują masę świetnej pracy. Warto zobaczyć jak ciekawe wizualizacje sa prezentowane na łamach obu gazet, czy raczej ich portali internetowych.

 

7 thoughts on “New York Times: Osoby z dziećmi śpią o kilkanaście minut dziennie mniej niż bezdzietne. Czyżby?”

  1. Hmmm… Mnie z klikania wyszło (nie robiłem tego dokładnie, klikałem, zgodnie z zachętą), że osoby dzietne śpią może nawet dłużej niż bezdzietne, ale wstają wcześniej. Odsetek Amerykanów na nogach o 6:00 rośnie z liczbą dzieci i wykształceniem. Zatrudnieniem też, co prawda… Wniosek: chcesz spać spokojnie i zdrowo się wysypiać, unikaj ciąż i szkoły. Pracy też. Ale może źle rozumiem ten graf? Toż aspołeczne wnioski z niego płyną…

  2. Nie dałoby się na tych samych danych (przy założeniu odpowiedniej liczebności próbki) umożliwić wizualizacji dla kilku opcji wybranych na raz? Wtedy można by porównać np. „25-64 years” & „No children” z „25-64 years” & „Two+ children”

    1. W tej wizualizacji tego się chyba nie da zrobić, przynajmniej nie wiem jak to zrobić.

      Ale gdyby się dało zaznaczyć jednocześnie kilka ,,przecięć” to już łatwiej byłoby analizować efekty interakcji.
      Ustaliwszy wiek, rasę, płeć zobaczyć jak na długość snu wpływa posiadanie . A później ustaliwszy że jest dziecko zobaczyć jakie są różnice w ilości snu pomiędzy płciami.

  3. Chciałbym zauważyć, że na wizualizacji jest taki oto komentarz:
    „People with no children;
    Adults living with no children tend to be older: their average age is 51, compared with 38 for adults living with children.”,
    więc osoby bez dzieci są średnio starsze, niż osoby z dziećmi, co prowadzi do tego, że Twoje spostrzeżenie na temat średniej długości snu w grupie osób młodszych i starszych nie ma zastosowania do tej wizualizacji (a może się mylę).
    Można tutaj raczej przyjąć to, że ludzie, którzy mają dzieci, muszą wstać przed nimi [dziećmi], aby je obudzic, czy też zająć sie nimi, np. zrobić sniadanie.

    1. O, dzięki, więc sprawa jest jeszcze ciekawsza.
      Komentarz, który przytoczyłeś dotyczy danych, które zebrano, mój komentarz dotyczył oczekiwanych zależności. Pytanie skąd różnice w tych komentarzach?
      Jak to możliwe by osoby, które nie mają dzieci (z opisu nie wynika że chodzi o niepełnoletnie dzieci) były starsze niż osoby z dziećmi?
      Pierwsze przypuszczenie jest takie, że próba nie jest reprezentatywna,
      drugie jest takie że może chodzi tylko o nieletnie dzieci i w tym przypadku w danych osoby bez dzieci to raczej osoby bardzo młode lub starsze z już dorosłymi dziećmi.
      W obu przypadkach grupy z dziećmi i bez dzieci to grupy o innej strukturze wiekowej. A jeżeli długość snu zależy od wieku to zmieszanie dwóch grup o różnych strukturach wiekowych ukryje efekt posiadania dziecka.

      To ukrywanie efektu jest bardzo ciekawym zjawiskiem. Przypuśćmy, że porównujemy wyniki w teście na czytanie młodych polaków i europejczyków (zmyślony przykład).
      Może się tak zdarzyć (teoretycznie) że młode chinki będą bieglejsze od młodych dziewczyn z europy , młodzi chińczycy bieglejsi od młodych europejczyków ale ponieważ dziewczęta są bieglejsze w czytaniu niż chłopcy to z uwagi na różne proporcje płci w populacji (w Europie dziewczynek tyle co chłopców, w Chinach chłopców jest więcej niż dziewczynek) okaże się że średni młody chińczyk jest mniej biegły niż średni młody europejczyk.
      Przykład fikcyjny, ale ilustruje jak efekt płci mógłby zakłócać efekt systemu edukacyjnego.

      Podobnie jest i tutaj, drugorzędne znaczenie ma która z tych grup jest starsza (w opisie jest że bez dzieci, ale logicznie rzecz biorąc osoby z dziećmi powinny być starsze) problemem jest to że wyniki są zakłócone przez wiele innych czynników, które należałoby usunąć np stosując GAM aby te dane poprawnie przedstawić.

  4. Ze zdania „Adults living with no children tend to be older: their average age is 51, compared with 38 for adults living with children.” wywnioskowałabym, że może chodzić o to, czy badani mieszkali z dziećmi, a nie o to czy w ogóle mieli dzieci lub czy to były ich dzieci. Wtedy duży udział osób starszych wydaje się zrozumiały (młodzi mogli np. mieszkać z młodszym rodzeństwem). Ale też osoby z najstarszej wyróżnionej grupy wiekowej spały dłużej, niż osoby „w wieku średnim”, więc wpływ wieku może być w dalszym ciągu wyraźny.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *