Uwaga silna korelacja!

Jaki czas temu Adam Z. wysłał mi bardzo ciekawy wykres, który czytelnie pokazuje dlaczego korelacja nie musi być związana z zależnością przyczynowo-skutkową:

[Wykres pochodzi z tego bloga]

Komentarz nie jest chyba potrzebny.

Co ciekawe, pomimo iż praktycznie każdy naukowiec wie, że korelacja nie oznacza zależności przyczynowo-skutkowej, to w chwili gdy odkryje istotną korelację (o ile zgadza się z jego intuicją), natychmiast przypisuje jej przyczynowo-skutkową interpretację.

Dlatego warto sobie ten wykres wydrukować i powiesić w jakimś widocznym miejscu.
Ku pamięci.

19 thoughts on “Uwaga silna korelacja!”

  1. @Jakub, może to jest ta ścieżka na poprawę stanu polskiej nauki?
    Do każdego grantu i stypendium dodać kilka czekolad.

  2. FALSE, cukry rafinowane znajdujące się w czekoladzie wpłytwają na obniżenie funkcji poznawczych i pogorszenie pracy mózgu.

  3. A ja myślę, że w złą stronę myślicie.
    To oczywista oczywistość, że Noble są przyczyną, a czekoladowość skutkiem. Na coś kasę trzeba wydać. No i czymś tego Nobla uczcić. Na oficjalnych imprezach ponoblowskich alkoholu może nie wypada w dużych ilościach, więc padło na czekoladę. Stąd jej konsumpcja rośnie.

  4. Właśnie, już któryś raz widzę te dane na temat konsumpcji czekolady w Szwajcarii, zastanawia mnie, jak to było mierzone. Zacząłem mieć podejrzenie, że może pokazano sprzedaż – wtedy pojawić powinno się pytanie, ile tej czekolady kupują turyści – czekolada to najoczywistszy suwenir z tego kraju. Ale nie, niemożliwe żeby osoby zajmujące się statystyką były tak nierozumne.

  5. Przecież to oczywiste, czekolada powoduje wydzielanie endorfin, co działa relaksująco na badacza i pobudza kreatywność, uzupełnia również cukier zużywany przy wysiłku umysłowym. A może obie rzeczy są silnie skorelowane z czymś innym, np. PKB i tam jest faktyczna zależność?

  6. Swoją drogą,
    ostatnio coraz więcej można znaleźć książek i artykułów o takich przypadkowych zależnościach, którym nasz umysł za wszelką cenę przypisuje przyczynowo skutkowe zależności.

    Dużo przykładów na ten temat można znaleźć w
    ,,Pułapki myślenia. O myśleniu szybkim i wolnym”, Kahneman Daniel
    oraz w
    ,,Everything Is Obvious: How Common Sense Fails Us”, Duncan Watts

  7. Zapewne „pod spodem” jest ukryta zmienna odpowiedzialna zarówno za noble jak i za konsumpcje czekolady. Widziałem gdzieś bardzo podobny wykres gdzie na osi X było po prostu PKB.

    1. Z ksiazek ostatnio wysluchanych, w podobnej tematyce podobal mi sie tez The Tipping Point. Tyle jest anegdotek w tych ksiazkach, ze zaczalem je katalogowac.

  8. Inna sprawa, ile tych austriackich Nobli powinno się de facto przypisać Węgrom. Albo Rumunom albo komukolwiek akurat przynależącemu do Austro-Węgier. Bo trochę słabo dawać dzisiejszą populację Austrii, a później zliczać noblistów z Austro-Węgier. Coś woleć. W mniejszym stopniu się to tyczy kilku innych krajów – UK, Niemiec, Rosji.

  9. @mad, problemem badawczym mogło być: znaleźć dwa współczynniki silnie skorelowane ale nie mające ze sobą związku.

    btw: uważam, że na zajęciach ze statystyki za dużo uwagi kładzie się na uczenie narzędzi (regresja itp) a za mało na krytyczne walidowanie otrzymanych tymi narzędziami wyników.
    Biorąc pod uwagę, że sam prowadzę zajęcia ze statystyki to taka samokrytyka 😉

  10. Skoro tak, to nie za bardzo się udało. Dlaczego? Jeżeli przeciętną konsumpcję czekolady potraktujemy jako wskaźnik zamożności społeczeństw, to stwierdzona zależność, istotna – a więc nie czysto przypadkowa, ujęta w ramy pewnych teorii, zaczyna nam odsłaniać pewne elementy struktury rzeczywistości, które nie wydają się wcale takie głupie. Ponadto należy zauważyć, że choć stwierdzona zależność jest stosunkowo silna, to niestety nie jest ona pełna. Oznacza to ni mniej ni więcej, że konsumpcja czekolady, a raczej inna zmienna lub zmienne, za której/których wskaźnik można uznać konsumpcję czekolady, wyjaśnia zaledwie 63% zmienności „stężenia noblistów” ;). Pozostałe 37% zmienności to dosyć spora, jak sądzę, przestrzeń do dalszych poszukiwań. Sam jestem ciekaw, jak wyglądałby ten wykres, gdyby wyrzucić noblistów pokojowych i z literatury, no i oczywiście z ekonomii, a zostawić tylko fizykę, chemię i medycynę.

  11. W samym wykresie najbardziej interesuje mnie skala pionowa: liczba laureatów nagrody nobla na 10 milionów obywateli. Obywateli w chwili obecnej? W takim razie najlepszym sposobem wspięcia się na górę jest spadek populacji. Na uwagę zasługuje też pozycja Polski: mieliśmy 6 noblistów, około 40 milionów obywateli, co daje 1,5 nobla/10 milionów obywateli, podczas gdy na wykresie mamy jakieś 2-3

  12. MAciej,
    A nobliści związani z Polską?
    1903 Maria Skłodowska-Curie z mężem Fizyka
    1905 Henryk Sienkiewicz Literatura
    1911 Maria Skłodowska-Curie Chemia
    1924 Władysław Reymont Literatura
    1980 Czesław Miłosz Literatura
    1993 Lech Wałęsa Pokojowa Nagroda
    1995 Józef Rotblat Pokojowa Nagroda
    1996 Wiesława Szymborska Literatura

    A jak przyjąc def. z wikipedii :
    Osoba urodziła się na ziemiach polskich[1].
    Osoba wychowywała się na ziemiach polskich[1].
    Osoba posiada lub posiadała polskie obywatelstwo.
    Osoba miała rodziców, dziadków lub pradziadków narodowości polskiej.
    To wyjdzie jeszcze więcej.

    BTW. Zapraszam do rozwoju forum statystycznego http://www.statystycy.pl

  13. A gdybysmy tak wzieli na Y odleglosc od miejsca gdzie rosnie czekolada (kakaowiec)?
    A gdybymy wydzielili noblistow pochodzenia zydowskiego?
    NAdwyzka eksoprtu…?

    Super przyklad.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *