Steve Jobs, stan nauki w Polsce i niezgoda na uliniawianie zależności

Ok, dzisiaj będzie ponownie o raporcie opracowanym w ramach programu Sprawne Państwo prowadzonego przez Ernst & Young. Odnosniki do raportu podalismy wczoraj. Dziś chciałbym przyjrzeć się wspólnie dwóm wykresom porównującym produktywność naukową w Polsce i w innych krajach.

Zacznę od jednego z moich ulubionych cytatów Steva Jobsa. Cytat dotyczy innowacyjności a innowacyjność kadry to moim zdaniem lepszy współczynnik oceny jakości uczelni niż produktywność liczona liczbą publikacji na nauczyciela akademickiego.

Innovation has nothing to do with how many R&D dollars you have. … It’s not about money. It’s about the people you have, how you’re led, and how much you get it.

Cytat ten nasunął mi się na myśl gdy zobaczyłem rysunek 11 w wspomnianym raporcie.

Dlaczego? Na tym wykresie (co za dobór państw do porównania?) Polska charakteryzuje się naniższymi rocznymi przychodami na pracownika. Na stronie 67 wspomnianego raportu napisano niebacznie ,,Wyniki estymacji ekonometrycznej wskazują w przypadku polskich uczelni wzrost finansowania na pracownika o 1% może być powiązany ze wzrostem efektywności badawczej aż o 4%”. Więc zwiększenie finansowania o 100% (co łatwo uzyskać zwalniając połowe pracowników) spowoduje wzrost efektywności o 400% (a tym samym przeskoczymy Finlandię i Niemcy, najbardziej zaawansowane technologiczie gospodarki w Europie).

Nie chciałbym tu romantycznie wieścić, że gdyby tylko Polska nauka była lepiej finansowana to stalibyśmy się liderem w Europie. Bo to nieprawda. Wcale nie chodzi tylko o ilość pieniędzy wpompowywanych (czy też w przypadku Polski, przesiąkających) w naukę. Chodzi o to czy naukowcy potrafią tę naukę uprawiać, czy potrafią współpracować, publikować, zarządzać zespołem itp. Moim zdaniem brak tych umiejętności to jeszcze większa bolączka niż problemy finansowe. Przygotowuję w wolnych chwilach esej ,,Fabryka i Świątynia”, szerzej tam ten temat rozwinę.

Ale na razie chciałbym porzestać na zakwestionowaniu sensowności dodawania linii trendu liniowego na powyższym wykresie.

Rozumiem, że gdy ma się młotek wszystko wygląda jak gwóźdź. Ale nawet w Excelu można dopasowywac inną krzywę trendu!
Model w którym średnia liczba publikacji zależy liniowo od rocznych przychodów na pracownika jest wysoce wątpliwy. Sama Polska na tym wykresie wygląda bardziej jak wartość odstająca, niż jak przypadek potwierdzający liniowość.

Drugi wykres w którym autorki wsadziły linie trendu liniowego jest na stronie 70 (wykres 14). Jest całkiem dobrą ilustracją paradoksu Simpsona.

 

Ta pseudoliniowość, która jest zaznaczona linią regresji wyliczona jest na bazie pięciu widocznych gołym okiem podpopulacji (nisko-publikujące uczelnie w UK, wysoko publikujące uczelnie w UK, uczelnie w Finlandii, Polsce i Szwajcarii, każde z nich tworząca osobne skupisko punktów na wykresie).

Co więcej w żadnej z tych podpopulacji trend nie jest podobny do wyrysowanego trendu liniowego. W Szwajcarii żaden trend liniowy nie jest widoczny, w dobrze publikujących uczelniach z UK krzywa trendu jest znacznie ostrzejsza, w słabo publikujaych uczelniach z UK jest znacznie słabsza.

Jedyny wniosek jest taki, że nie ma żadnego sensu liczyć pseudo trendu agregując uczelnie z czeterech państw razem.
Nie szukajmy liniowości na siłę tam gdzie ich nie ma a tym bardziej nie twórzmy wykresów, które sugerują tą zależność.

11 thoughts on “Steve Jobs, stan nauki w Polsce i niezgoda na uliniawianie zależności”

  1. Ja mam wrażenie, że ogólnie ekonomiści mają skłonność do upraszczania rzeczywistości. Można się o tym przekonać otwierając dowolny podręcznik do makro/mikroekonomii. Praktycznie wszystko jest tam liniowe.

  2. Ta, wyrażona zarówno przez @smarterpoland jak i przez komentatorów, „niechęć” do liniowości może wynikać z przyczyn „subiektywnych”. Wydaje mi się, że często (niezbyt świadomie) hodujemy w sobie przekonanie, że korelacja=związek przyczynowo-skutkowy. Jeśli tak, nawet „nieświadomie”, patrzymy na korelacje, to najczęstsza prezentacja, korelacja liniowa, istotnie wydaje się nadużyciem.
    Ale jeśli zdamy sobie sprawę, że to tylko przyporządkowanie sobie par liczb (jak w tych przykładach) – no, to z liczbami bić się nie da…. tam jest korelacja liniowa. A że przyporządkowano pary liczb ze zbiorów, które nie powinny się znaleźć razem – to już nie jest wina korelacji liniowej.

  3. Cieszę się, że pojawia się dyskusja.
    Ja tylko zaznaczę, że nie pałam niechęcią do samej liniowej zależności, co po pokazywania liniowej zależności w miejscu gdzie (ewidentnie) nie jest ona liniowa.
    Zmienne mogą być zależne, mogą być zależne monotonicznie, mogą być zależne liniowo i każda z tych zależności może być graficznie przedstawiona w poprawny sposób.
    Celem zazwyczaj nie jest sprawdzenie czy dwie zmienne korelują, ale dowiedzenie się jaka jest pomiędzy nimi zależność. W przykładach nazywanych zbiorem danych Anscombe’a jest taki przykład (http://data.princeton.edu/wws509/stata/anscombe2.png), trudno widząc taką zależność powiedzieć, że jest to zależność liniowa, nawet jeżeli korelacja jest istotnie różna od zera.

  4. Może trzeba by powiedzieć, że korelują na wiele sposobów (sic!), także liniowo, ale lepiej opisuje to inna zależność niż liniowa? (To już mój konik semantyczny: w końcu to tylko MY decydujemy o tym, jak co nazywamy. Nazwy obiektywnie nie istnieją…)

  5. „Co więcej w żadnej z tych podpopulacji trend nie jest podobny do wyrysowanego trendu liniowego.”

    Na moje oko w przypadku Polski dopasowanie jest całkiem przyzwoite.

  6. Fakt, dla Polski wygląda przyzwoicie. Może to trochę wynikać ze spłaszczenia wykresu, większość punktów dla polski jest poniżej wartości 0.4 na osi OY. Przydałyby się takie informacje dla uczelni z całego świata.

  7. @wikton dziękuję za namiar na ciekawy raport. Na pierwszy rzut oka szkoda, że nie zawsze osie są opisane i trudno odgadnąć co jest pokazane, ale z chęcią przeczytam całość dokładniej. Jeżeli coś mnie zaskoczy czy to na plus czy na minus to z pewnością o tym napiszę.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *