Jaki jest pożytek z Internetu dla nauki akademickiej, dlaczego warto się dzielić mikroodkryciami i jak wykorzystać technikę, by pracować wydajniej

Czym jest nauka? Czy nauką jest to, na co można dostać grant w instytucjach finansujących naukę? A może to, co można opublikować w czasopiśmie z ministerialnej listy ,,czasopism punktowanych”? Czy naukowcem jest osoba opłacana z funduszy na naukę?

Definicja nauki (o ile istnieje) jest szersza i obejmuje wszystko co rozszerza nasze (nasze=ludzkości) horyzonty.
Można zapytać, czy warto dyskutować nad tym czym jest nauka? Tak, chociażby po to wyzwolić się ze schematów narzucanych przez kryteria oceny jednostek akademickich.
Pojawia się coraz więcej inicjatyw, w ramach których nauka rozwijana jest poza murami uczelni wyższych, a finansowana jest np. przez osoby prywatne lub duże firmy (vide. oddziały badawcze gigantów IT Microsoft Research, IBM Research, Google, Amazon, Yahoo itp). Prowadzenie badań przy wsparciu osób prywatnych przyświeca między innymi fundacji SmarterPoland, a przykładów na tzw. crowdresearch jest coraz więcej, np. opisany w artykule ‘Baumgartner albo portiernia, czyli coming-out w temacie finansowania nauki w Polsce’.

Ok, więc porozmawiajmy o tym czym jest nauka i jak wygląda lub może wyglądać. Dzisiaj mamy gościnny wpis fizyka Piotra Migdała. Może sprowokuje on Was do podobnych lub odmiennych komentarzy / innych gościnnych wpisów.

Nauka 2.0
Czyli o tym jaki pożytek z Internetu dla nauki akademickiej, dlaczego warto się dzielić mikroodkryciami i jak wykorzystać technikę, by pracować wydajniej.
Piotr Migdał

Nauka to nie odkrywanie obiektywnego stanu świata, niczym kopanie w platońskiej jaskini. To pewien proces poznawania i opisu przyrody, ugruntowany społecznie i historycznie, w którym zmieniają się cele, ewoluują pojęcia, są doskonalone metody czy kryteria poprawności. Wiele ścieżek prowadzi na manowce i wiele odkryć dzieje się jednocześnie. Pięknie pisze o tym Ludwik Fleck książce p.t. "Psychosocjologia poznania naukowego".

W szczególności zmienia się podejście do rozpowszechniania odkryć. Pitagorejczycy traktowali niewymierność pierwiastka kwadratowego z dwóch jako sekret. Galileusz, odkrywszy pierścienie Jowisza, owszem, wysłał listy do konkurentów, ale zaszyfrowane – tak, by nic nie powiedzieć, a zarazem zapewnić sobie pierwszeństwo. Dopiero w XVII wieku sukcesywnie zaczęto publikować w czasopismach naukowych, dochodząc do dzisiejszego "Publish or Perish". Więcej można przeczytać na blogu Michaela Nielsena (np. ten wpis) czy też w jego książce "Reinventing discovery".

No dobrze, ale czy pozostało coś więcej niż naciskać na publikowanie pod groźbą zakończenia żywota (naukowego)? Czy istnieją inne metody współpracy niż listy (teraz upgrade’owane do e-maili)? I czy Internet może się przyczynić do zmiany funkcjonowania nauki?

Po pierwsze i najważniejsze, Internet obniżył koszty dzielenia się informacją. Nie trzeba być pisarzem, dziennikarzem ani wydawcą, by móc się podzielić dowolną informacją ze Światem – na stronie domowej, blogu (np. takim jak ten) czy też forum dyskusyjnym.

W ten sposób wiele kursów czy wykładów dociera nie tylko do wąskiej grupy studentów na danej uczelni, ale – do każdego zainteresowanego.

Jednak w wielu projektach istotna jest interakcja – zwłaszcza, gdy nie tyle chcemy się podzielić gotowym dziełem, co zasięgnąć rady. Np. strona pytań i odpowiedzi Stack Overflow pozwala rozwiązać problemy programistyczne – od tych zadawanych przez nowicjuszy do zaawansowanych. Okazuje się, że identyczny system działa w – Math Overflow to strona Q&A z matematyki na poziomie badawczym. Oprócz doktorantów i "zwykłych" profesorów, udzielają się tam światowe sławy, jak laureaci medalu Fieldsa Tim Gowers czy Terence Tao (zresztą, aktywni na G+ – tam też prowadzą odnośniki). Co kluczowe – nie ma tu znaczenia, czy jest się studentem prestiżowej uczelni, czy samoukiem. Liczy się tu wiedza i umiejętności, nie – tytuł czy afiliacja. Ogólniej, na bazie Stack Overflow wykiełkowały strony skupione wokół społeczności z różnych dziedzin, nie tylko komputerowe – od ogrodnictwa czy fotografii, przez fizykę czy analizę statystyczną, do np. stricte badawczej informatyki (autor notki swego czasu współprowadził Theoretical Physics – Stack Exchange, Q&A z fizyki na poziomie badawczym; niestety, masa krytyczna nie była wystarczająca).

Dobrze, można pytać i odpowiadać na pytania z bardzo wyspecjalizowanych dziedzin, wychodząc poza garstkę znajomych z wydziału czy też konferencji.

Ale można też współpracować. Niektóre problemy przekraczające możliwości intelektualne najlepszych matematyków, można rozwiązać wspólnymi siłami. Np. projekt Polymath polega na rozwiązywaniu otwartych problemów matematycznych przez… komentarze na blogu. W matematyce ciężko wpaść na dobry pomysł, ale dużo prościej ocenić, czy rzeczywiście dany pomysł stanowi krok naprzód w rozwiązaniu problemu. I tym samym np. udało się rozwiązać kilka trudnych problemów matematycznych.

Jeśli nie współpracować to… współzawodniczyć. Okazuje się, że z niektórych problemów można zrobić konkurs. I tak np. Kaggle szczyci się, że z analizy danych (ang. "data science") czyni sport.

Niektóre projekty nie są adresowane tylko do najlepszych z najlepszych – wystarczy być pasjonatem. Tak np. dwóch doktorantów z Cambridge chciało szukać nowych typów galaktyk. Niemniej, mieli za dużo danych by, nawet przy heroicznej pracy, mogli sami "oglądać obrazki". Zaś automatyczna analiza okazała się niewystarczająca (warto pamiętać, że człowiek jest bardzo dobry w analizie obrazu oraz ogólnie ciężko zrobić algorytm, który dobrze się nadaje to wykrywania nietypowych obiektów). Wpadli na pomysł, by pokazać obrazki pasjonatom – stworzyli GalaxyZoo, gdzie każdy może oglądać galatyki, klasyfikować je, i, w przypadku znalezienie czegoś nietypowego, zagadać na forum. Niby proste – a skończyło się wykryciem nowego rodzaju galaktyki.

Inny projekt, Fold.it, polega na grze w zwijanie białek. Znów, wykorzystując naturalne zdolności przestrzenne ludzi (a także naturalną chęć do grania w łamigłówki) szuka się struktury białek – i taka metoda nieraz jest lepsza niż najlepsze rozwiązania numeryczne. Rozwiązania jak powyższe, gdzie pasjonat możne przydać się do poważnej nauki, są czasem nazywane nauką obywatelską (ang. "citizen science"), niekiedy podciąganą pod tzw. "crowdsourcing".

Z różnych innych pomysłów – kiełkują strony do finansowania projektów naukowych – np. Petri Dish, przez publiczną zbiórkę (ang. "crowdfunding"). O ile pewnie tylko niektóre projekty mają na to szanse, to rozwiązanie wydaje się interesujące.

Dzielenie się badaniami nie kończy się na publikacji artykułów. Znów, w sytuacji, gdzie nie trzeba ścinać lasów, by rozprzestrzenić informację (a także, gdzie owa informacja pojawia się błyskawicznie), można się dzielić wykresami (także niewykorzystanymi) oraz negatywnymi wynikami. Jest to o tyle istotne, że nieudane eksperymenty (czy też niewystarczająco fascynujące wyniki) nie są zazwyczaj publikowane. Choćby dlatego, że mogą być za "słabe" na publikacje, lub też – po co marnować czas na pisanie artykułu, który nie będzie wystarczająco pomocny w karierze naukowej, skoro można w tym czasie pracować nad bardziej obiecującymi projektami? Niemniej, w dobie Internetu, łatwo podzielić się owymi kawałkami, co może przydać się innym. Choćby Figshare umożliwia się dzielenie owymi kawałkami. I, co więcej, przyznaje każdemu numer DOI (Digital Object Identifier), a zatem i łatwo zacytować ów kawałek.

Co więcej, i co ważniejsze, można (a zdaniem autora i nie tylko Science Code Manifesto – powinien to być twardy wymóg) dzielić się kodem i surowymi danymi. I zarówno w kwestii weryfikacji (co jest fundamentem działania nauki), i – do dalszego wykorzystania. Jak? Choćby na popularnych stronach do dzielenia się kodem – GitHub [uważana za niektórych za najważniejszą sieć społecznościową) czy też BitBucket (który to daje nieograniczoną liczbę repozytoriów osobom z e-mailami akademickimi). Nie zapominając, że to przede wszystkim systemy kontroli wersji – użyteczne nie tylko do kodu, ale też współpracy przy pisaniu prac naukowych, zwłaszcza w LaTeXu.

Warto też pamiętać, aby publikując prace naukowe z fizyki, matematyki, informatyki czy dziedzin numeryczych, wrzucić preprint na arXiv (czyt. "arkajw") – dzięki temu jest dostępny dla wszystkich i to praktycznie od razu.

Wpis bazowany na Open Science and Science 2.0 z pierwszego Offtopicarium – imprezy dla ludzi z pomysłami: krzyżówka warsztatów, bardzo luźnej konferencji, zlotu pasjonatów, słowem – miejsce dla ludzi, którym "się chce". Autor tego wpisu rozkręca grupę ludzi zainteresowanych rozwijaniem narzędzi do nauki “Hacking Science”.

11 myśli na temat “Jaki jest pożytek z Internetu dla nauki akademickiej, dlaczego warto się dzielić mikroodkryciami i jak wykorzystać technikę, by pracować wydajniej”

  1. Stackoverflow jest świetne!W przypadku R można znaleźć tam odpowiedzi na praktycznie wszystkie pytania a i na stats.stackoverflow jest dużo interesujących wpisów. Kaggle to bardzo dobre źródło przykładowych zbiorów danych i interesujące dyskusje na forum opisujące różne podejścia do prezentowanych tam zadań.

    Dzięki za ten wpis. :)

  2. Absolutna zgoda, że rozumienie nauki jako działalności “profesjonalnych” naukowców za fundusze podatnika jest zbyt wąskie, ale uwzględnianie “wszystkiego co poszerza nasze horyzonty” wydaje mi o pół kroku za daleko. Nic nie ujmując wielu internetowym miejscom, gdzie zbierają się ludzie nauką zainteresowani (i których oby przybywało) to ja postawiłbym granicę między nauką i “nie-nauką” w miejscu gdzie kończy się metoda naukowa. Warto pamiętać, że arxiv (i inne wspomniane miejsca) zawierają sporo pseudo-nauki, nie-prowadzących do niczego dywagacji, czy też zwyczajnych bzdur. Nie ma w tym nic złego, i nawet można sobie poszerzyć horyzonty czytając kolejny “dowód” że P=NP, ale żeby nauka 2.0 mogła (przynajmniej dla mnie) naprawdę zastąpić (czy nawet sensownie uzupełnić) naukę 1.0 potrzebujemy wypracować nowy schemat “peer-review”, żeby można było łatwiej odróźnić czy mogę czemuś ufać, czy nie. Ja np. często potrzebuję zaglądać do literatury, w której nie jestem ekspertem i nie mogę sprawdzić, czy wszystko jest zgodne z “regułami sztuki”, a muszę zaufać, albo nie ufać wynikom… Pod tym względem, na razie, nauka 1.0 jest lepsza (choć baardzo niedoskonała)…

  3. @Bartek Wilczynski

    Nauka to jest cały proces, też społeczny, i tu nie ma (i nie będzie) twardego rozgraniczenia między tym co jest “jeszcze nauką”, a co – “już nie”. Zwłaszcza, że było wiele teorii, które czy to z “mniejszościowych” zostały awansowane do poważnej nauki, czy też odwrotnie – jednak nie wytrzymały próby czasu (albo raczej – dowodów empirycznych, lub – innych, lepszych teorii).

    Co ważniejsze, warto pamiętać, że recenzowane publikacje są dość ważną częścią nauki, ale nie jej całością. Nie każda wiedza jest spisywana, wiele intuicji może być ulotnych, itd. I tu właśnie jedną z kluczowych idei Open Science jest by to co się dało upublicznić, upubliczniać.

    Co do arXiva – akurat w mojej działce (quant-ph) arXiv, z nielicznymi wyjątkami, nie odstaje od publikacji recenzowanych. Przy czym warto pamiętać, że decyzja recenzentów to nie jest wyrocznia. I akurat patrzenie na sposób “peer-reviewed – przyjmuję do wiary, nie – muszę sprawdzać” jest szkodliwe. Wiarygodność jest ciągłą cechą. BTW: A klasyczny podręcznik uznajesz za naukę, czy nie-naukę? (Książki zwykle nie są recenzowane, w sensie naukowym.)

    Jeśli chodzi o wymowę całego tekstu – nie, nie chodzi mi o przyjęcie, że “teraz po co recenzować, wystarczy pisać sobie na blogach”. Mechanizm sprawdzania prac wiele wnosi, i jest kluczowy dla dobrego funkcjonowania nauki. I jest tego pełna świadomości – zobacz np. wpis i dyskusję https://gowers.wordpress.com/2013/01/16/why-ive-also-joined-the-good-guys/. Zatem tu chodzi raczej o rozszerzenie sposobów dzielenia się odkryciami na nowe, a nie ich zmianę. Co więcej, takie podejście daje pole do lepszego i bardziej dociekliwego sprawdzania – co uniknie uwadze recenzentów, może zostać wyłapane przez innego naukowca.

    Przykład: kiedyś jedyną uznaną formą publikowania naukowego były książki. Teraz są głównie są czasopisma. Ale wciąż są rzeczy, które lepiej przedstawić w postaci książki (i dalej tak się czyni).

  4. Niektórzy bardzo cenią możliwość komunikowania się poprzez Twittera podczas konferencji naukowych, a inni nie. Jedni uważają, że warto publikować na arXiv inni, że nie. To pewnie kwestia gustu, przyzwyczajeń, doświadczeń i pewnie innych czynników. Każdy woli coś innego.

    Ale ciekawie jest wiedzieć jako można swój warsztat poszerzyć korzystając z forów, blogów, tweetów itp.
    Dla mnie też ciekawą obserwacją jest, że nauka kwitnie też poza ośrodkami akademickimi i ma wiele interesujących form.

    Jedni powiedzą, że kartografia i projektowanie kolorów dla map to nauka inni powiedzą, że nie. Projektowanie czcionek, projektowanie wykresów, projektowanie raportów.
    Projektowanie czytelnych wizualizacji.

    Ja bardzo cenię sobie takie mikroodkrycia jak snipety jak coś zrobić lepiej/efektywniej w R. Rzeczy publikowane często na R-bloggers, StackOverflow i innych źródłach poszerzające mój światopogląd są dla mnie ciekawymi przykładami nauki.

  5. Akurat w kwestii umieszczania artykułów na arXivie pożytek jest nie tylko dla autora, ale i dla świata. (Ale już co do ich czytania – w pełni uprawnione jest własne podejście (pewnie to też kwestia dziedziny i tematu).)

    W kwestii wspomnianych tweetów, blogów, SE itd – podpisuję się pod @smarterpoland – chciałem nakreślić krajobraz rozwiązań, a nie zachęcać by każdy korzystał z każdego (wtedy to już na pewno nie miałby czasu na poważną naukę :)).

    I choćby przykłaz z tzw. otwartymi dziennikami naukowymi (Open Notebooks, http://en.wikipedia.org/wiki/Open_notebook_science), czyli pisaniem na bieżąco o postępach (i problemach) w trakcie badań. Tutaj opinie są dość różne, od “koniecznie trzeba” do “nie chcę, by mi wytknęli błędy lub ukradli wyniki”. Ja sam ideę bardzo popieram, ale nie prowadzę, bo moje notatki i w większości są papierowe (przynajmniej – obliczenia, dowody), i – są ledwo czytelne dla mnie, z mnóstwem idiosynkratyzmów.

    Acz mam podejście takie: jak da się coś sformułować w posoób pożyteczny i zrobić z tego pytanie – dzielę się (np. http://physics.stackexchange.com/users/184/piotr-migdal?tab=questions).

    1. I jeszcze krótka refleksja, naukowcami (o których się mówi) są jednostki geniusze, od jakiegoś czasu są też liderzy zespołów naukowych, ale zespoły robią się coraz większe. Jeżeli kilka tysięcy osób w wolnym mczasie zwija białka, i np. Jakiś szesnastolatek jest w tym bardzo dobry! Znajduje najlepsze struktury bawiąc się wieczorami, to czy jest on naukowcem?
      Jak dla mnie to nie ma znaczenia jak się go nazwie, ale fajnie że z jego udziałem uda się pchnąć wiedzę o świecie epsilon dalej.

  6. @smarterpoland i @Piotr Migdał

    Jeśli chodzi o rozgraniczenie co nauką jest a co nie jest, to nie twierdzę, że mam patent geodety nauki, ale na użytek akademickiej dyskusji chętnie będę się upierał, że lepiej jest próbować to rozgraniczenie utrzymać. I naprawdę uważam, że głównym wyróżnikiem może być tylko metoda, a nie żaden konkretny wynik. Np. jeśli jakiś “jasnowidz” opublikuje “objawiony” wynik, żę P=NP, to nie przyczyni się do nauki, nawet jeśli okaże się, że miał rację. Natomiast jeśli eksperymentator zrobi dobry eksperyment, ale później jego wnioski zostaną obalone przez jeszcze lepszy eksperyment, to moim zdaniem przyłoży się do naukowego dyskursu. I tego rozgraniczenia wydaje mi się warto się trzymać.

    Co do kwestii narzędzi sieciowych, to wygląda mi na to, że mój komentarz zinterpretowaliście tak, że “nie cenię” możliwości nauki 2.0, a ja wręcz przeciwnie pisałem o tym, że świetnie, że jest stack overflow, twitter i wszystkie inne narzędzia. Tak samo jak dobrze jest mieć komputery, długopisy i telefony, które też świetnie służą wymianie myśli. Być może nie dość pochwaliłem arxiv, a bardzo go cenię, ale wydaje mi się, że jest tam dużo więcej (proporcjonalnie) rzeczy nienaukowych niż w czasopismach nauki 1.0, (zwłaszcza, jeśli “odjąć” to co jest na arxiv’ie i w czasopismach). Co nie znaczy, że mamy nie mieć arxiv’a – chodzi tylko o to, że inną wagę należy przykładać do rzeczy recenzowanych (takich jak artykuły) niż to nierecenzowanych (takich jak arxiv i twitter).

    Podsumowując, to co mnie w oryginalnym poście skłoniło do krytycznej notki to nie narzędzia sieciowej publikacji (które są super) ale właśnie “holistyczne” podejście do nauki. Niestety, w internecie bardzo łatwo znaleźć masę pseudonaukowych tekstów, które wielu ludzi ma za poważne rzeczy. I jeśli “wszystko co rozszerza nasze (nasze=ludzkości) horyzonty” ma być nauką to ja protestuję.

    1. Komentując tylko ,,wszystko co rozszerza nasze (nasze=ludzkości) horyzonty”. Nie uważam, że wszystko co się pisze/publikuje poszerza horyzonty i stąd chyba różnica w interpretacji tego zdania.
      Pseudo-nauka i różne tezy nieprawdziwe, a oparte jedynie na autorytecie/intuicjach/opiniach autora (ewentualnie recenzentów czy innych ,,ekspertów”) nie pasują do tej definicji.

  7. @Bartek Wilczyński

    > Np. jeśli jakiś “jasnowidz” opublikuje “objawiony” wynik, żę P=NP, to nie przyczyni się do nauki, nawet jeśli okaże się, że miał rację.

    Tu się wszyscy zgadzamy, jak rozumiem. Zresztą nie znam osobiście osoby, która by takie “objawienia” brała na serio. Acz na arXivie (w przeciwieństwie do Twittera) zwykle wrzuca się prace wraz z wysłaniem do pisma recenzowanego. I tak, mogą się tam znaleźć bzdury (w arXivie sa odrzucane tylko rzeczy, które z daleka wyglądają na “nie takie”; np. http://vixra.org/ ma bardziej liberalne podejście… i też treść). Zresztą, stąd rzeczy, które są na arXivie należy brać ze szczególną ostrożnością  (i np. dyskusja dot. cytowania http://mathoverflow.net/questions/41141/should-i-not-cite-an-arxiv-org-paper); i stąd system recenzowania prac jest niezmiennie uważany za kluczowy.

    Tak samo, nie mam holistycznego podejścia do nauki. Albo inaczej – to, że granica jest płynna nie znaczy, że nie rzeczy, w których “naukę”, rzeczy które raczej figurują jako wstępna dyskusja, i rzeczy, które są uważane za zwyczajną hochsztaplerkę. Stąd też np. dyskusja na blogu ma status dyskusji. Zabawa danymi (jak np. http://blog.xkcd.com/2010/05/03/color-survey-results/) ma status zabawy danymi.

    A gdzie tu miejsce na “ciągłąść”? Ano zarówno niektóre dobre prace tylko na arXivie (np. http://arxiv.org/abs/math/0303109, ponad 500 cytowań), jak i “zrecenzowane” prace, które zwyczajnie są błędne (czy to recenzent przeoczył, czy też – ogólnie kiepskie recenzowane pismo, które wszystko przekłnie, nawet pracę wygenerowaną przez komputer – http://thatsmathematics.com/blog/archives/102).

    1. Oczywiście nie wszystko jest nauką. Jestem jednak zwolennikiem bardziej otwartego spojrzenia na to, co jest wkładem w rozwój nauki (np. ,,niedzielni” zwijacze białek).

      Osobiście nie polegałbym za bardzo na niezawodności systemu per-review. Sam fakt ,,zatwierdzenia” przez dwóch/trzech nieznanych recenzentów to średnio więcej niż brak recenzji, ale wyższa średnia to nie wszystko.
      Krytyczne podchodzenie do informacji, czy to z czasopism recenzowanych czy nie recenzowanych, powinno być standardem. Oczywiście w pewnych dziedzinach jest to łatwiejsze (matematyka) a w innych trudniejsze (nauki eksperymentalne).

      Zrozumiałe jest, że nie mając wiele czasu szuka się źródeł gdzie jest większa szansa na znalezienie czegoś ciekawego. Z tego punktu widzenia ciekawą inicjatywą są blogerzy/tweeterzy, którzy robią przegląd prasy dziedzinowej i polecają wybrane artykuły.
      Np. często znajduję ciekawe linki we wpisach http://citizen-statistician.org/ czy http://simplystatistics.org/.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">