Studia doktoranckie z Data Science

Screen Shot 2017-05-07 at 18.11.58

Obrazek po prawej to link do Keep pushing. The illustrated guide to a Ph.D. Matt Might. Warto obejrzeć jako wprowadzenie do poniższego postu.

Wspólne studia doktoranckie MIM UW + MiNI PW

Bezpośrednim powodem przygotowania tego wpisu jest otwarcie jesienią wspólnych studiów doktoranckich przez dwa świetne wydziały matematyczno-informatyczne: Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego oraz Matematyki i Nauk Informacyjnych Politechniki Warszawskiej. Na obu wydziałach można bronić doktoraty albo z informatyki albo z matematyki i oba te wydziały prowadzą studia w obu kierunkach. Ale też na obu wydziałach te dwie ścieżki mają wiele przecięć splatających się wokół czegoś co dziś określa się jako Data Science.

Przygotowuję ten wpis, ponieważ gdy sam robiłem doktorat o pewnych procesach miałem mgliste lub żadne wyobrażenie co doprowadziło do różnych, nie zawsze dobrych, decyzji. To co prawda było już kilkanaście lat temu, ale jak się okazuje pewne wątki są wciąż aktualne a pewne rozterki dotykają kandydatów na studia doktoranckie niezależnie od pokolenia i koniunktury. Od lat pracuję na wydziale, który prowadzi studia doktoranckie, współpracuję z działami badawczymi różnych dużych firm, w których pracują doktoranci i często rozmawiam z osobami przed, w trakcie lub świeżo po doktoracie i wiele z tych osób ma bardzo podobne wątpliwości co do studiów doktoranckich. Stwierdziłem, że szerzej podzielę się moim (bardzo subiektywnym) spojrzeniem na temat wartości takich studiów.

Zacznijmy od kilku statystyk. Liczba osób z doktoratem w różnych krajach jest różna. W Niemczech, USA, UK około 2% populacji na stopień doktora (a nawet w niektórych dziedzinach mówi się o nadprodukcji doktorów, patrz What is a PhD really worth?). W Polsce doktorat ma znacznie mniej osób, coraz więcej osób rozpoczyna studia więc i liczba doktorów rośnie (zobacz Polsce nadprodukcja dyplomów nie grozi)
Zacząć studia doktoranckie nie jest trudno (czasem trzeba zdać egzamin), ale znacznie trudniej jest je pozytywnie zakończyć. W zależności od miejsca, doktoratem kończy się mniej więcej 1/3 do 1/2 rozpoczętych studiów doktoranckich.
W USA i UK około 30% doktorantów studiuje nauki ścisłe w Polsce jest to około 15% doktorantów. Więcej doktorantów znajduje się na ścieżkach humanistycznych (wpis sprzed kilku lat na SP).
Z powyższych statystyk można wyciągnąć taki wniosek, że w Polsce doktorat w naukach ścisłych to jednak dosyć rzadki zasób.

Jak wyglądają studia doktoranckie?

Studia doktoranckie od studiów magisterskich różni bardzo wiele. Przyjrzyjmy się więc temu, jak, z lotu ptaka, takie studia przebiegają.

Zaczyna się od rekrutacji. Najczęściej rekrutacja prowadzona jest jesienią, ale niektóre wydziały otwierają rekrutacje co 6 miesięcy lub częściej.
Kolejny duży krok to otwarcie przewodu doktorskiego. Ostatnim dużym krokiem jest złożenie pracy doktorskiej, zdanie egzaminów i obrona doktoratu. Całość to najczęściej 3-4 lata żmudnej pracy z wieloma porażkami (pionierów poznaje się po strzałach w plecach), to co miało działać nie działa lub działa gorzej niż konkurencyjne rozwiązania.
Czasem też zdarzają się jakieś sukcesy, naszą pracę przyjmą do dobrego czasopisma, nasze rozwiązanie zacznie być szerzej stosowane, uda nam się rozwiązać jakiś naprawdę trudny problem.

Otwarcie przewodu jest o tyle istotne, że konkretyzuje tematykę pracy doktorskiej. Wcześniej (po rozpoczęciu studiów ale przed otwarciem przewodu) kandydat ma opiekuna naukowego ale może go zmienić, ma jakoś zarysowaną tematykę badań ale też może ją zmieniać. Otwarcie przewodu jest często poprzedzone opublikowaniem przynajmniej jednego artykułu w recenzowanym dobrym branżowym czasopiśmie. Otwierając przewód określa się i promotora (ewentualnie promotorów pomocniczych) i temat rozprawy doktorskiej, do obrony już się ich raczej nie zmienia.
W zależności od wydziału, czasem od doktoranta oczekuje się tego by otworzyć przewód na drugim roku studiów doktoranckich, a czasem otwiera się go na kilka miesięcy przed obroną. Otwarcie przewodu umożliwia startowanie w różnych programach grantowych, których jest więcej niż dla doktorantów bez otwartego przewodu.

Pomyślne zamknięcie przewodu to złożenie rozprawy doktorskiej. Zgodnie z artykułem 13 ustawy o stopniach naukowych i tytule naukowym oraz o stopniach i tytule w zakresie sztuki (ustawa może się zmienić, ale na dzień dzisiejszy):

Rozprawa doktorska, przygotowywana pod opieka promotora albo pod opieką promotora i promotora pomocniczego, o którym mowa w art. 20 ust. 7, powinna stanowić oryginalne rozwiązanie problemu naukowego lub oryginalne dokonanie artystyczne oraz wykazywać ogólną wiedzę teoretyczną kandydata w danej dyscyplinie naukowej lub artystycznej oraz umiejętność samodzielnego prowadzenia pracy naukowej lub artystycznej.

To czym jest oryginalne rozwiązanie problemu naukowego zależy od dyscypliny. Dla statystyki matematycznej w dyscyplinie matematyka/dziedzienie nauk matematycznych opracowano pewne wytyczne (patrz wytyczne komisji statystyki), dla informatyki nie znam takich wymogów, ale kilka cennych porównań znajduje się np. w prezentacji prof. Wojciecha Cellarego)

Wpływ na szanse ukończenia doktoratu ma bardzo wiele czynników, takich jak ośrodek, możliwości rozwoju, promotor, otoczenie (wsparcie lub brak ze strony najbliższego środowiska), wymieniać można by długo.
Ale jeden czynnik jest zdecydowanie najważniejszy.
Najważniejszym czynnikiem jest to, czy wiemy po co chcemy ten doktorat robić.
Tylko silna i uświadomiona motywacja pozwoli nam przepracować 4 lata, przeprowadzić często nużące badania literaturowe, zweryfikować jakość naszego pomysłu a następnie wyszlifować artykuły i prezentacje pokazujące jaki to ten nasz pomysł jest świetny (któryś z kolei będzie świetny).

Przy słabej koniunkturze studia doktoranckie mogą być miejscem na przeczekanie roku, ale przy obecnym popycie na absolwentów kierunków ścisłych, doktoranci są nieustannie kuszeni wysokimi (w porównaniu do stypendium) pensjami w przemyśle. Lepiej więc zawczasu zrobić sobie rachunek korzyści i strat. Najczęściej ,,robienia doktoratu” żałują osoby, które nie wiedziały po co chcą go zrobić.

Co daje doktorat?

Formalnie doktorat daje stopień naukowy i nic więcej.
Ale proces pracy nad doktoratem związany jest z pewnymi unikalnymi wyzwaniami i możliwościami.

Różne korzyści można powiązać ze studiami doktoranckimi (wyjazdy na konferencje, praca nad publikacjami, staże badawcze, specjalistyczne kursy), ale najważniejszą jest swoboda w wybieraniu i realizacji projektu badawczego.

Zazwyczaj praca w przemyśle czy biznesie to rozwiązywanie seriami względnie krótkich problemów (max 3-6 msc). Czasem łatwych, czasem trudnych, ale zazwyczaj krótkich, ponieważ większość firm nie stać lub nie ma potrzeby na prowadzenie pogłębionych wieloletnich badań w jednym obszarze. Praca naukowa, do której doktorat jest wstępem, to zazwyczaj jeden pogłębiony problem, który definiuje się i rozwiązuje przez lata. Oczywiście może składać się z podproblemów lub odgałęzień, ale oczekuje się, że praca doktorska pogłębi wiedzę w określonej dziedzinie, a zgłębianie wymaga czasu i koncentracji na określonym kierunku.

Taka perspektywa czasowa pozwala na spokojne planowanie rozwoju osobistego w określonej dziedzinie. Po kilku latach pogłębionych studiów zostaje się ekspertem.
Praca z takim horyzontem czasowym pozwala także na przećwiczenie na naprawdę trudnym projekcie zarządzania zakresem pracy, czasem pracy, planowaniem zadań, itp. Jeżeli w przyszłości chcemy pracować na samodzielnych stanowiskach (na uczelni czy poza uczelnią) to wszystkie te doświadczenia przydadzą się w dalszej pracy zawodowej.

Poza uczelnią, trudno znaleźć miejsce, które da początkującemu pracownikowi 3-4 lata czasu na rozwój w dowolnie wybranym kierunku, bez konieczności nieustannego raportowania i udowadniania ,,opłacalności’’ tego kierunku.
Nawet działy badawcze dobrych firm, stawiających na R&D, żyją zazwyczaj z projektów o krótszym horyzoncie budżetowym. Często za wzór stawia się Google, w którym jeden dzień w tygodniu można przeznaczyć na własne badania, no więc studia doktoranckie to 5 dni w tygodniu na własne badania.
Przychodząc na studia doktoranckie dostaje się możliwość pracy nad określonym zadaniem przez 3-4 lata. A przez taki okres czasu przy odpowiedniej koncentracji można zrobić naprawdę wiele.

Studia doktoranckie dają opiekuna / promotora / czasem ko-promotora, który, jeżeli się go dobrze wybierze, może stać sie mentorem, może pomóc w różnych problemowych sytuacjach, czasem nie tylko naukowych. Koniec końców badania to praca na krawędzi niepewności, w obszarze w którym często nie wiadomo co wyjdzie, a co nie wyjdzie. Bardzo często nie wychodzi i czasem miesiące pracy kończą się dojściem do ściany. Ta niepewność potrafi być sporym obciążeniem psychicznym.

Osobnym tematem są publikacje naukowe i opracowane własne narzędzia/metody. Wymyślenie nowej/lepszej metody diagnozowania nowotworu lub nowej metody estymacji współczynników w modelu liniowym to prawdziwe wyzwanie. Doktorat (podobnie jak studia) potrafi być wspaniałą przygodą, zmierzeniem się z trudnym problemem nawet gdy w przyszłości planujemy pracę poza akademią.

Jak się okazuje osoby z działów badawczych dużych firm na pytanie ,,czego uczyć studentów’’ potrafią odpowiedzieć ,,czegokolwiek, byle trudnego’’ (patrz blog prof. Ewy Damek).

Czego nie daje doktorat?

Z pewnością doktorat nie jest gwarancją wyższej pensji. Nie jest nawet gwarancją awansu społecznego. W skrajnych przypadkach otoczenie może nie uznać naszego dzieła za wartościowe i tylko my lub bardzo wąska grupa osób będzie tę wartość widzieć. Otoczenie (lub my sami) może uznać, że ileś lat życia zmarnowaliśmy na bezskutecznym gonieniu dziwacznej idei po której pozostają wspomnienia nieprzespanych nocy i olbrzymiego stresu.

Są stanowiska, na których nie można pracować bez doktoratu, ale takich miejsc jest poza uczelniami (dzisiaj w Polsce) niewiele.
Z finansowego punktu widzenia znacznie więcej (średnio) można zarobić rozpoczynając pracę zarobkową wcześnie, podczas studiów, pracując po kilkanaście godzin dziennie jako programista czy data scientist czy analityk (o tym ile zarabia dokotrant poniżej). W wielu firmach stopień doktora szufladkuje jako naukowca oderwanego od świata, który nie wie co to znaczy praktyczne rozwiązywanie codziennych problemów.

Doktorat nie daje gwarancji pracy na uczelni. Ostatnio słyszałem takie statystyki, że w Niemczech 90% osób po obronie doktoratu znajduje pracę poza uczelnią, w przemyśle lub biznesie.

Studia doktoranckie nie dają gwarancji ukończenia doktoratu. Współczynnik sukcesu bardzo silnie zależy od motywacji i umiejętności doktoranta, ukończenie pozytywne studiów doktoranckich jest trudniejsze niż ukończenie studiów magisterskich.

Doktorat nie daje gwarancji natychmiastowej gratyfikacji. Przy projektach wysokiego ryzyka, a takie są projekty doktoranckie, może się okazać, że przez jakiś czas (=lata) nic nie wychodzi. Przez pierwsze miesiące prawie na pewno nic nie będzie wychodziło. Coś co miało działać a nie działa. Często na wyniki trzeba czekać latami.

Dla kogo studia doktoranckie?

Osobnym wątkiem, który wyżej nie jest poruszany to dla kogo są studia doktoranckie. Niektóre wydziały stosują egzaminy, niektóre kryterium ocen. Z pewnością studia doktoranckie na ścisłych wydziałach są trudne i słabi studenci albo sobie z nimi nie poradzą, albo będzie ich to kosztowało bardzo bardzo dużo wysiłku. To jest zgodne z intuicją.

Ale co jest mniej zgodne z intuicją to na ile przewagę na studiach mają studenci piątkowi nad solidnymi czwórkowymi. Tutaj sprawa nie jest tak oczywista. Z pewnością solidne przygotowanie jest niezbędne, ale w przeciwieństwie do zwykłych studiów nie chodzi o bardzo dobrą znajomość wielu działów ale o wyśmienitą biegłość w wąskiej specjalizacji. Motywacja i głębokie zainteresowanie wybraną tematyką badawczą zaczynają grać pierwszoplanową rolę.

Kolejna rzecz, to inny sposób oceny postępów prac. O ile na zwykłych studiach do zaliczenia wystarczy zdanie projektu lub egzaminu, to w przypadku studiów doktoranckich postęp liczy się opublikowanymi dobrymi pracami. Pisanie takiego artykułu jest trudne z różnych powodów, jednym jest to że niewiele jest miejsc, gdzie się tego można wcześniej nauczyć (ale są do tego i książki i kursy, trzeba poszukać). Pisanie artykułu wymaga rozbudowanych umiejętności komunikacji i to z osobami o bardzo specjalistycznej wiedzy.

Ile zarabia doktorant?

W oczywisty sposób, bardzo istotną kwestią jest wynagrodzenie. Doktorant ma kilka opcji wiązanych stricte z uczelnią:
– doktoranci mogą być przyjmowani na studia ze stypendium lub bez stypendium. ,,Zwykłe’’ stypendium to zazwyczaj kwota około 1000-1500 zł miesięcznie, jest nieopodatkowane i nie odprowadza się od niego składek. Stypendium zazwyczaj jest związane z oczekiwaniem prowadzenia dodatkowych zajęć dydaktycznych (ćwiczeń lub laboratorium) w wymiarze 90h rocznie.
– doktoranci pracujący w grantach mogą liczyć na rozszerzone stypendium grantowe. Jest ono zazwyczaj wyższe (~3000 zł) ale też zazwyczaj wymaga prowadzenia badań w kierunku silnie związanym z grantem.
– doktoranci mogą być zatrudnieni na stanowisku asystenta naukowego. Zazwyczaj jest to możliwe przy finansowaniu z grantu. Wysokość zatrudnienia jest określana przez kierownika grantu, od wynagrodzenia odprowadzane są dodatkowe składki na podatki i ubezpieczenia. Asystent naukowy nie ma dydaktyki, asystent naukowo-dydaktyczny musi prowadzić zajęcia dla studentów.

Poza bazowym wynagrodzeniem częstym dodatkowym źródłem dochodu są:
– umowy o dzieło realizowane w ramach grantów badawczych najczęściej rozliczane oprogramowaniem lub przygotowaniem artykułu (w zależności od grantu badawczego stawki są różne),
– dofinansowania z funduszy krajowych lub samorządowych na wynagrodzenia lub badania dla doktorantów (kwoty i częstotliwość bardzo różne),
– własne granty na badania. Agencje grantowe typu NCN czy FNP mają programy skierowane dla doktorantów, można wnioskować o grant na własne badania do daje jeszcze większą samodzielność w kierunku badań.

Poza wyjątkami, na studiach doktoranckich zarabia się mniej niż pracując w biznesie, co nie powinno dziwić gdy na studia patrzy się jak na inwestycję we własny rozwój a nie pracę zarobkową.

Popularne jest łączenie pracy zarobkowej ze studiami doktoranckimi, najczęściej w wyniku presji otoczenia, że po studiach to już wypadałoby poważnie zarabiać. Takie rozwiązanie może mieć sens, gdy tematyka pracy naukowej jest silnie związana z pracą zawodową. Jednak są to bardzo rzadkie przypadki i zazwyczaj pracując dodatkowo podczas doktoratu tracimy najcenniejszy atut studiów doktoranckich, czy okres na prawdziwie głębokie studiowanie jakiegoś obszaru wiedzy bez rozpraszajek w rodzaju ,,ten raport trzeba zrobić w tym tygodniu’’. O wartości głębokiego skupienia na problemie można przeczytać np. w książce lub na blogu Deep Work.

Co po doktoracie?

Niedawno byłem na debacie z okazji XXX lecia Instytutu Matematyki Stosowanej i padła na niej bardzo ciekawa statystyka. Otóż jedna z osób, pracująca w Niemczech, powiedziała, że na jej uczelni 90% doktorantów po obronie doktoratu idzie (ponieważ chce) pracować do przemysłu. Pozostałe 10% pozostaje na uczelni. Przed wyborem dalszej ścieżki bardzo popularne są roczne lub kilkuletnie staże doktorskie tzw. post-doc.
Nie tylko zresztą w Niemczech pracownicy z doktoratem są cenieni, tutaj znajduje się ciekawy artykuł wymieniający zalety pracowników ze stopniem doktora.

Jeżeli macie ciekawe przemyślenia związane ze studiami doktoranckimi podzielcie się w mailu lub poniższych komentarzach.

Za pomoc w przygotowaniu tego artykułu dziękuję Witowi Jakuczunowi i Łukaszowi Maciejewskiemu.
Zapraszam do kontaktu osoby zainteresowane pracą naukową wokół tematów związanych ze stosowaną statystyką lub uczeniem maszynowym.

13 thoughts on “Studia doktoranckie z Data Science”

    1. Plakat i ogłoszenie o tych studiach dopiero powstają. Napiszę o nich gdy już zostaną ogłoszone. Afaik będzie osobna rekrutacja, ale będzie można przedmioty dowolnie wybierać z oferty obu wydziałów.

  1. Skoro temat taki na czasie, to czy przewidujecie formę niestacjonarną albo zdalną tych studiów?
    Czy można je odbyć bez części dydaktycznej lub mieć zaliczone zajęcia prowadzone poza Warszawą?

    Dziękuję z góry za odpowiedź,
    Kasia

    1. To pytania do kierownika studiów doktoranckich (można znaleźć na stronach wydziałów).
      Jeżeli ktoś jest za granicą na współpracy naukowej to nie ma zajęć ani dydaktyki ale jest na studiach, więc w uzasadnionych przypadkach pewnie jest możliwe.

  2. Chciałbym dokleić się do pytania Kasi.
    Mieszkam w PL, poza Warszawą. Z pewną, ograniczoną, możliwością wizyty w Warszawie, raz na jakiś czas.
    Pracuję zawodowo jako IT I ze względów ekonomicznych nie chciałbym rezygnować z pracy w biznesie. Chciałbym jednak wykorzystać swoje wykształcenie, by poszerzyć horyzont o Data Science czy machine learning od zera przy ciekawym projekcie.
    Oczywiście rozumiem że mam ograniczone możliwości czasowe (8h w biurze), ale praca nad ciekawym I przydatnym naukowo projektem brzmi zachęcająco. Czy taki scenariusz jest realny?

    1. Moim zdaniem, jeżeli ktoś pracuje na pełen etat i robi rzeczy nie związane bezpośrednio ze studiami doktoranckimi, to nie będzie miał ani czasu ani energii by sensownie ukończyć studia doktoranckie.
      Odległość od Warszawy nie jest istotna, niektórzy są przez pół roku lub rok za granicą na projekcie.
      Ale istotna jest ilość ciągłego czasu, który można przeznaczyć na walkę z nowymi trudnymi problemami.
      Pewnych rzeczy nie da się po prostu zrobić po godzinach czy przez weekend.

      Istnieją oczywiście opiekunowie naukowi, którzy są bardziej optymistyczni/liberalni. Ww. to wniosek z moich doświadczeń i obserwacji.

    2. Jak ktoś ma mało wolnych dużych ramek czasowych tygodniowo, a chce poszerzyć horyzonty, to lepiej na początek wybrać studia podyplomowe z interesującej nas tematyki niż studia doktoranckie. Później napisać trochę artykułów i mając już jakiś większy dorobek otworzyć przewód.
      Robienie doktoratu to była straszna szarpanina. Same egzaminy, pisanie pracy i obrona były najłatwiejsze, ale badania…. Mając rodzinę pewnie nie dałbym rady, pracując na etacie na 100% też nie.

  3. Dziękuję za odpowiedź. Faktycznie, doba jest za krótka 🙂 Pracuję z danymi (bazy relacyjne), ale z innej perspektywy niż analiza, więc pewna część wspólna istnieje, jednak są różnice.
    Czy zatem, odkładając na bok projekt doktoratu, mógłby Pan polecić projekty, zadania, problemy, nad którymi można się pochylić, by zdobyć przy ich okazji doświadczenie I wiedzę? Doktorat traktowałem jako swego rodzaju środek do celu, jskim jest zrozumienie zagadnień ML itp.
    Można to zapewne zrobić „obok” doktoratu.
    Stawiam na zrozumienie tematu, bardziej niż prestiż tytułu czy ekonomię.

    1. Pierwsza rzecz która mi przychodzi do głowy: 1 czerwca otwieramy MI^2 Data Lab na MiNI PW. W założeniu, będzie to miejsce pracy nad ciekawymi projektami badawczymi dotyczącymi analizy danych. O ciekawych projektach będziemy informować na stronie FB labu https://www.facebook.com/MI2DataLab/.

        1. Na Uniwersytecie Medycznym w Białymstoku być może organizowana będzie kolejna edycja studiów podyplomowych z biostatystyki, ale omawiana metodologia wykorzystywana jest również w innych gałęziach nauki. Niestety tegoroczna edycja nie wystartowala z uwagi na niewystarczającą liczbę kandydatów o odpowiednim profilu. Poprzednie wersje odbywały się w trybie zdalnym, na miejscu jedynie 2 weekendowe sesje egzaminacyjne. Poziom, jak na studia podyplomowe, uważam za wysoki. Koncentrowały się na modelowaniu – GLM, analiza przeżycia, modele mieszane. Poza tym na wstępie wprowadzenie do statystyki częstościowej, a na koniec clinical trials.

  4. Szukam informacji na temat tych studiów i tez ewentualnych przedmiotow, ktore sa oferowane w trakcie i nic nie mogę znaleźć. Obecnie robie mgr z Ekonomii na Uniwersytecie w Bonn i poza dwoma ogólnymi ekonomicznymi przedmiotami realizuje same przedmioty ze specjalności Ekonometria i Statystyka. W tym semestrze mam np. Computational Statistics i poznajemy na tym przemdmiocie różne metody ML a przy tym programujemy prawie na każdych zajęciach w R/Python. Wcześniej robiłem Informatykę na EiTI na inż., ale nie byłem jakimś bardzo wybitnym studentem, a najbardziej podobała mi się duża zawartość matematyki w programie. Bardzo chciałbym zostac specjalista w DS i mieć nie tylko doświadczenie w pracy, ale też zostać ekspertem dzięki takim właśnie studiom. Mnie bardziej interesowaloby wykorzystanie DS/ML w takich bardziej spolecznych/ekonomicznych obszarach. Zastanawiam się, czy byłbym wystarczająco dobry, żeby zrealizować te studia robiac dr z matematyki. Zastanawiam się też, czy w ogole jest to mozliwe, zeby nie tylko studiowac, ale tez zdobywac jakies doswiadczenie w pracy. Eh doba jest za krótka

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *