Rozwój statystyki w Polsce

bedlewo
(zdjęcie ze strony IMPAN)

Na trwającej właśnie w Będlewie konferencji Statystyka Matematyczna (strona www), obradował ,,Zespół do spraw rozwoju statystyki matematycznej i jej zastosowań’’, który pracuje przy Komisji Statystyki, Komitetu Matematyki Polskiej Akademii Nauk (strona www komisji). Będąc członkiem zespołu stwierdziłem, że pewne punkty zebrania mogą być ciekawe dla szerszego grona statystyków.

Jednym z punktów pracy zespołu, była prezentacja dr. hab. Jacka Leśkowa pt. ,,Możliwości rozwoju statystyki w Polsce”. Prezentacja poświęcona ścieżce awansu naukowego w statystyce w Polsce, problemom związanym z dydaktyką statystyki i perspektywom rozwoju statystyki we współpracy z przemysłem/biznesem. Za zgodą autora umieszczam link do tej prezentacji (link tutaj).

Danych jest coraz więcej, potrzeb ich analizy jest coraz więcej, zapotrzebowanie na specjalistów potrafiących odpowiedzialnie te dane analizować . To oczywiście i stwarza nowe możliwości i wyzwania dla statystyków na całym świecie. Pytanie jak polska statystyka się w tym trendzie odnajdzie.

Ta prezentacja sprowokowała bardzo ciekawą dyskusję. Okazuje się bowiem, że wiele ciekawych rzeczy się w Polsce dzieje, nie zawsze tylko o nich wszystkich wiemy. A że na sali była kadra z każdego większego miasta więc i o wielu inicjatywach można było się dowiedzieć. Wybrane punkty:

  • GUS (czy też US w Kielcach) razem z PTS i kilkoma uczelniami zorganizował Olimpiadę Statystyczną dla szkół średnich
    (strona www).
    Dobre wyniki w takiej olimpiadzie są związane z bonusami w rekrutacji na uczelnie, więc i powinno wzrosnąć zainteresowanie statystyką wśród uczniów szkół średnich.
  • W różnych miastach (Kraków, Wrocław, Warszawa, …) powstają specjalności wokół tematyki data science, tworzone przy współpracy statystyków z informatykami. Różnie się te specjalności nazywają, ale tematyka krąży wokół terminów big data/data science.
  • Rozwija się współpraca uczelnia – biznes. Pojawiają się działy badawcze firm współpracujące na różnych płaszczyznach z zakładami statystyków na uczelniach (w Warszawie takich przykładów jest pełno, z autopsji znam współpracę z Allegro, CNK, IIMCB, Applica, ale dowiedziałem się o takich inicjatywach w Zielonej Górze – firma cinkciarz, Poznaniu – firma OLX, Krakowie – firma IBM, we Wrocławiu – bank BZWBK). Tak więc w wielu miastach rodzą się bardzo ciekawe inicjatywy na styku uczelni i biznesu, oby więcej.
  • Rozwija się popularyzacja zawodu statystyka wśród uczniów szkoły średniej. Profesor Przemysław Grzegorzewski opowiadał o bardzo ciekawej inicjatywie, odwiedzania przez zawodowych statystyków szkół średnich z pogadankami na temat tego co też ciekawego ten data scientist może robić. Nic nie działa lepiej na wyobraźnię młodzieży niż przykład.

Gdzieś na horyzoncie krążą są plany utworzenia nowej dyscypliny.

6 myśli na temat “Rozwój statystyki w Polsce”

  1. Pytanie z zakresu metodyki :)
    Spotykam czasami w publikacjach analizy statystyczne wyników ankiet przeprowadzonych wśród jakiejś grupy zgromadzonej akurat w tym samym miejscu i czasie (np. podczas konferencji, seminarium, wśród uczestników studiów podyplomowych itp.). Autorzy często w podsumowaniu zaznaczają, że “próba nie była losowa”, “niekoniecznie była reprezentatywna” i wyników “nie można uogólniać”. Ale to nie przeszkadza im wcześniej badać istotności statystycznej (np. różnic w podgrupach). Czy brak możliwości uogólnienia nie kłóci się z istotą statystycznej istotności?

    I drugie pytanie. Przemek, czy może wiesz, czy na jakiejś uczelni w Polsce jest prowadzony kierunek studiów “Statystyka”? Nie specjalność na matematyce czy ekonomii, ale właśnie kierunek studiów?

    1. Ad 1:
      W badaniach społecznych ‘prawdziwie losowe’ próby raczej nie istnieją. Nawet wybieranie respondentów po PESEL nie gwarantuje dotarcia do wszystkich wylosowanych numerów. Ale często wystarczy próba ‘dostatecznie losowa’ a błędy wynikające z jakichś tam zakłóceń można redukować (ważąc próbę). Jak dla mnie ankiety na konferencjach to raczej zabawa niż badanie czegokolwiek. Czasem oczywiście taka zabawa może mieć sens, np. R-Ladies badają obecność kobiet wśród autorów pakietów, studentów i uczestników konferencji. Badanie uczestników konferencji use-R jest jakimś tam proxy do populacji uczestników konferencji data-science z R. Ale nawet tutaj zupełnie inaczej wyglądają uczestnicy gdy konferencja jest w Stanach a inaczej gdy jest w Europie.

      Ad 2:
      Nie znam. Zerknąłem na stronę ‘http://www.studia.net/spis-wszystkich-kierunkow-studiow’ i tam też nie ma takiego kierunku. O ile pamiętam do uruchomienia kierunku potrzebnych jest 6 samodzielnych pracowników naukowych. Afaik na dziś dzień nie ma uczelni spełniającej to wymaganie w statystyce. Prędzej już powstanie Data Science zasilana dodatkowo przez informatyków.

  2. Dzięki za odpowiedź :)

    ad 1.
    Nie żebym negował sensowność takich badań. Np. badania popularności narzędzi albo języków programowania wśród uczestników tematycznych konferencji, albo chociaż to co zaprezentowała Heather Turner na eRum, są niezwykle cenne (szczególnie, jeśli dotyczą kilku punktów w czasie). Tylko że tutaj przynajmniej nie wyciąga się “armat” o charakterze konfirmacyjnym (weryfikacyjnym, falsyfikacyjnym – co kto woli). Moje wątpliwości dotyczą sensowności sprawdzania istotności statystycznej wraz z jednoczesnym stwierdzeniem o “braku możliwości uogólnienia wyników”. Czy to nie jest sprzeczne?

    ad 2.
    No właśnie ja też nie. W ogłoszeniach o pracę (także polskich firm) widzę czasami wymóg “MSc degree in statistics”. I zastanawiam się, które ogłoszenie zagraniczne oni przekopiowali ;)

    (wg ostatniego rozporządznia MNiSW minima kadrowe to obecnie:
    – I stopień, profil ogólnoakademicki – 3 samodzielnych, 6 doktorów,
    – I stopień, profil praktyczny – 1 samodzielny, 5 doktorów,
    – II stopień – 6 samodzielnych, 6 doktorów

    Ale liczy się dorobek, a nie dyscyplina naukowa habilitacji. A to, umówmy się, jest trochę umowne ;)

    źródło: http://dziennikustaw.gov.pl/du/2016/1596)

    1. Łatwiej się odnieść do konkretnego badania, niż ogólnie do takiego postępowania.
      Np. na NIPSie badano jaka jest zgodność recenzji różnych recenzentów dla tego samego zgłoszonego referatu. Otrzymano jakieś wyniki dotyczące referatów z NIPSu, raczej bez możliwości uogólnienia wyników na wszystkie konferencje. Wnioskowanie dotyczące parametrów powinno dotyczyć jakiejś populacji, ale to już na sumieniu badacza jest określenie jaką populacje opisuje.

      Zresztą, all models are wrong but some are useful.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">