Kategoryzacja jednostek, aplikcja dla NZ / SI / HS

Problem z hobby polega na tym, że trudno się od niego oderwać.
A na temat:
Z uwagi na zainteresowanie wizualizacją różnych kryteriów oceny jednostek naukowych zrobiłem aplikację, pozwalającą na przeglądanie wyników jednostek dla trzech dziedzin.

Pod adresem http://glimmer.rstudio.com/sondaze/parametryzacja/ znajduje się taka aplikacja:

Ponieważ na serwerze glimmer działa wiele aplikacji (to darmowy hosting), więc po jakimś czasie bezczynności ta apliakcja jest zabijana (okno aplikacji zrobi się szare) i trzeba odświeżyć stronę aplikacji.

Aplikacja ta pozwala na wybranie dziedziny (Nauki o życiu, Ścisłe, Humanistyczne) oraz dwóch kryteriów. Dla takiej kombinacji dostępne mamy trzy zakładki.

Pierwsza przedstawia wykres interaktywny. Przedstawia ona wszystkie jednostki z możliwością podejrzenia nazwy wskazanej jednostki przez najechanie na nią myszką.
Druga zakładka pozwala na pobranie wykresu w formacie pdf.
Trzecia zakładka pozwala na pobranie danych w formacie csv. Gdyby ktoś chciał liczyć korelacje czy coś innego to nie ma sensu by na nowo wyciągał te dane z pdf’a. Skoro już raz ktoś przez to przeszedł. Niepotrzebnie, takie dane od początku w cywilizowanym kraju powinny być publikowane w formacie pozwalającym na ich przetwarzanie.

Kody źródłowe dla tej aplikacji i wszystkie wykresy można pobrać z mojego konta na github, czyli tutaj.

Kategoryzacja jednostek, nauki humanistyczne i społeczne

Wczoraj przedstawialiśmy ocenę parametryczną jednostek w kategorii nauk ścisłych, dziś przyjrzymy się naukom humanistycznym i społecznym.

Poniżej przedstawiamy wykresy punktowe przedstawiające po dwa z czterech kryteriów oceny. Gdyby te wykresy się nie wyświetlały, to można je zobaczyć bezpośrednio pod tym adresem i tym adresemchrome wystarczy odświeżyć stronę, w feedly trzeba przejść na stronę bloga).

Oglądając wyniki dla osiągnięć naukowych i potencjału naukowego jednostek widzimy, że potencjał naukowy miał znacznie mniejszy wpływ na ocenę niż osiągnięcia. W przeciwieństwie jednak do nauk ścisłych, gdzie kolory kropek a tym samym kategorie były wymieszane, w tym przypadku wyraźnie końcowa ocena zależy głównie od osiągnięć naukowych.

Przesunięcie kursora nad punktem wyświetli nazwę jednostki.

Porównując materialne efekty działalności i pozostałe efekty działalności rzuca się w oczy pozycja IBE, która deklasuje konkurencję.

Przesunięcie kursora nad punktem wyświetli nazwę jednostki.

Dwie zmienne, które najczęściej ważyły na końcowej ocenie to osiągnięcia naukowe oraz pozostałe efekty.

Co ciekawe, w tym przypadku widzimy jak kroki wyraźnie układają się w cztery warstwy. Zupełnie inaczej wyglądała sytuacja w naukach ścisłych.

W tym przypadku oceny wydają się być bardziej ,,jednowymiarowe”. Wyżej oceniane jednostki mają wyższe średnie oceny niż niżej oceniane. Jak wczoraj widzieliśmy, dla nauk ścisłych sytuacja jest zupełnie inna.

Kategoryzacja jednostek naukowych

Ten wpis dotyczy wyłącznie nauk ścisłych, osoby zainteresowane też naukami przyrodniczymi czy humanistycznymi zapraszam do zapoznania się z tym wpisem.

Kilka dni temu, pod hasłem ,,Wizytówki polskiej nauki” ministerstwo opublikowało ocenę parametryczną jednostek naukowych. Każda z jednostek trafiła do jednej z czterech kategorii A+ (czyli elita, cytując ministerstwo), A, B i C (czyli ,,silne ostrzeżenie”). Od kategorii zależy wysokość dofinansowania ze strony ministerstwa, które otrzyma jednostka.

Na zaklasyfikowanie jednostki do kategorii wpływ miały cztery kryteria:
** Kryterium I – Osiągnięcia naukowe i twórcze
** Kryterium II – Potencjał naukowy
** Kryterium III – Materialne efekty działalności naukowej
** Kryterium IV – Pozostałe efekty działalności naukowej

Z plików pdf opublikowanych przez ministerstwo (dobrze, że nie zdjęcia wydrukowanych kartek, też cyfrowy format) udało się wyciągnąć dane. Poniżej przedstawię graficznie dane dla kategorii ,,Nauki ścisłe i inżynierskie”. Kody, wykresy i pliki źródłowe użyte do wykonania tych wizualizacji dostępne są tutaj, więc jeżeli kogoś interesują inne kategorie i lubi wyciągać dane z pdfów, zapraszam.

Zanim pokażemy surowe dane, przedstawimy problem odwrotny.

Podczas oceny jednostek na podstawie ocen cząstkowych przypisywano jednostki do czterech kategorii. Problemem odwrotnym będzie użycie algorytmu klasyfikacji (tutaj drzew klasyfikacyjnych) aby zobaczyć, które czynniki były decydujące w ,,przypisaniu” jednostki do określonej kategorii.

Poniższe drzewo decyzyjne (celowo obcięte do trzech poziomów) pokazuje czym charakteryzują się jednostki wysoko i nisko oceniane.

Czytaj dalej Kategoryzacja jednostek naukowych