Zrób to sam – PISA 2009 DIY, od podszewki…

(… kontynuacja wtorkowego wpisu Tomasza Owczarka)

Zgodnie z zapowiedzią, w dzisiejszym wpisie pokażę, w jaki sposób dokonywać prostych modyfikacji w zaprezentowanej wizualizacji. Wpis ten jest przeznaczony przede wszystkim dla osób, które chciałyby wykorzystać ją w celach dydaktycznych (wcześniej dostosowując do swoich potrzeb), a które nie miały wcześniej do czynienia z Tableau czy innymi podobnymi narzędziami. Pozostałych mam nadzieję zainteresować krótkim opisem programu Tableau Public i swoimi wrażeniami związanymi z jego użytkowaniem. Dla osób, które poczują się zachęcone do zapoznania się z Tableau, zamieszczam subiektywny wybór linków do materiałów na jego temat. Jeśli natomiast wśród czytelników znajdą się tacy, którzy już z niego korzystali ,,jeszcze zanim to było modne”, namawiam do dzielenia się uwagami :).

Na wszelki wypadek zaznaczę, że nie jestem w żaden sposób związany z firmą Tableau Software (a szkoda :) ). Głównym celem wpisu nie jest promowanie produktu określonego producenta (to raczej efekt uboczny), tylko popularyzacja narzędzia edukacyjnego utworzonego za jego pomocą. Wszystkie zamieszczone w tekście opinie są moimi prywatnymi, wygłoszonymi z nieprzymuszonej w żaden sposób (ani kijem, ani marchewką) woli. A jedyną moją korzyść stanowić będzie pozytywna reakcja czytelników :)

Ogólnie o Tableau Public

Udostępniona wizualizacja została przygotowana za pomocą programu Tableau Public. Program ten jest darmowy i w pełni funkcjonalny (w tym sensie, że nie zauważyłem, aby były w nim zablokowane jakieś sposoby prezentacji danych). W porównaniu do płatnej wersji cechują go jednak pewne ograniczenia, np. w rodzajach źródeł danych wejściowych (na szczęście pozostawiono możliwość importu danych z pliku tekstowego). Wśród najważniejszych ograniczeń wymienić należy dwa. Po pierwsze, maksymalna liczba rekordów wynosi tutaj 100tys. (przy wczytywaniu większych zbiorów danych program pozwala na ich selekcję wg wybranego kryterium, co jest dość wygodne). Po drugie, nie ma możliwości zapisu projektu na lokalnym dysku – wszystko trafia do chmury. Wypisane ograniczenia mają następujące implikacje:

1. Zapisanie projektu wymaga posiadania konta na stronie Tableau Public.

2. Nasze projekty dostępne są dla każdego, kto zna ich adres url. Taki ktoś może projekt ściągnąć, zmodyfikować, a następnie zapisać na swoim koncie.

3. W programie otworzyć można jedynie te projekty, które znajdują się na serwerach Tableau Public.

Jak widać, praca z tym programem ma swoje minusy – jesteśmy uzależnieni od kaprysów producenta i jego zasobów, które jak się okazuje nie zawsze chcą współpracować:

Na szczęście tego typu problemy pojawiają się rzadko i jedynie na krótką chwilę. Także ilość dostępnego miejsca na projekty dla indywidualnego użytkownika (50MB) nie jest powalająca.

Parafrazując klasyka, chodzi jednak o to, aby minusy nie przesłoniły nam plusów. Takie rozwiązanie pozwala bowiem na dzielenie się z resztą świata w sposób pełny swoimi danymi i pomysłami na ich prezentację. Jeśli więc ktoś jest w stanie zaakceptować wymienione niedogodności, w zamian otrzyma jedno z najbardziej zaawansowanych, dopracowanych i wygodnych narzędzi do wizualizacji (nie mylić z analizą statystyczną) danych. Oraz stabilnych – w trakcie pracy z programem tylko raz udało mi się go zawiesić (dokładniej to trzy razy, ale w tym samym miejscu – bug albo twórcy nie przewidzieli mojej pomysłowości ;) ). Aha, Tableau jest tylko na Windowsa…

Ściąganie i podstawowa edycja projektu

Tak jak już wspomniano, projekty opublikowane za pomocą Tableau Public są dostępne dla każdego. Kliknięcie w link Download znajdujący się w prawym dolnym rogu wizualizacji przenosi na stronę, z której można pobrać cały tzw. workbook. Ściągnięty plik z rozszerzeniem .twbx należy następnie otworzyć w zainstalowanym wcześniej Tableau Public (przy otwieraniu pliku konieczne jest podłączenie do sieci, ponieważ program sprawdza, czy plik ten znajduje się na serwerze).

Na projekt omawianej wizualizacji składa się sześć zakładek, z których ostatnia („PISA 2009”) to tzw. dashboard (hmm, tablica?) zawierająca pozostałe pięć wykresów oraz dodatkowe opisy. Edycja tych ostatnich jest bardzo intuicyjna – wystarczy dwukrotne kliknięcie w wybrany element, aby pojawiło się okno z prostym edytorem pozwalającym na dokonanie zmian (intuicyjność Tableau to jedna z jego największych zalet, na każdym kroku widać, że jego projektanci świetnie znają przyzwyczajenia użytkowników oprogramowania).

Po dokonaniu stosownych modyfikacji, projekt można zapisać do sieci. Jak już wspomniano, wymaga to posiadania konta w serwisie.

Edycja (trochę) bardziej zaawansowana

Przeglądając zakładki z poszczególnymi wykresami (1-5) można zauważyć, że cały projekt zawiera znacznie więcej zmiennych (danych z badania PISA) niż te uwzględnione w ostatecznej wersji wizualizacji (zmienne znajdują po lewej stronie okna programu).  Dla osób, które chciałyby zająć się poważniej tematem, otwiera to możliwość dalszego eksperymentowania. Stosunkowo proste jest wzbogacenie wizualizacji o dodatkowe zmienne, które w narzędziu określiliśmy mianem „Zainteresowania”. W ostatecznej wersji znalazły się takie trzy (czytanie, komputer: gry oraz komputer: komunikacja). Pokażę teraz, w jaki sposób dołożyć do nich kolejną, przykładowo niech będzie to zmienna komputer: fora internetowe, wirtualne społeczności (interpretacja przyjmowanych przez nią wartości jest taka sama, jak w przypadku pozostałych zmiennych związanych z komputerem). Należy to wykonać w trzech krokach:

1. Modyfikujemy parametr Zainteresowania (p). Stanowi on swoisty „przełącznik” zmiennych i należy dopisać do niego kolejną opcję, aby możliwy był wybór nowej zmiennej. W tym celu należy kliknąć prawym przyciskiem myszy na ten parametr (lewy dolny róg okna programu) i wybrać Edit. Pojawi się okno z listą wartości, do której dopisujemy nową opcję.

2. Należy dokonać edycji sztucznej zmiennej Zainteresowania. Jest to zmienna warunkowa, która przyjmuje wartości innych zmiennych w zależności od aktualnej wartości parametru Zainteresowania (p). W tym celu należy znaleźć ją w oknie Dimensions po lewej stronie, kliknąć prawym przyciskiem myszy i wybrać opcję Edit. W oknie, które się pojawi – przed słowem END – należy dopisać następującą linijkę kodu:

WHEN “komputer: spolecznosc” THEN [komputer: fora internetowe, wirtualne spolecznosci]

3. Pozostała jeszcze jedna rzecz do zrobienia. Niewielka część rekordów może zawierać brakujące dane, które również znalazłyby się na wykresie (w przypadku tej zmiennej brakujące lub nieprawidłowe dane kodowane są za pomocą wartości 7, 8, 9). Z wykresu należy więc odfiltrować te rekordy. W tym celu należy przeciągnąć zmienną komputer: fora internetowe, wirtualne społeczności do panelu Filters, po czym zaznaczyć wartości, które mają być uwzględniane, tzn. od 1 do 4. (Nieuwzględnianie niektórych rekordów z brakującymi danymi w poszczególnych wykresach niesie ze sobą jednak skutki uboczne – przykładowo, różnica w filtrach między dwoma górnymi wykresami wizualizacji powoduje, że średnie wyniki z testów w danym kraju na obu tych wykresach nie są takie identyczne. Ale coś za coś).

I to wszystko – wizualizacja zostanie automatycznie uaktualniona i od tej pory możemy cieszyć się nową opcją dotyczącą zainteresowań uczniów.


Jeżeli film się nie otwiera, kliknij tutaj.

Gdzie dalej?

Oczywiście przedstawione tutaj możliwości edycji tego narzędzia to tylko wierzchołek góry lodowej. Bardziej szczegółowy opis wymagałby jednak dokładniejszego wprowadzenia do Tableau i jego obsługi, co wykracza poza ramy tego wpisu. Ze swej strony mogę tylko gorąco zachęcić do wszystkich zainteresowanych do zapoznania się z tym programem. Możliwości, które oferuje, są naprawdę olbrzymie, a krzywa uczenia się jego obsługi jest umiarkowana. Dodatkowym atutem jest żywe forum, na którym można znaleźć odpowiedzi na większość pytań. Początkujący powinni zacząć od obejrzenia filmów instruktażowych na tej stronie, a później być może sięgnąć do artykułów w bazie wiedzy. Bogaty zbiór linków do ciekawych materiałów znaleźć można na stronie drawingwithnumbers.artisart.org (osobom o stosunkowo niewielkim doświadczeniu w analizie danych szczególnie polecam pierwszy link z  tego zestawu).

I to by było na tyle. Dziękuję wszystkim, którzy przebrnęli przez cały ten wpis ;) Mam nadzieję, że zainspiruje on kogoś do potraktowania udostępnionej wizualizacji w możliwie najbardziej twórczy sposób.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">