Wizualizacja danych to nie trzaskanie wykresów

W ,,Esejach o sztuce prezentowania danych” jest rozdział Droga poświęcony procesowi dłubania przy historiach, które chcemy pokazać. Wniosek jest taki, że wykres jest częścią procesu poznawania zależności w danych. Jeżeli nie ma tego procesu i pokazujemy maszynowo liczby bez wnikania co one znaczą, otrzymujemy nie z wizualizację danych ale jakiś obrazek.

Temat procesu tworzenia wizualizacji trafił dzisiaj na FlowingData, wraz z linkiem do bardzo ciekawego bloga Jake’a Porwaya. Ten jeden konkretny wpis można streścić do zdania: ,,data visualization without rigorous analysis is at best just rhetoric and, at worst, incredibly harmful” (wizualizacja danych, bez drobiazgowej analizy, jest w najlepszym przypadkiem zwykłą retoryką, w najgorszym przypadku staje się niebezpieczna).

Osoby, które interesują się wizualizacją danych, koniecznie powinny ten blog przeczytać.
Pozostałych może zachęci poniższy wykres.

Screen Shot 2016-04-07 at 13.50.05

Histogram pokazujący częstość aresztowań związanych z prostytucją pokazuje ,,wyraźny sygnał” w postaci skoku aresztowań w środy. Do takiego wykresu można oczywiście dorobić niejedną teorię tłumaczącą dlaczego tak jest. Ale teorie, bez głębszej analizy, są po prostu szkodliwe. I w bardzo barwny sposób Jake Porway opisuje to na swoim blogu.

2 thoughts on “Wizualizacja danych to nie trzaskanie wykresów”

  1. Muszę stanąć w obronie retoryki, która w tym cytacie według autora jest mniejszym złem. Kwintylian się w grobie przewraca (no, jego mikrocząstki). W każdym razie dzięki za ten cytat – może być niezłym punktem wyjścia do rozważań na temat związków retoryki z wizualizacją danych/ infografikami.

    1. Leo Breiman napisał kiedyś artykuł ,,Statistical Modeling: The Two Cultures” o różnicach w podejściu do modelowania statystyków, którzy niby odpowiadają na podobne pytania i posługują się podobnymi narzędziami, ale bardzo różnią się w podejściu do modelowania.

      W obszarze wizualizacji danych takich plemion jest pewnie jeszcze więcej. Na ile perswazja jest dozwolona na wykresach a na ile nie można jej uniknąć?

      Bardzo, bardzo chętnie przeczytałbym spójny tekst opisujący retorykę języka wizualizacji danych.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *