Wizualizacja danych to nie trzaskanie wykresów

W ,,Esejach o sztuce prezentowania danych” jest rozdział Droga poświęcony procesowi dłubania przy historiach, które chcemy pokazać. Wniosek jest taki, że wykres jest częścią procesu poznawania zależności w danych. Jeżeli nie ma tego procesu i pokazujemy maszynowo liczby bez wnikania co one znaczą, otrzymujemy nie z wizualizację danych ale jakiś obrazek.

Temat procesu tworzenia wizualizacji trafił dzisiaj na FlowingData, wraz z linkiem do bardzo ciekawego bloga Jake’a Porwaya. Ten jeden konkretny wpis można streścić do zdania: ,,data visualization without rigorous analysis is at best just rhetoric and, at worst, incredibly harmful” (wizualizacja danych, bez drobiazgowej analizy, jest w najlepszym przypadkiem zwykłą retoryką, w najgorszym przypadku staje się niebezpieczna).

Osoby, które interesują się wizualizacją danych, koniecznie powinny ten blog przeczytać.
Pozostałych może zachęci poniższy wykres.

Screen Shot 2016-04-07 at 13.50.05

Histogram pokazujący częstość aresztowań związanych z prostytucją pokazuje ,,wyraźny sygnał” w postaci skoku aresztowań w środy. Do takiego wykresu można oczywiście dorobić niejedną teorię tłumaczącą dlaczego tak jest. Ale teorie, bez głębszej analizy, są po prostu szkodliwe. I w bardzo barwny sposób Jake Porway opisuje to na swoim blogu.

2 thoughts on “Wizualizacja danych to nie trzaskanie wykresów”

  1. Muszę stanąć w obronie retoryki, która w tym cytacie według autora jest mniejszym złem. Kwintylian się w grobie przewraca (no, jego mikrocząstki). W każdym razie dzięki za ten cytat – może być niezłym punktem wyjścia do rozważań na temat związków retoryki z wizualizacją danych/ infografikami.

    1. Leo Breiman napisał kiedyś artykuł ,,Statistical Modeling: The Two Cultures” o różnicach w podejściu do modelowania statystyków, którzy niby odpowiadają na podobne pytania i posługują się podobnymi narzędziami, ale bardzo różnią się w podejściu do modelowania.

      W obszarze wizualizacji danych takich plemion jest pewnie jeszcze więcej. Na ile perswazja jest dozwolona na wykresach a na ile nie można jej uniknąć?

      Bardzo, bardzo chętnie przeczytałbym spójny tekst opisujący retorykę języka wizualizacji danych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *