Mapy ciepła (heatmap) a Grammar of Graphics

Przygotowując drugi wydane ,,Esejów…”, ponownie czytam sobie do poduszki ,,The Grammar of Graphics” Wilkinsona. To jedna z nielicznych książek technicznych, którą myślę, że warto przeczytać więcej niż raz.

Rozdział 16.5 jest poświęcony ,,Pattern Analysis” a znaczna jego część dotyczy dyskusji map ciepła.

Poniżej zamieszczam kilka wycinków z podsumowania tego rozdziału.

1) Unordered heatmaps of raw data or covariance/correlation matrices are
a fairly useless form of graphic display …
2) Ordered heatmaps of data matrices are most effective when a unique
ordering (based on time, space, or another variable) is known a priori.
3) … We see no advantage to using cluster analysis for
seriation or matrix permutation unless the point of the display is to
document a cluster analysis already used for other reasons.

6) Pictures are not always worth 1,000 words.

Podobnie jak Wilkinson jestem sceptyczny jeżeli chodzi o ten sposób prezentacji danych. Myślę, że jego popularność w dużej części bierze się z estetyki, popularności (popularne wykresy są coraz popularniejsze, bo dużo osób uważa, że są popularne i warto ich używać), indukowanego wrażenia, że odkrywamy jakiś prawdziwy wzorzec oraz indukowanego wrażenia, że dużo informacji jest przedstawianych.
Nie zrozumcie mnie źle, są przykłady w których ten sposób prezentacji świetnie się sprawdza (np. prezentacja wyników z dendrogramów), ale nie wszystko warto pokazywać na takich mapach.

A skoro jesteśmy już przy cytatach dotyczących grafiki. Ostatnio czytałem ciekawy wywiad z E. Tufte. Ciekawy z uwagi na wprowadzenie (podczas prezentacji ET dał uczestnikom materiały do czytania, zazwyczaj szybciej się czyta niż prelegent mówi) i poniższy cytat:

Mr. Tufte: Graphics are at their best for really large data sets, as in sparklines for time series and NASA’s photographs of the Earth. Sensibly-designed tables usually outperform graphics for data sets under 100 numbers. The average numbers of numbers in a sports or weather or financial table is 120 numbers (which hundreds of million people read daily);

Jedna myśl na temat “Mapy ciepła (heatmap) a Grammar of Graphics”

  1. Też nie lubię map ciepła. Nie widzę ich wartości dodanej, gubię się w nich. Ale myślałem, że to kwestia indywidualnych zdolności percepcyjnych ;)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">