Przygotowując drugi wydane ,,Esejów…”, ponownie czytam sobie do poduszki ,,The Grammar of Graphics” Wilkinsona. To jedna z nielicznych książek technicznych, którą myślę, że warto przeczytać więcej niż raz.
Rozdział 16.5 jest poświęcony ,,Pattern Analysis” a znaczna jego część dotyczy dyskusji map ciepła.
Poniżej zamieszczam kilka wycinków z podsumowania tego rozdziału.
1) Unordered heatmaps of raw data or covariance/correlation matrices are
a fairly useless form of graphic display …
2) Ordered heatmaps of data matrices are most effective when a unique
ordering (based on time, space, or another variable) is known a priori.
3) … We see no advantage to using cluster analysis for
seriation or matrix permutation unless the point of the display is to
document a cluster analysis already used for other reasons.
…
6) Pictures are not always worth 1,000 words.
Podobnie jak Wilkinson jestem sceptyczny jeżeli chodzi o ten sposób prezentacji danych. Myślę, że jego popularność w dużej części bierze się z estetyki, popularności (popularne wykresy są coraz popularniejsze, bo dużo osób uważa, że są popularne i warto ich używać), indukowanego wrażenia, że odkrywamy jakiś prawdziwy wzorzec oraz indukowanego wrażenia, że dużo informacji jest przedstawianych.
Nie zrozumcie mnie źle, są przykłady w których ten sposób prezentacji świetnie się sprawdza (np. prezentacja wyników z dendrogramów), ale nie wszystko warto pokazywać na takich mapach.
A skoro jesteśmy już przy cytatach dotyczących grafiki. Ostatnio czytałem ciekawy wywiad z E. Tufte. Ciekawy z uwagi na wprowadzenie (podczas prezentacji ET dał uczestnikom materiały do czytania, zazwyczaj szybciej się czyta niż prelegent mówi) i poniższy cytat:
Mr. Tufte: Graphics are at their best for really large data sets, as in sparklines for time series and NASA’s photographs of the Earth. Sensibly-designed tables usually outperform graphics for data sets under 100 numbers. The average numbers of numbers in a sports or weather or financial table is 120 numbers (which hundreds of million people read daily);
Też nie lubię map ciepła. Nie widzę ich wartości dodanej, gubię się w nich. Ale myślałem, że to kwestia indywidualnych zdolności percepcyjnych 😉