Andrzej P. podesłał mi artykuł zatytułowany ,,Kobieta menedżer ma mniejsze szanse na awans” (artykuł tutaj). Artykuł ten jest wyjątkowo ciekawym przykładem jak nie pokazywać danych. W artykule autorka stara się nas przekonać, że kobiety menedżerki (to słowo jest już nawet w SJP) mają mniejsze szanse na awans. Przekonać ma nas o tym niezbicie pierwszy wykres.
Już nawet nie czepiam się wykresu kołowego, ani tego że jest on 3D, ani że odpowiedź która ma się najbardziej rzucać w oczy jest na czerwono. Najbardziej zdziwiony jestem, że pytanie które zostało zadane to ,,czy szanse na awans są TAKIE SAME?”. To już autorka zadecydowała że nierówność musi oznaczać faworyzowanie mężczyzn.
Ciekawy jest też drugi wykres prezentowany w tym artykule.
Teoretycznie z takich danych można by się dowiedzieć, które elementy są częściej wskazywane przez mężczyzn a które przez kobiety. Teoretycznie, ponieważ sposób prezentacji to uniemożliwia, trudno porównywać iloczyny długości słupków pomiędzy sobą.
Również teoretycznie można by odczytać z takich danych które elementy są uznawane za najważniejsze w sumie. Ale ponownie tylko teoretycznie, ponieważ pochyłość słupków utrudnia określenie który słupek jest dłuższy. A liczby odpowiedzi nie są podane w sumie, więc by dowiedzieć się ile osób wybrało daną odpowiedź trzeba szybko dodawać trzycyfrowe liczby.
Postarajmy się jednak być konstruktywni w tej krytyce. Czy można inaczej przedstawić te dane? Kod w programie R użyty do wygenerowania poniższego wykresu znajduje się tutaj.
I ten sam obrazek obrócony o 45 stopni.
Używając wykresu punktowego/rozrzutu przedstawiliśmy te same liczby, ale tym razem odczytując położenie punktów możemy porównać elementy decydujące o awansie pomiędzy sobą. Im wyżej jest kropka (dotyczy drugiego wykresu) tym częściej ten element jest wskazywany przez mężczyzn, im niżej tym częściej przez kobiety. Im bardziej na prawo jest kropka tym więcej osób w sumie uznało dany element za istotny.
Sugerując się komentarzami dodałem kolory. Wrzosowy i piaskowy kolor oznaczają obszary na którym jedna płeć wybiera określone elementy o ponad 20% częściej niż druga płeć. Mam nadzieję, że dzięki temu widać że niektóre elementy są preferowane przez jedną z płci.
No nie… Jeśli wykresy mają przemawiać do przeciętnego czytelnika (a nawet tylko do menedżera/menedżerki), to nie mogą być przedstawione w tak „nieatrakcyjny”, „formalistyczny” sposób jak wykres 3 i 4. Muszą mieć w sobie trochę „seksu”. Inaczej pies z kulawą nogą na nie nie spojrzy, bo są po prostu odstręczające dla każdego, kto nie jest zawodowo zainteresowany statystyką i „oblatany” w interpretacji takich wykresów.
Wracając do wykresu 1 i 2. Pomijając manipulację (albo zwykłą niekompetencję intelektualną, czyli brak umiejętności myślenia logicznego autorów badania/wykresu/artykułu), w wykresie nr 1 (odpowiedzi ankietowanych były na inne pytanie niż sugerowane przez wykres), to jest on wyraźny i łatwo przyswajalny. W wykresie 1. widać wyraźnie to, co najważniejsze: nierówność szans w ocenie ankietowanych (przedstawioną w niewynikający z zadanego pytania sposób, jako nierówność jednokierunkową, choć oczywiście każdy wie, że taka właśnie jest ta nierówność…)
W wykresie nr 2. również widać dobrze to, co najważniejsze: menedżerowie i menedżerki zapewne NIE widzą istotnych różnic w znaczeniu poszczególnych elementów decydujących o stanowisku. Różnice w próbie są tak małe, a próba tak niewielka, że, podejrzewam, nie uprawnia do wniosku, że w całej populacji menedżerowie uznają za decydujące dla awansu inne elementy niż to robią menedżerki (chyba że ankietowano wszystkich/wszystkie z całej, małej populacji CEO z samego szczytu: pewnie jest ich w Polsce tylko 520). Być może (???) jest tylko różnica między dwoma GRUPAMI elementów: być może (?) w całej populacji menedżerów/menedżerek mężczyźni przywiązują większą wagę do grupy elementów czysto zawodowych (elementy 1, 2 i 4), a kobiety do tzw. interpersonalnych (grupa elementów 6-9). Ale to widać na wykresie kolorowym wyraźnie i wyraźniej niż na przedstawionych przez @smarterpoland.
Ilość osób, uznających element za istotny, jest widoczna na kolorowym wykresie całkiem dobrze. Nowe wykresy nie poprawiły tego w żaden istotny sposób.
Nie jestem przekonany czy pokolorowanie wykresu i pokazanie go w perspektywnie dodaje ,,seksu”, a jestem przekonany, że utrudnia poprawne odczytywanie informacji. Ale percepcja jest względna.
Co do istotności różnic, jeżeli użyć testu proporcji w porównywaniu odpowiedzi zgłoszonych na Dyspozycyjnosc, K 228/M 370 a Umiejętność współżycia z innymi K 380/M 290 otrzymuje się p-wartość 5 * 10^-11, czyli trudno nazwać te różnice nieistotnymi.
Ale całkowicie się zgadzam z tym że nie widać tych różnic (odpowiednio to 38% i 57%) na wykresie 2, nie sposób na nim porównywać ilorazów długości słupków. Ale różnica jest i z wykresu 4 można ją odczytać.
Jak dodać więcej ,,seksu” do wykresów 3 i 4? To jest pytanie i chętnie usłyszę jakieś propozycje.
A możeby rozpiąć owe dane na wykresie radarowym?
Jak dodać „seksu”?
Oczywiście tylko wtedy, gdy chcemy przedstawić dane „szerszej” publiczności. Dla statystyka to może być niepotrzebne (???)
A więc wykres nr 4. KOLOR. Najważniejsze, to wizualnie zachęcić odbiorcę do zatrzymania się choć na chwilę. Ludzie, którzy od 20 lat nie zdawali matematyki na maturze, jak diabeł święconej wody unikają „matematycznych” wykresów, szczególnie, jeśli kojarzą im się z czymś, co mgliście pamiętają jako „statystykę” (wiadomo, statystyka kłamie).
Po drugie: pokazywać TYLKO rzeczy istotne. Owszem, w ankiecie zadano pytania o 9 elementów, ale aby jasno pokazać problem (a więc: różnicę w percepcji tych elementów między mężczyznami a kobietami), należy je przedstawić (jak pisałem) w dwóch wyraźnych, wyraźnie się różniących (opisanych innymi symbolami i/lub kolorem) grupach (elementy 1,2 i 4 oraz elementy 6-9)
Różnice należy PODKREŚLIĆ, bo to właśnie różnice są interesujące dla przeciętnego człowieka. Właśnie różnice powinien zauważyć, bo TYLKO to zainteresuje go problemem. Dopiera, gdy zwróci uwagę na wykres, zauważy także podobieństwa czy brak różnic, być może ważniejsze dla prawidłowego zrozumienia problemu. Ale najpierw – zachęcić!
Zachęcić przez klarowne przedstawienie wykresu. A więc na wykresie tylko nazwy grup elementów, aby nie zaciemnieć obrazu przeładowaniem. Wyszczególnienie elementów – w legendzie; kto będzie zainteresowany, rzuci tam okiem.
I wreszcie: dobrze byłoby przedstawić te różnice w przekonywujący sposób, nie fałszując oczywiście rzeczywistości. A więc, po co lewa strona wykresu nr 4? Tam jest tylko zupełnie nieistotny element „inne”. Jeśli pokażemy tylko prawą stronę wykresu, różnice między elementami/grupami elementów będą relatywnie większe, bardziej przekonujące. Tym bardziej, jeśli zamienimy osie wykresu z diagonalnych na pionową i poziomą, o wiele łatwiej „zrozumiałych” dla przeciętnego odbiorcy (skoro jest to popularyzatorskie, a nie naukowo-badawcze zastosowanie).
Tak mi to przyszło do głowy: jeśli chcemy upowszechniać myślenie logiczne, racjonalne, to musimy mówić o tym językiem tych, do których mówimy…
@Analfabeta, postaram się odpowiednie wykresy radarowe pokazać w poniedziałek, mam pomysł jak taki wykres może wyglądać a nie znalazłem gotowca w R, wiec przy okazji wrzucę trochę kodu w R
@mw, szczerze mówiąc wole podejście Tuftego, czyli unikaj używania kolorów do pokazania zależności jeżeli możesz. Pomijam daltonistów albo inne osoby które widzą kolory inaczej niż przeciętny człowiek, czy też różny sposób postrzegania kolorów przy różnym świetle. Wybór kolorów może utrudnić odczytanie wykresu, np. gdybym miał intuicyjnie przypisać kolory do płci to niebieski przypisałbym do mężczyzn a czerwony do kobiet, nie wiem czy większość osób tak zrobi, ale dla mnie kolorystyka wykresu 2 jest myląca.
Myślę, że ważne w tych danych są zarówno różnice pomiędzy płciami jak i różnica w ,,ogólnej” ważności różnych elementów. Osie które ludzkie oko najlepiej rozróżnia to oś pionowa i oś pozioma. W przypadku wykresu 4 tak się składa że oś pozioma odpowiada za różnice w ogólnej ważności a oś pionowa za różnice pomiędzy płciami. Więc rozmieszczenie informacji powoduje że oko jest w stanie najlepiej odczytać zarówno różnice pomiędzy płciami jak i ważnością elementów.
Jestem też przeciwnikiem fajerwerków jeżeli zmniejszą one czytelność wykresu. Mając do wyboru wykres który zatrzyma czytelnika ale wprowadzi go w błąd albo taki który zatrzyma mniej czytelników ale będzie przedstawiał to co ważne wole drugi.
To oczywiście zależy od tego do kogo kieruje się wykresy. Ale jeżeli ktoś woli taniec z gwiazdami niż oglądanie wykresów to i najbardziej kolorowe wykresy go nie zatrzymają. A obawa przed tym że straci się czytelników ponieważ wykresy są niestandardowe i wymagają koncentracji i poświęcenia trochę uwagi by wykres zrozumieć powoduje że ciężko gdzieś spotkać dobrze wykonaną grafikę.
Wszędzie tylko papka z wykresami kołowymi 3D.
To trzeba zmienić 😉
Nie twierdzę też że obrócona oś kartezjańska to najlepszy pomysł, ale może w drodze dyskusji da się znaleźć kilka dobrych alternatyw.
A ja uważam, że kolory mogą być bardzo pomocne. Gdybyś na 4. wykresie górną połówkę pokolorował np. na jasny zielony i na tej połówce podpisał częściej wskazywane przez menedżerów, a dolną na jasny żółty i na tej połówce podpisał częściej wskazywane przez menedżerki to dla zwykłego czytelnika byłoby dużo prostsze do połapania się.
@Adam, ok, dodam kolory i zobaczymy jak to będzie wyglądało
Myślę, że te kolory pomogły.