Programy informacyjne są czasami zakłócane komentarzami sondaży poparcia partii politycznych. Zdarza się, że panel osób próbuje wytłumaczyć nowe wyniki sondaży pokazujące zmianę o 2% poparcia dla jakiejś partii. Co więcej, w tłumaczeniach osoby komentujące wydają się wierzyć, że to możliwe by w ciągu tygodnia 400 000 osób zaczęło/przestało popierać partię X.
Zastanówmy się jaki jest błąd pomiaru poparcia w przeciętnym sondażu. Wiele sondaży przeprowadzanych jest na próbach około 1000 osobowych, z tej próby zazwyczaj mniej niż połowa deklaruje chęć głosowania w wyborach. Upraszczając sytuację, zakładając, że poparcie dla partii X można modelować próbą losową z rozkładu dwumianowego o nieznanym parametrze p, dokładność pomiaru poparcia jest czasem rzędu +-5%. Jak szeroki jest dokładnie przedział ufności dla oceny poparcia partii X zależy od wielu czynników, zazwyczaj jednak jest znacznie szerszy niż te 2%, które budzą dyskusje w mediach.
Nate Silver pokazał, że odpowiednio agregując wyniki rożnych sondaży można wyznaczyć znacznie dokładniejsze szacunki niż każdy z sondaży pokazuje osobno.
A ja dzisiaj chciałbym pokazać, że odpowiednio uśredniając wyniki poparcia w czasie można lepiej zobaczyć i globalny trend i lokalną zmienność wyników sondaży.
Do dalszych wizualizacji wykorzystam wyniki sondaży zebrane przez Instytut Badania Rynku i Opinii Publicznej SMG/KRC dostępne na tej stronie http://wybory.smgkrc.pl.
Poniżej dostępna jest interaktywna grafika przedstawia jak wyglądały w ostatnich dwóch latach wyniki sondaży organizowanych przez SMG/KRC (sondaże z takiego okresu czasu SMG/KRC przedstawia na swojej stronie). Grafika pozwala zaznaczyć/odznaczyć jak szerokie są przedziały ufności pomiarów w poszczególnym sondażu oraz pozwala zobaczyć jak wygląda trend wyznaczony z wygładzenia wyników sąsiednich sondaży (wynik funkcji lowess). Można wybrać siłę wygładzenia trendu. Dla każdej z partii można znaleźć przykłady sondaży w których jednorazowo poparcie podskoczyło/opadło o kilka procent, co raczej należy tłumaczyć błędem pomiaru.
BTW: Jestem w trakcie realizacji kursu ,,Interakcja człowiek-komputer” i chętnie zderzę Wasze wrażenia n.t. intuicyjności i użyteczności poniższego interface’u z zaleceniami z kursu. Chętnie też usłyszę jakie inne informacje/elementy warto na takim wykresie umieścić.
[jeżeli poniżej nic się nie wyświetla, to należy otworzyć tę stronę]
Mnie na tym wykresie brakuje opisu osi „Y”. Z kontekstu można się domyślić, co ona symbolizuje i w jakich jednostkach jest dane są wyrażone, niemniej uważam, że powinna zostać opisana. Fajną opcja byłaby możliwość spojrzenia na wyniki każdej z partii z osobna – na podobnej zasadzie na jakiej można dodawać/usuwać trend/przedziały ufności itd.
Bardzo fajna wizualizacja!
Dzięki, dodałem opis osi OY, nad ukrywanie/odkrywaniem kolejnych partii jeszcze pomyślę.
Chciałbym zebrać dane z różnych instytucji badania opinii i wtedy można by też odkrywać/zakrywać źródła danych.
W tej chwili nie widzę jak można to umieścić bezpośrednio na takim wykresie, ale bardzo interesujące byłoby dodanie informacji o prawdopodobieństwie faktów, którymi takie wyniki sondażowe są zwykle podsumowywane:
– jakie jest prawdopodobieństwo, że partia z najlepszym wynikiem jest faktycznie pierwsza
– jakie jest prawdopodobieńśtwo, że wynik danej partii jest powyżej progu 5%
Trochę widać taką informację z wstęg przedziałów ufności, ale niezbyt jasno.
Pośrednio można to odczytać z przedziałów ufności (tak jak pisałeś). Ale rzeczywiście, ciekawe czy można inaczej/czytelnie pokazać na ile trend istotnie przekracza wspomniane 5% (czyli przedziały ufności dla trendu).
Przy próbie podglądu wyniku sondażu znajdującego się po prawej stronie wykresu nie można odczytać danych: wyświetlana informacja jest ucięta i zakryta przez elementy znajdujące się po prawej stronie (kalendarz itp). Jednocześnie pojawia się możliwość przesunięcia wykresu w prawo-lewo i jeżeli uda się tego dokonać można przeczytać zawartość. W innym przypadku bardzo spada czytelność i wygoda.
W razie potrzeby służę screenem.
Dzięki, poprawiłem, teraz tooltip pojawia się zawsze bliżej środka wykresu.
Lewacki spisek! Nie ma Nowej Prawicy Janusza Korwina-Mikke!
😉
To już sprawka wybory.smgkrc.pl, nie badają poparcia dla Nowej Prawicy.