Godziny głosowań w sejmie VII i VIII kadencji

Późno chodzę spać i często przed snem sprawdzam wiadomości (złe nawyki, może w 2016 się ich pozbędę). Pomimo tych późnych godzin, czasem rano z zaskoczeniem odkrywam, że w międzyczasie w Sejmie uchwalono nową ustawę (o wieku rozpoczęcia szkoły jeszcze napiszę w osobnym poście).

Czy zmieniły się godziny pracy Sejmu? Do której godziny w Sejmie teraz się głosuje? Przyjrzyjmy się danym. Głosowania to nie jedyne zajęcie posłów, ale w sumie dosyć ważne.

Pakiet SejmRP wkrótce będzie udostępniał dane z prac 8. kadencji, póki co można je pobrać ręcznie ze stron 7. kadencji i 8. kadencji. Pobieramy głosowania z pierwszych siedmiu posiedzeń sejmu dla obu kadencji (w obu przypadkach to 16 dni i około 325 głosowań). W poprzedniej kadencji akurat siódme posiedzenie miało ponad 200 głosowań, większość związana z ustawą budżetową, ale nie zaburza to znacząco wyników.

Poniższy interaktywny wykres porównuje godziny głosowań w obu kadencjach (godzina na osi OY). Jeżeli nic się nie wyświetla to kliknij tutaj.

Poprzednia kadencja głosowała w godzinach 9-15, a obecna 16-24. Właściwie dlaczego?

Pomysł na wykres pochodzi z tego bloga. Kody źródłowe aby go odtworzyć dostępne są tutaj.

23 myśli na temat “Godziny głosowań w sejmie VII i VIII kadencji”

  1. boxplot lub rozkład gęstości lub nawet słupki obok siebie dla tej samej godziny i różnych kadencji – wszystko byłoby lepsze/ciekawsze

      1. Skoro celem jest porównanie, to wszystkie 3 są wg mnie bardziej przekonujące.

        http://pastebin.com/3gStRcf6

        Słupki, które na Twoim wykresie rozchodzą się w 2 różne strony w ogóle nie pomagają w porównaniu – nie potrafię szybko odczytać tego wykresu w sposób, jakiego oczekiwałeś.

        1. Gdy słupki są z tej samej strony to graficznie kolidują ze sobą (co widać na Twoim przykładzie).
          Boxploty wypłaszczają informacje bo z całego rozkładu pokazują tylko 5 liczb a tutaj można pokazać wszystkie bez utraty czytelności. Boxploty gubią informacje o głosowaniach w okolicy 9, którą pokazują słupki. Poza tym boxploty nie biorą pod uwagę tego, że godzina 00 jest po 23, więc liczenie surowej średniej czy mediany nie ma sensu.
          A jeżeli chodzi o jądrowy estymator gęstości to wygładza on dane, wprowadzając niepotrzebnie zakłócenie. W zależności od stopnia wygładzania można mieć niezerową gęstość np dla godziny 3 w nocy.

          Podsumowując, imho rozchodzące się słupki są najbardziej precyzyjną prezentacją tych danych (z tych czterech).

          1. To zależy czy chcesz czytelnikowi kazać samemu interpretować wykres czy pokazać, że godziny różnią się – wtedy utrata informacji w boxplotach faktycznie jest problemem. Ja czytam, że chciałbyś porównać godziny głosowania w dwóch grupach i z 4 wykresów na Twoim zauważam różnicę najpóźniej (jest ewidentna, więc powiedzmy, że to są ułamki sekund, ale inny przykład nie musi być taki oczywisty).

            Gęstość – zgadzam się, że mogą się tam pojawić dane których nie ma w rzeczywistości, z tego powodu też bym nie preferował tego wykresu, jednak dla mnie przekaz pozostaje jednak czytelny – kolejny level względem histogramu. I wtedy tylko znowu pytanie czy przed czytelnikiem stawialiśmy jakieś dodatkowe zadanie szukania nowych informacji na wykresie, czy tylko graficznie wspieraliśmy udowodnienie tezy.

          2. Z uwagi na głosowania po północy boxplot (tak jak go teraz liczysz) pokazuje niepoprawne wartości. Gdyby połowa głosowań była o godzinie 0:01 a połowa 23:59 to mediana i średnia wypadłyby w środku dnia, a kwartyle pokryłyby całe 24h.

            Ale jeżeli pytanie dotyczy samej formy graficznej, to najłatwiej je rozstrzygnąć eksperymentem. I przy najbliższym kursie z Technik Wizualizacji Danych chętnie go przeprowadzę.

    1. Jaka propaganda? Pokazanie rozkładu godzin poprzedniej i tej kadencji jest propagandą? Przecież to zwykła analiza dostępnych danych (tego jak pracował poprzedni i pracuje obecny sejm), bez żadnego politycznego komentarza.

    2. Jeszcze dla jasności czym jest propaganda (ze słownika PWN, link: http://sjp.pwn.pl/sjp/propaganda;2508812).

      propaganda
      1. «szerzenie jakichś poglądów, haseł politycznych itp. mające na celu pozyskanie zwolenników»
      2. «technika sterowania poglądami i zachowaniami ludzi polegająca na celowym, natarczywym, połączonym z manipulacją oddziaływaniu na zbiorowość»
      3. «specjalna komórka, zespół ludzi realizujący takie cele; też: tekst, wystąpienie, film itp. realizujące takie cele»

      I dodatkowo z encyklopedii PWN (http://encyklopedia.pwn.pl/haslo/propaganda;3962718.html)

      propaganda [łac.], celowe oddziaływanie na zbiorowości i jednostki zmierzające do pozyskania zwolenników i sojuszników, wpojenia pożądanych przekonań i wywołania określonych dążeń i zachowań.

    1. Eksperymenty psychologów pokazały, że jeśli się pokaże ten sam (także neutralny) materiał zwolennikom dwóch skrajnych opcji, obie grupy (raczej) stwierdzą, że zobaczyły coś stronniczego na rzecz przeciwnika. Mamy tu chyba przykład potwierdzający tę tezę.

  2. Kierowniku, zmieńcie w url domenę na cdn.rawgit.com, boście trafili na wykop i się rawgit zbuntował, że za duży ruch.

  3. Fajny tekst i fajne podsumowanie. Teraz sejm sprawia wrażenie bardziej zapracowanego. Nie przemawia do mnie jednak opinia, że wieczorem czy nocą głosowania przechodzą bardziej bez echa.

  4. Uwaga graficzna: jeżeli radioprzyciski grouped/stacked wyglądają nie jak normalne radioprzyciski, to dobrze, żeby nie wyglądały jak legenda, ja szukałem dłuższą chwilę tych kolorów na wykresie. Chyba najlepszym kompromisem estetyczno-zwiększającym czytelność byłoby zrobienie kolorków przy legendzie kwadratami.

    Co do samych danych wydaje mi się, że w dawnych czasach gdy obrady były jeszcze transmitowane w TVP2 była jakaś zmiana godzin transmisji (ustalenie sztywnej godziny zakończenia?) która spowodowała rozpowszechnione przeświadczenie/teorię spiskową, że kontrowersyjne sprawy są przesuwane na godziny wieczorne żeby debaty nad nimi nie były powszechnie transmitowane. Ale szczegółów nie pamiętam ani nie jestem w stanie teraz znaleźć.

    1. Opcje grouped/stacked najchętniej bym usunął. Tyle, że są one generowane przez bibliotekę rCharts/NVD3 i jeszcze nie znalazłem prostego sposoby by to zrobić.

  5. Przy interpretacji tych wyników należy pamiętać, że sejm 7. kadencji był kontynuacją rządów, a 8. jest po zmianie rządu. Stąd rozsądniejsze wydaje się porównywanie 6. kadencji z 8., wtedy dopiero będzie można stwierdzić kto w pośpiechu i po nocach zmienia prawo zaraz po uzyskaniu większości parlamentarnej.

    1. Czy ustawy są konstruowane w pośpiechu czy nie, tego nie wiadomo. Może były gotowe od roku, może nie, ja nie mam żadnych danych na ten temat.
      Czy wszystkie te ustawy wymagają takiego tempa, na ten temat niech się wypowiadają politolodzy.
      Dla mnie ciekawą obserwacją jest różnica godzin w których przeprowadzono głosowania i jej wytłumaczenie (brak większości do godziny 16).
      Odsuwając na bok całą politykę, myślę że jest to bardzo ciekawa ilustracja symbiozy wykresu i wyjaśnienia pewnego zjawiska.

      Kolejną ciekawą analizą, ale jeszcze nie wiem jak można by ją wykonać, będzie sprawdzenie jak wygląda tempo prac (np. długość komentarzy) nad różnymi projektami. Tempo prac nad ustawą o sześciolatkach mnie zaskoczyło. Ogólny pomysł był znany od jakiegoś czasu, ale szczegółowe rozwiązania …

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">