Wielka Warszawa będzie miała 22 gminy!

Dzisiaj jest 1 kwietnia, więc sami rozumiecie. Pomimo to, wszystkie poniższe obliczenia są oparte o analizy rzeczywistych danych. Wyniki są w pełni repRodukowalne a skrypty R dostępne tutaj.

Wiele się w mediach pisze o projekcie ”Wielka Warszawa”, ale brakuje w tych dyskusjach konkretnych liczb. Jak wielka powinna być ta wielka Warszawa? Oczywiście największa na świecie (t.j. większa niż inne stolice), ale czy jeszcze większa? (nie większa niż Polska, ale o ile mniejsza?) Temu zagadnieniu poświęcony jest ten wpis.

Nie wiadomo po co powiększać stolicę, nie widać poparcia wśród mieszkańców, a wyniki referendum w Legionowie pokazują sprzeciw. Na potrzeby dalszego wpisu przyjmijmy, że chodzi o powiększenie Warszawy aby zoptymalizować obszar na którym poparcie w wyborach samorządowych dla partii PiS będzie największe (moglibyśmy to policzyć też dla dowolnej innej partii, ale obecnie tylko jedna partia ma zakusy by ten obszar zmieniać). Dodatkowo załóżmy, że środek obszaru jest w centrum Warszawy a sam obszar składa się gmin, których środki są w okręgu o promieniu X. Nasz problem redukuje się do zagadnienia: jak znaleźć X.

Ze tej strony pobieram wyniki wyborów samorządowych z roku 2014. Z tego pliku interesuje mnie dla każdej gminy liczba oddanych ważnych głosów oraz liczba głosów oddanych na partię PiS.
Z tej strony pobieram mapę z kształtami i współrzędnymi gmin.
Trochę R-magii i mamy taki wykres.

wtre

Na powyższym wykresie zaznaczyliśmy ile osób głosowało na PiS vs. na inny komitet w zależności od tego jak duży obszar wokół Warszawy rozważamy.

Jeszcze mało widać, unormujmy więc te dwie wartości i zobaczymy jak zmienia się procent osób głosujących na PiS w wyborach samorządowych 2014 w zależności od odległości od centrum Warszawy.

wpromien2

Ciekawe. Ta dziwaczna funkcja ma maksimum i to w całkiem niedużym promieniu. W Warszawie poparcie dla KW PiS jest mniejsze niż w okolicznych gminach. Ale gdy promień znacząco się zwiększy to okazuje się, że to poparcie znów maleje. Różnice nie są duże, rozpiętość tego wykresu to 2 punkty procentowe, ale zawsze coś. Mamy więc optymalny promień, zawierający 21 gmin wokół Warszawy.

Poniżej mapka z zaznaczonymi gminami w ,,optymalnym” okręgu. Procentem zaznaczono procent głosów na KW PiS wśród wszystkich ważnych głosów.

Czy więc tak będzie wyglądała Wielka Warszawa?

wwarszawa2

PS: Procent mandatów zdobytych przez komitety wyborcze jest dla dużych komitetów większy niż procent poparcie liczony na głosach.
PS2: Trzy najbliższe gminy, które się nie załapały to: Wiązowna, Jabłonna i Piaseczno.

78% statystyk jest zmyślonych

Czy zastanawialiście się ile ze statystyk o których się słyszy/o których się czyta, jest wyssanych z palca?

Zapytałem googla ,,how much statistics are made up”. Skrupulatnie zebrałem wyniki z pierwszych 13 stron, między innymi businessinsider, uncyclopedia czy answers.

Wyniki oczywiście wczytałem do programu statystycznego R w wersji 3.2.4 i wykonałem wykres w ggplot2, wersja 2.1.

Interesujące! Ponad połowa odwiedzonych serwisów zawiera informacje, że więcej niż 78% statystyk jest zmyślonych.

Aby upewnić się, że nie jest to przypadek zrobiłem test Kołomogorowa Smirnowa badający zgodność z rozkładem jednostajnym i wyszło…..

p-wartość 0.012!!!

Czyli istotnie statystycznie!
(i nie pytajcie co, przecież jest istotne statystycznie!)

Gdyby ktoś chciał odtworzyć te wyniki, to zebrane dane: c(0.74, 0.85, 0.24, 0.43, 0.98, 1, 0.4, 0.8, 0.97, 0.73, 0.95, 0.79, 0.43, 0.64, 0.83).

Jak zaplanować płeć dziecka? część 2

W poprzednim wpisie pisaliśmy o tym jak zaplanować płeć dziecka. To był oczywiście prima-aprilisowy żart z wiary, że p-wartości przekładają się na przyczynowo-skutkowe zależności.

Dziś postaram się ten żart wyjaśnić. Oczywiście, jeżeli żart wymaga wyjaśnienia to pewnie nie był śmieszny. Ale osoby mające „niestandardowe poczucie humoru”  są przyzwyczajone do wyjaśniania swoich żartów.

Pisaliśmy o związku pomiędzy liczbą książek w domu a płcią dziecka. Zależność jest istotna statystycznie, a na potrzeby reszty tego wywodu załóżmy, że nieprzypadkowa. Pozostaje więc pytanie – jak ją wyjaśnić?

Czytaj dalej Jak zaplanować płeć dziecka? część 2

Jak zaplanować płeć dziecka? Co wyjdzie z fuzji Big Data, advanced analytics i PISA 2012?

Istnieje wiele naturalnych metod planowania płci dziecka (oparta o kalendarz, pole magnetyczne, dietę itp), jednak większość z nich ma zerową (a w najlepszym przypadku kilkuprocentową) skuteczność.

Okazuje się jednak, że istnieją metody znacznie skuteczniejsze, choć niespodziewane. Udało się je odkryć dzięki analizom Big Data danych z międzynarodowego badania PISA 2012. Poniżej przedstawiamy wyniki dla Polski, ale podobne otrzymuje się dla praktycznie każdego kraju. To nie może być przypadek!

Czytaj dalej Jak zaplanować płeć dziecka? Co wyjdzie z fuzji Big Data, advanced analytics i PISA 2012?

Szok!!! szokujące dane o szoku!!! 6 promili szoku w newsach!!!

W ramach wolontariatu Mateusz Kula wykonał dla nas system automatycznie agregujący RSSy z różnych źródeł.
Zbierane są dane z wielu portali, ale na potrzeby dzisiejszego wpisu przeanalizujemy tytuły artykułów publikowanych na serwisach internetowych ‘gazeta.pl’, ‘interia.pl’, ‘money.pl’, ‘rp.pl’, ‘tvn24.pl’, ‘wp.pl’ i ‘wyborcza.pl’. Z każdego z tych serwisów pobieramy kanały ‘z kraju’ i ‘ze świata’. Łącznie przyjrzymy się 14 kanałom RSS.

Zobaczmy jak często w nagłówkach RSSów pojawia się słowo ‘szok’!

6 promili szoku w wiadomościach ze świata!!!

Okazuje się, że najczęściej słowo szok pojawia się w tytułach artykułów w sekcji ‘Ze świata’. W przypadku portalu wyborcza.pl stężenie szokujących artykułów sięga 6 promili! Czy to legalne?

Poniedziałek to najbardziej szokujący dzień tygodnia!!!

Zobaczmy teraz w którym dniu tygodnia najczęściej publikowane są artykuły ze słowem szok!
Szok! To poniedziałek!

Te informacje zaszokowały świat!!!

A poniżej kilka przykładowych fragmentów tytułów z wybranych portali [to rozdzielane przecinkami fragmenty tytułów].

Interia.pl
Rodman po raz kolejny szokuje swiat, Rzecznik Watykanu: Jestem w szoku

Money.pl
Benetton znowu szokuje, Gruzja w szoku, Kenia w szoku, Beyonce szokuje ekstrawaganckimi butami

Rzeczpospolita.pl
Jestem zszokowany decyzja papieza, Rzecznik Watykanu: jestem w szoku

Tvn24.pl
Afganka szokuje na scenie. Swiatowe media zszokowane, Polak na ciezarówce przewozil trzy auta jedno na drugim. Niemcy w szoku,
Nowe szokujace dane o miejscach niemieckich zbrodni, Wypowiedzi szokujace: Sikorski broni biskupa nieszczerze,
Przecieki z konklawe: Scola “w szoku”

Wyborcza.pl
Korupcyjny szok w Hiszpanii, Zszokowany kardynal Sodano porzucil lacine i po wlosku zaczal dziekowac papiezowi za pontyfikat,
Niemcy w szoku po rezygnacji Benedykta XVI

gazeta.pl
USA: 18-letni zabójca trzech osób szokuje koszulka i zachowaniem na sali sadowej, Najsłynniejszy snajper Navy SEALS zastrzelony w Teksasie “To szok”, Wyliczyli, ile było hitlerowskich obozów i gett: To szokujace dane

wp.pl
Tymi słowami papiez zszokował swiat, Czelabińsk liczy straty: Mieszkańcy sa nadal w szoku,
Rodzice zrobili to swojemu dziecku – szokujacy film, Zaręczyny na wizji – prezenterka była w szoku,
Mężczyzna przez przypadek przybił się do dachu, ratownicy byli w szoku

Sporo tego szoku, a co na to SJP PWN?

szok
1. «silna reakcja psychiczna wywołana gwałtownym, zwykle negatywnym zdarzeniem lub przeżyciem»
2. «groźne dla życia zaburzenia czynności organizmu»
3. ekon. «silna, zwykle negatywna reakcja rynku na jakieś zjawisko lub wydarzenie»

Szok!!!

[Gdybyście chcieli zobaczyć o jakim szokującym temacie pisaliśmy 1 kwietnia rok temu, zapraszam tutaj: Najnowsze wyniki badań preferencji dzieci]