Reforma edukacji a problemy demograficzne

Dziś będzie o problemach z reformą edukacji. Mówiłem o nich podczas TEDxKraków w poprzednim roku, ale z jakiegoś powodu nie pisałem jeszcze tutaj. Czas to zmienić.

Przypomnijmy. Zgodnie z planami ministerstwa edukacji od 2014 roku do podstawówki obowiązkowo pójdą sześciolatki. Do tego roku rodzice sześciolatków mogą wybierać, czy chcą by ich dziecko poszło do szkoły wcześniej w wieku 6 lat czy w wieku 7 lat. Praktyka pokazuje, że niewielu rodziców korzysta z tej możliwości, na tej stronie jest informacja, że w ubiegłym roku zdecydowało się na to niecałe 17% rodziców sześciolatków.

Samo obniżenie wieku szkolnego wydaje się być dosyć dobrym pomysłem na łagodzenie konsekwencji sytuacji demograficznej przez obniżenie wieku wejścia na rynek pracy. To co jest bardzo dyskusyjne, to sposób przeprowadzenia tej reformy. O tym będzie dzisiaj.

Czytaj dalej Reforma edukacji a problemy demograficzne

Kto w Sejmie mówi w sposób prosty, a kto w złożony

Jakiś czas temu natrafiłem na opis indeksu czytelności Flescha. To współczynnik przyjmujący wartości od 0 do 100 opisujący stopień złożoności angielskiego tekstu. Im czytelniejszy tekst tym wyższa wartość tego indeksu. Współczynnik użyteczny, jeżeli chce się pisać prostym, czytelnym językiem. Pozwala na proste mierzenie czytelności własnych tekstów.
Indeks Flescha wyznacza się w dosyć prosty sposób, na podstawie liczby sylab, słów i zdań. Ponieważ temat badania złożoności (wszystkiego) języka mnie interesuje, poszperałem dalej. Okazuje się, że indeksów badających czytelność jest znacznie więcej, choć większość z tych na które trafiłem jest skalibrowana dla języka angielskiego.
Dla języka polskiego znalazłem indeks czytelności fog, który jest adaptacją indeksu fog zaproponowanego przez Roberta Gunninga dla języka angielskiego.

FOG = 0.4*[liczba.słów / liczba.zdań + 100*(liczba.trudnych.słów / liczba.słów)]

Za trudne słowo w języku polskim uznawane są słowa czterosylabowe i dłuższe, tak przynajmniej twierdzi Wikipedia.
Indeks FOG przyjmuje wartości powyżej 0, nie ma górnej granicy.
Dla większość tekstów ten indeks przyjmuje wartości od 6 do 18 i czasem przypisuje mu się następującą interpretację.
Tekst o indeksie FOG równym X jest zrozumiały dla osoby o przynajmniej X latach edukacji.
[Złośliwi w tym miejscu pytają, czy jeżeli ktoś przez 3 lata robił szóstą klasę to czy liczyć to jako trzy lata edukacji czy jeden rok]
Jest to oczywiście bardzo zgrubne przybliżenie, ale niewątpliwie długie zdania najeżone trudnymi słowami są trudniejsze do zrozumienia i ten indeks taką złożoność wyłapuje.

Zgodnie z Wikipedią, gazeta Fakt ma indeks czytelności FOG na poziomie 7, tygodnik Newsweek około 12, zaś teksty prawne mają FOG na poziomie 20.
Sprawdziłem moje książki (obie mają FOG w okolicach 15.5, czyli więcej niżbym chciał) i blogi (różnie, ale w okolicach 12).
Ten wpis ma indeks FOG 9.5.

Co by tu jeszcze sprawdzić? (tak, tak, masz młotek i wszystko wygląda jak gwóźdź).
Akurat, jakiś czas temu interesowały mnie stenogramy z posiedzeń sejmowych…

Na tej stronie dostępne są stenogramy z posiedzeń Sejmu, można z nich wyciągnąć wypowiedzi posłów na posiedzeniach Sejmu tej kadencji [Technicznie są to przetranskrybowane stenogramy czyli po prostu wypowiedzi posłów]. Ściągnąłem je, posklejałem, wyczyściłem i dla każdego posła, który miał przynajmniej jedno długie wystąpienie, wyznaczyłem liczbę wypowiedzianych słów i indeks FOG złożoności wypowiedzi danego posła.

Zobaczmy na wykresie jak wyglądają te dwie cechy. Na wykres naniesiono również nazwiska posłów, którzy załapali się do grupy: 15 osób najmniej mówiących, 15 osób najwięcej mówiących, 15 osób mówiących najprostszym językiem (tzn. o najniższym FOG) i 15 osób mówiących najbardziej złożonym językiem (o najwyższym FOG). Jeżeli jakiś poseł nic nie powiedział w Sejmie to nie będzie go w tym zestawieniu.

Wersja wektorowa tej grafiki dostępna jest tutaj.

A poniżej tabela z liczbami dla każdego z posłów, posortowana po indeksie FOG.

 

Poseł Indeks FOG Liczba słów
Jan Tomaszewski 7,2 199
Grzegorz Matusiak 7,6 210
Cezary Grabarczyk 8,0 100
Jerzy Borowczak 8,0 461
Agnieszka Kozlowska-rajewicz 8,2 231
Malgorzata Marcinkiewicz 8,3 524
Michal Wojtkiewicz 8,3 4701
Arkady Fiedler 8,4 118
Kosma Zlotowski 8,4 3716
Marek Matuszewski 8,7 12467
Bozena Slawiak 8,8 951
Robert Telus 8,8 9665
Elzbieta Radziszewska 8,9 1824
Marek Kuchcinski 9,1 106
Mieczyslaw Golba 9,1 2968
Wojciech Jasinski 9,1 3106
Roman Jacek Kosecki 9,3 1457
Artur Dunin 9,4 6922
Cezary Tomczyk 9,4 3814
Marek Latas 9,4 1538
John Abraham Godson 9,5 1742
Marcin Mastalerek 9,5 674
Kazimierz Moskal 9,6 13310
Joanna Kluzik-Rostkowska 9,7 3440
Lech Kolakowski 9,7 573
Marek Poznanski 9,7 5125
Mariusz Orion Jedrysek 9,7 21289
Romuald Ajchler 9,7 57093
Armand Kamil Ryfinski 10,0 20102
Cezary Olejniczak 10,0 28186
Zbigniew Dolata 10,0 7289
Andrzej Rozenek 10,1 10148
Grzegorz Napieralski 10,1 3449
Konstanty Oswiecimski 10,1 3509
Leszek Jastrzebski 10,1 289
Malgorzata Adamczak 10,1 141
Boleslaw Grzegorz Piecha 10,2 13696
Czeslaw Czechyra 10,2 474
Jakub Rutnicki 10,2 2772
Joanna Fabisiak 10,2 5877
Zbigniew Babalski 10,2 9154
Grzegorz Raniewicz 10,3 1416
Roman Kotlinski 10,3 6204
Damian Raczkowski 10,4 259
Pawel Papke 10,4 458
Zbigniew Girzynski 10,4 3192
Jerzy Fedorowicz 10,5 1209
Stefan Niesiolowski 10,5 3356
Tomasz Tomczykiewicz 10,5 46
Andrzej Adamczyk 10,6 12530
Jacek Bogucki 10,6 30686
Jaroslaw Kaczynski 10,6 7523
Adam Kepinski 10,7 4188
Andrzej Piatak 10,7 74
Boguslaw Wontor 10,7 3240
Iwona Guzowska 10,7 976
Jozef Rojek 10,7 48500
Patryk Jaki 10,7 12754
Wojciech Saluga 10,7 1099
Adam Abramowicz 10,8 6429
Jan Bury 10,8 11924
Jerzy Materna 10,8 7007
Katarzyna Matusik-lipiec 10,8 641
Maciej Malecki 10,8 6578
Marzena Machalek 10,8 8108
Marzena Okla-drewnowicz 10,8 2783
Zbigniew Kuzmiuk 10,8 48871
Andrzej Duda 10,9 17901
Dorota Arciszewska-mielewczyk 10,9 3977
Franciszek Jerzy Stefaniuk 10,9 18173
Jadwiga Wisniewska 10,9 12279
Jan Dziedziczak 10,9 5802
Leszek Dobrzynski 10,9 4987
Ligia Krajewska 10,9 2584
Piotr Szeliga 10,9 52456
Slawomir Nowak 10,9 958
Adam Lipinski 11,0 704
Anna Elzbieta Sobecka 11,0 9374
Czeslaw Gluza 11,0 1145
Marek Wojtkowski 11,0 1332
Piotr Pawel Bauc 11,0 17779
Stanislaw Lamczyk 11,0 4409
Tomasz Kaminski 11,0 15017
Andrzej Dera 11,1 25570
Andrzej Halicki 11,1 6657
Dariusz Jonski 11,1 32823
Henryk Kowalczyk 11,1 18944
Jozef Lassota 11,1 16594
Kazimierz Golojuch 11,1 7163
Slawomir Klosowski 11,1 24268
Stanislaw Ozog 11,1 6628
Stanislaw Pieta 11,1 6849
Urszula Augustyn 11,1 7669
Andrzej Romanek 11,2 57645
Artur Debski 11,2 12147
Beata Mazurek 11,2 8123
Elzbieta Witek 11,2 5963
Grzegorz Schreiber 11,2 12928
Jan Ziobro 11,2 20165
Malgorzata Kidawa-blonska 11,2 1240
Mariusz Antoni Kaminski 11,2 4958
Michal Kabacinski 11,2 24670
Piotr Chmielowski 11,2 55066
Piotr Pyzik 11,2 21308
Tomasz Kaczmarek 11,2 743
Adam Kwiatkowski 11,3 3971
Antoni Macierewicz 11,3 9826
Izabela Leszczyna 11,3 12858
Jerzy Zyzynski 11,3 17751
Lech Sprawka 11,3 5588
Leszek Miller 11,3 13253
Maciej Zielinski 11,3 170
Marek Domaracki 11,3 9948
Maria Nowak 11,3 27780
Maria Zuba 11,3 18793
Piotr Polak 11,3 26062
Stanislaw Kalemba 11,3 8913
Stanislaw Zelichowski 11,3 9473
Waldemar Andzel 11,3 31833
Wlodzimierz Bernacki 11,3 3235
Adam Rogacki 11,4 5985
Anna Bankowska 11,4 25929
Bartosz Kownacki 11,4 8958
Elzbieta Rafalska 11,4 22580
Janusz Sniadek 11,4 7219
Leszek Aleksandrzak 11,4 12489
Ludwik Dorn 11,4 24653
Marek Suski 11,4 5717
Michal Jach 11,4 5847
Stanislaw Wziatek 11,4 7297
Tomasz Latos 11,4 11933
Wincenty Elsner 11,4 42647
Zbigniew Konwinski 11,4 3632
Bartlomiej Bodio 11,5 18423
Eugeniusz Klopotek 11,5 3268
Izabela Kloc 11,5 7416
Jan Cedzynski 11,5 5088
Krystyna Lybacka 11,5 19177
Mariusz Blaszczak 11,5 4313
Przemyslaw Wipler 11,5 17354
Slawomir Kopycinski 11,5 18078
Wanda Nowicka 11,5 199
Zbigniew Chmielowiec 11,5 10414
Arkadiusz Czartoryski 11,6 3737
Jan Kazmierczak 11,6 3486
Janusz Palikot 11,6 14578
Marek Balt 11,6 15228
Slawomir Neumann 11,6 6005
Andrzej Orzechowski 11,7 15488
Dariusz Bak 11,7 7645
Dariusz Piontkowski 11,7 10101
Iwona Sledzinska-katarasinska 11,7 9551
Jan Szyszko 11,7 14166
Krzysztof Szczerski 11,7 28528
Leszek Korzeniowski 11,7 3212
Pawel Arndt 11,7 7390
Piotr Walkowski 11,7 24731
Robert Biedron 11,7 24706
Robert Kropiwnicki 11,7 6085
Ryszard Kalisz 11,7 18407
Andrzej Dabrowski 11,8 14327
Beata Kempa 11,8 36761
Danuta Pietraszewska 11,8 2793
Janusz Cichon 11,8 15598
Joachim Brudzinski 11,8 3151
Jozefa Hrynkiewicz 11,8 13581
Katarzyna Hall 11,8 2846
Krzysztof Borkowski 11,8 11708
Maciej Lopinski 11,8 1825
Marek Opiola 11,8 799
Pawel Sajak 11,8 3738
Piotr Naimski 11,8 6287
Stanislaw Huskowski 11,8 3784
Tadeusz Iwinski 11,8 27360
Wieslaw Suchowiejko 11,8 8748
Zbigniew Pacelt 11,8 416
Zbyszek Zaborowski 11,8 15805
Artur Gorczynski 11,9 10983
Barbara Bartus 11,9 11660
Bogdan Rzonca 11,9 27311
Dariusz Cezar Dziadzio 11,9 20631
Henryk Kmiecik 11,9 5730
Jaroslaw Katulski 11,9 5514
Jaroslaw Rusiecki 11,9 1594
Malgorzata Sadurska 11,9 6493
Marzena Dorota Wrobel 11,9 26265
Piotr Van Der Coghen 11,9 5059
Ryszard Galla 11,9 2224
Waldy Dzikowski 11,9 3030
Andrzej Lewandowski 12,0 3968
Arkadiusz Mularczyk 12,0 18855
Czeslaw Hoc 12,0 15617
Jadwiga Zakrzewska 12,0 1464
Jaroslaw Zielinski 12,0 24783
Jerzy Borkowski 12,0 34550
Jerzy Budnik 12,0 3652
Jerzy Szmit 12,0 21781
Krzysztof Gadowski 12,0 12783
Miroslaw Kozlakiewicz 12,0 450
Szymon Gizynski 12,0 6731
Waldemar Slugocki 12,0 10422
Andrzej Jaworski 12,1 4434
Andrzej Szlachta 12,1 33733
Jacek Kwiatkowski 12,1 5138
Jacek Swiat 12,1 4059
Jolanta Szczypinska 12,1 5768
Marcin Witko 12,1 9421
Marek Rzasa 12,1 8372
Mieczyslaw Kasprzak 12,1 133
Miroslawa Nykiel 12,1 3681
Stanislaw Szwed 12,1 27608
Teresa Hoppe 12,1 7251
Bozenna Bukiewicz 12,2 2532
Domicela Kopaczewska 12,2 3996
Henryk Smolarz 12,2 11123
Jozef Zych 12,2 23709
Mieczyslaw Marcin Luczak 12,2 4894
Renata Butryn 12,2 6385
Tomasz Garbowski 12,2 4923
Tomasz Lenz 12,2 4298
Witold Czarnecki 12,2 2521
Andrzej Sztorc 12,3 4510
Anna Paluch 12,3 27306
Anna Zalewska 12,3 8292
Artur Gorski 12,3 18335
Artur Ostrowski 12,3 14155
Dariusz Seliga 12,3 1782
Elzbieta Gapinska 12,3 4535
Jan Warzecha 12,3 44940
Krystyna Pawlowicz 12,3 15132
Malgorzata Pepek 12,3 4537
Piotr Tomanski 12,3 5291
Bozena Szydlowska 12,4 4071
Cezary Kucharski 12,4 1203
Elzbieta Apolonia Pierzchala 12,4 896
Maciej Orzechowski 12,4 10174
Marek Ast 12,4 9866
Miroslaw Pawlak 12,4 5944
Stanislaw Zmijan 12,4 5655
Wojciech Ziemniak 12,4 1249
Zofia Popiolek 12,4 6311
Andrzej Bula 12,5 314
Gabriela Maslowska 12,5 17091
Jacek Najder 12,5 5740
Jerzy Wenderlich 12,5 2194
Krzysztof Popiolek 12,5 6967
Lidia Gadek 12,5 9594
Slawomir Kowalski 12,5 524
Anna Grodzka 12,6 5710
Artur Bramora 12,6 6304
Barbara Bubula 12,6 7374
Grzegorz Adam Wozniak 12,6 10981
Grzegorz Tobiszowski 12,6 4019
Krzysztof Tchorzewski 12,6 7523
Lucjan Marek Pietrzczyk 12,6 5658
Renata Zaremba 12,6 5587
Ryszard Zbrzyzny 12,6 61590
Anna Nems 12,7 22410
Henryk Siedlaczek 12,7 20995
Magdalena Kochan 12,7 14890
Marek Wojcik 12,7 4364
Mariusz Kaminski 12,7 1916
Ryszard Zawadzki 12,7 8928
Tomasz Piotr Nowak 12,7 12921
Wojciech Szarama 12,7 3196
Adam Szejnfeld 12,8 10509
Beata Szydlo 12,8 21046
Ewa Malik 12,8 7949
Ireneusz Ras 12,8 6870
Iwona Ewa Arent 12,8 3684
Jagna Marczulajtis-walczak 12,8 2193
Maciej Banaszak 12,8 8824
Maciej Mroczek 12,8 5730
Magdalena Gasior-marek 12,8 5739
Marek Krzakala 12,8 5965
Andrzej Czerwinski 12,9 11033
Halina Szymiec-raczynska 12,9 3140
Jerzy Rebek 12,9 18937
Krystyna Poslednia 12,9 3197
Miroslaw Pluta 12,9 3227
Stefan Strzalkowski 12,9 1662
Tadeusz Wozniak 12,9 22616
Zbigniew Sosnowski 12,9 7553
Ewa Kolodziej 13,0 7501
Ewa Zmuda-trzebiatowska 13,0 1520
Jaroslaw Pieta 13,0 7178
Jerzy Kozdron 13,0 17398
Jerzy Zietek 13,0 10170
Krystyna Klosin 13,0 5690
Krystyna Skowronska 13,0 33173
Krzysztof Brejza 13,0 1296
Marek Stolarski 13,0 2560
Stanislaw Piotrowicz 13,0 10770
Tomasz Makowski 13,0 19682
Zbigniew Rynasiewicz 13,0 4460
Beata Malecka-libera 13,1 5591
Edward Siarka 13,1 16621
Jacek Falfus 13,1 3283
Jan Krzysztof Ardanowski 13,1 18153
Kazimierz Ziobro 13,1 11544
Krzysztof Jurgiel 13,1 15652
Lukasz Gibala 13,1 25038
Lukasz Krupa 13,1 5677
Tomasz Kulesza 13,1 4344
Alicja Olechowska 13,2 4391
Andrzej Kania 13,2 6392
Anna Fotyga 13,2 7287
Grzegorz Schetyna 13,2 4190
Krzysztof Lipiec 13,2 8857
Lidia Staron 13,2 13866
Marek Hok 13,2 2430
Marian Cycon 13,2 14507
Tadeusz Arkit 13,2 13920
Tadeusz Tomaszewski 13,2 37752
Tomasz Gorski 13,2 5137
Andrzej Gut-mostowy 13,3 1104
Elzbieta Gelert 13,3 2147
Eugeniusz Czykwin 13,3 7716
Jacek Sasin 13,3 7127
Marcin Kierwinski 13,3 3017
Marek Polak 13,3 7209
Pawel Olszewski 13,3 158
Pawel Szalamacha 13,3 11835
Tadeusz Dziuba 13,3 4525
Wieslaw Stanislaw Janczyk 13,3 10160
Wojciech Zubowski 13,3 5424
Aleksandra Trybus 13,4 4661
Artur Gierada 13,4 6457
Dariusz Rosati 13,4 32420
Jacek Osuch 13,4 2483
Krzysztof Michalkiewicz 13,4 1394
Marcin Swiecicki 13,4 16849
Miron Sycz 13,4 3561
Pawel Suski 13,4 2544
Robert Kolakowski 13,4 396
Ryszard Terlecki 13,4 4168
Waldemar Pawlak 13,4 1884
Antoni Mezydlo 13,5 8717
Jacek Czerniak 13,5 8175
Jakub Szulc 13,5 7947
Kazimierz Michal Ujazdowski 13,5 7026
Killion Munyama 13,5 7158
Krystyna Ozga 13,5 10550
Marek Gos 13,5 27937
Mariusz Witczak 13,5 2945
Agnieszka Hanajczyk 13,6 3038
Borys Budka 13,6 4262
Dawid Jackiewicz 13,6 5175
Jan Lopata 13,6 26563
Jaroslaw Sellin 13,6 4593
Grzegorz Sztolcman 13,7 1101
Janusz Dzieciol 13,7 3812
Jaroslaw Zaczek 13,7 35643
Jerzy Polaczek 13,7 6478
Marek Biernacki 13,7 6676
Slawomir Zawislak 13,7 1178
Tadeusz Aziewicz 13,7 3633
Witold Waszczykowski 13,7 7535
Wojciech Penkalski 13,7 19009
Zenon Durka 13,7 1011
Adam Rybakowicz 13,8 8516
Alicja Dabrowska 13,8 1111
Elzbieta Kruk 13,8 1592
Halina Rozpondek 13,8 6798
Jacek Tomczak 13,8 3624
Jozef Racki 13,8 12336
Michal Jaros 13,8 3504
Rajmund Miller 13,8 2719
Teresa Piotrowska 13,8 5956
Tomasz Glogowski 13,8 2603
Bozena Kaminska 13,9 4811
Krzysztof Klosowski 13,9 10240
Lukasz Borowiak 13,9 7596
Rafal Grupinski 13,9 7518
Witold Klepacz 14,0 18201
Zofia Czernow 14,0 5259
Eugeniusz Tomasz Grzeszczak 14,1 830
Ewa Wolak 14,1 8381
Janina Okragly 14,1 5379
Slawomir Jan Piechota 14,1 12469
Agnieszka Kolacz-leszczynska 14,2 1342
Agnieszka Pomaska 14,2 11650
Andrzej Biernat 14,2 958
Beata Bublewicz 14,2 3262
Dorota Rutkowska 14,2 2845
Iwona Kozlowska 14,2 4283
Janusz Piechocinski 14,2 21384
Joanna Bobowska 14,2 5954
Mariusz Grad 14,2 156
Piotr Zgorzelski 14,2 9871
Zbigniew Wlodkowski 14,2 6279
Andrzej Betkowski 14,3 5573
Izabela Katarzyna Mrzyglocka 14,3 10842
Julia Pitera 14,3 900
Krystyna Sibinska 14,3 5593
Piotr Babinetz 14,3 9088
Malgorzata Niemczyk 14,4 576
Malgorzata Sekula-szmajdzinska 14,4 14897
Marek Sawicki 14,4 4946
Robert Wardzala 14,4 1510
Leonard Krasulski 14,5 498
Maks Kraczkowski 14,5 2017
Malgorzata Gosiewska 14,5 3487
Zofia Lawrynowicz 14,5 4075
Miroslaw Maliszewski 14,6 8169
Radoslaw Witkowski 14,6 3108
Andrzej Galazewski 14,7 7468
Barbara Czaplicka 14,7 636
Jaroslaw Gorczynski 14,8 14419
Lukasz Zbonikowski 14,8 10907
Marek Lapinski 14,8 4486
Michal Tomasz Pacholski 14,8 6956
Arkadiusz Litwinski 14,9 3986
Edward Czesak 14,9 4631
Maciej Wydrzynski 14,9 11240
Monika Wielichowska 14,9 6918
Piotr Cieslinski 14,9 1241
Zbigniew Matuszczak 15,0 12636
Michal Szczerba 15,2 11909
Stanislawa Przadka 15,3 6585
Tomasz Smolarz 15,3 2876
Tomasz Szymanski 15,4 8380
Genowefa Tokarska 15,5 16006
Robert Tyszkiewicz 15,5 3655
Dorota Niedziela 15,6 5121
Adam Zylinski 15,7 3194
Jaroslaw Tomasz Jagiello 15,7 2169
Leszek Blanik 15,7 1801
Ewa Drozd 15,9 2212
Elzbieta Achinger 16,0 1900
Jacek Brzezinka 16,1 3830
Witold Pahl 16,1 7274
Jaroslaw Charlampowicz 16,2 935
Konstanty Miodowicz 16,3 755
Marek Plura 16,5 4254
Roman Kaczor 16,6 2093
Maria Malgorzata Janyska 16,7 3831
Brygida Kolenda-labus 17,2 2349
Krzysztof Kwiatkowski 17,2 6012
Edmund Borawski 17,3 2905
Jacek Kozaczynski 18,0 1680

Open Data Day 2013

Dzisiaj (23 lutego) w trzydziestu ośmiu krajach odbywały się hakatony, których tematyka związana była z otwartymi danymi (więcej informacji tutaj) [nawet nie będę starał się szukać tłumaczenia dla słowa hakaton, purystów proszę o wybaczenie].
W Polsce zorganizowane były dwa tego typu spotkania, w Warszawie i w Katowicach. Ja trafiłem na warszawski hakaton organizowany między innymi przez Łukasza Jachowicza z Centrum Cyfrowe Projekt Polska (opis tutaj).
Z różnych powodów mogłem być tylko na połowie tego spotkania, zamiast więc włączyć się do prac innego zespołu zabrałem ze sobą własne niedokończone projekty i spokojnie sobie nad nimi pracowałem.

Atmosfera była niesamowita, około pięćdziesięciu osób intensywnie pracujących nad różnymi projektami, wokół dyskusje nad wyższością Flasku nad Railsami, lub komentarze o wadach i zaletach innych projektów związanych z otwartymi danymi.
W takiej atmosferze nawet pracując nad wariantami splicingowymi genów, czyli czymś zupełnie niezwiązanym z hakowaniem otwartych danych, efektywność pracy rośnie kilkukrotnie.
Realizowane były różne projekty, np. adaptacja na polskie warunki serwisu Poliwoops (zobacz tutaj), śledzącego jakie tweety politycy napisali a później skasowali, zbieranie danych o komunikacji miejskiej, oceny czasów przejazdu pomiędzy dwoma punktami w mieście, aplikacje wokół danych z otwartych zabytków itp. Listę pozostałych można znaleźć na stronie hakatonu.

Spotkanie przyciągnęło wielu programistów, grafików i projektantów, zabrakło jednak (mnie) osób zajmujących się analizą danych. Stąd też znaczne przesunięcie akcentu na zbieranie danych przez parsowanie stron czy budowanie interfaceów pozwalających na łatwy dostęp do danych, ale mniejszy nacisk na wyciąganie z danych przetworzonych informacji. Przykładowo najbliżej mnie siedział zespół pracujący nad API dostępu do informacji o tym, kto i kiedy był ministrem w rządzie. Interesujące dane, które mogą być źródłem ciekawych zestawień. Niestety moje dociekania, czy będzie można się do tych danych dostać na zasadzie otwartej licencji, kiedy z ty danych będzie można skorzystać, i próby opisania jakie to interesujące statystyki na takich danych można zrobić, zderzyły się z odpowiedzią, że zespół interesuje zrobienie API, to jak z tych danych będzie można korzystać to się ustali później.

Podsumowując, dla programistów, projektantów i grafików fantastyczne spotkanie. Dla statystyków może mniej. Ja jednak bardzo się cieszę, że tam byłem. W takiej atmosferze chciałbym pracować każdego dnia.

Sygnał czy szum?

Zastanawiam się czasem, jak szybko zmienia się poparcie dla rozmaitych partii politycznych.

Trudno to ocenić, ponieważ w różnych sondażach (o ile wiem, może się mylę) o poglądy pyta się różne osoby. Zmienność pomiędzy sondażami może więc brać się i z tego, że zmieniła się ,,średnie poparcie” w społeczeństwie i z losowych fluktuacji próby.

Aby rozróżnić te efekty, trzeba by zrobić badanie na np. trzech tysiącach osób i pytać je o opinie co miesiąc aby wyeliminować efekt doboru próby (swoja drogą, ciekawe czy NCN sfinansowałby takie badanie).

Skąd te rozważania? Poniżej pokazuję wykres poparcia dla jednej z dużych partii, mierzony przez jedną z dużych firm badania opinii publicznej (bez nazw, bo są one nieistotne, dociekliwi sprawdzą sobie sami, np. na tej stronie.

Na początku stycznia widzimy gwałtowny skok poparcia, ale czy to szum i wynik przypadkowo ,,niereprezentatywnej” próby, czy też w okolicy tego okresu wydarzenia spowodowały, że w całym społeczeństwie poparcie dla danej partii wzrosło (ale w ciągu trzech tygodni o 13 procent)?

Jak dla mnie jest to raczej przykład ilustrujący, jak duży jest błąd badania opinii na ,,reprezentatywnych próbach 1000 polaków”.

Poddaje to pod dyskusje sensowność większości artykułów typu ,,temu wzrosło o 3% a temu spadło”.

I powinno być argumentem dla polityków każdej z partii, by nie patrzeć na to jak się zmieniają słupki poparcia, lecz robić swoje.
Lol 😉

Wyniki w mistrzostwach Europy w siatkówce a projekt kubek

Jakiś czas temu pisałem o kubku, na którym nadrukowałem różne charakterystyki związane z Polską (więcej informacji tutaj). Dzisiaj napiszę o tym jak powstawał wykres przedstawiający wyniki w Mistrzostwach Europy w piłce siatkowej.

Będzie technicznie, będzie kod w R, będzie o szlifowaniu szczegółów, będzie ciekawie!

Czytaj dalej Wyniki w mistrzostwach Europy w siatkówce a projekt kubek

Mamy więcej, ale o ile więcej? Czyli mały konkurs

W tym tygodniu będzie kilka wykresów z prasy, nazbierało się kilka nieudanych grafik i czas je pokazać. Zaczniemy od tematu świeżego, na który uwagę zwrócił w poprzednim tygodniu Michał D. Wygląda na to, że w budżecie UE na lata 2014-2020 dla Polski znajdzie się więcej Euro niż w poprzednim budżecie. Zobaczmy o ile więcej.

Zróbmy w tym celu mały konkurs. Poniżej znajdują się wykresy z Gazety Wyborczej, które zostały przygotowane przez Kancelarię Prezesa Rady Ministrów (tak sugeruje stopka).

Widząc te trzy wykresy spróbujcie odpowiedzieć na dwa pytania (nie przeliczając nic, bazując na wykresach):
– o ile (+- w procentach) budżet wzrośnie (porównując wartości nominalne, zostawmy inflację w spokoju)?
– na którym z tych wykresów przedstawiony jest największy a na którym najmniejszy wzrost?

Czytaj dalej Mamy więcej, ale o ile więcej? Czyli mały konkurs

Miłość, zdrada, Facebook i Łańcuch Markowa

Zaczęło sie od tego, że na blogu Wojtka Walczaka przeczytałem wpis ,,Facebook love stories (unromantic version)”, w którym opisane są wstępne wyniki analiz zmian deklaracji dotyczących bycia w związku na Facebooku (na facebooku można zadeklarować, że jest się z kimś w związku ,married’, ,in relationship’ itp).

Temat bardzo mi się spodobał, napisałem do autora zapytanie o udostępnienie danych, dane dostałem (są teraz dostępne publicznie tutaj) i zabrałem się do analiz.

Jakich analiz? Na podstawie zmiany deklaracji o bycia w związku, chciałem zbudować graf, prezentujący jak wygląda graf przejścia pomiędzy różnymi stanami ,,bycia w związku”.

Dlaczego to jest bardzo ciekawe? Niby proste zadanie, jak zrobienie grafu połączeń, kryje wiele interesujących detali, pozwalających modelarzowi się ,,wyżyć”. Przykładowo, w stanie ,married’ część osób pozostaje długo, ale przecież nie wiemy jak długo bo nie zaobserwowaliśmy przejścia do innego stanu. Jak więc oszacować średni czas pozostawania w tym stanie? Tu mamy cały zestaw technik do analizy danych cenzorowanych o których możemy poopowiadać. Inny przykład. Nie obserwujemy wszystkich przejść, pomiędzy stanami, ponieważ część zmian statusu jest prywata i ich nie widzimy. Jeżeli ktoś z 'single’ przeszedł na ,in relation’ a po roku ponownie przeszedł z 'single’ na 'in relation’ to po drodze musiał jakoś z pierwszej 'in relation’ przejść do 'single’. To czyni estymacje czasów pobytu w węźle jeszcze ciekawszą. Kolejny problem to adekwatność opisu zmian stanu przez macierz zmiany stanu (co zakłada jakąś formę stacjonarności). Wiele interesujących pytań!

No dobrze, zobaczmy co wyszło.

Czytaj dalej Miłość, zdrada, Facebook i Łańcuch Markowa

Polska w rankingu FIFA a projekt kubek

W poprzednim tygodniu pisałem o kubku, na który naniosłem różne informacje związane z Polską (więcej informacji tutaj). Dzisiaj napiszę o tym jak powstawał jeden z naniesionych na kubek wykresów, a konkretniej wykres ilustrujący pozycję Polski w rankingu FIFA.
Będzie bardzo technicznie, będzie kod w R, będzie o poprawianiu wykresu, będzie zabawa!

Czytaj dalej Polska w rankingu FIFA a projekt kubek