Lista zbiorów danych:
A
- autaX2011 – ceny ofertowe aut z dnia 1 października 2011 roku z serwisu otomoto.pl, ponad 195 tys ofert, dla każdej oferty 28 zmiennych. [katalog z danymi], [skrypt R wczytujący dane], [plik csv], [plik Rdata].
- autaI2012 – ceny ofertowe aut z dnia 1 stycznia 2012 roku z serwisu otomoto.pl, ponad 210 tys ofert, dla każdej oferty 25 zmiennych. [katalog z danymi], [skrypt R wczytujący dane], [plik csv], [plik Rdata].
- autaIII2012 – ceny ofertowe aut z połowy marca 2012 roku z serwisu otomoto.pl, ponad 220 tys ofert, dla każdej oferty 27 zmiennych. [katalog z danymi], [skrypt R wczytujący dane], [plik csv], [plik Rdata].
B
- bialowieza – liczba chrztów, ślubów i zgonów w parafii prawosławnej św. Mikołaja Cudotwórcy w Białowieży od roku 1878. Na podstawie tabeli opracowanej przez ks. Sergiusza Korcha. [katalog z danymi], [skrypt R], [plik csv].
D
- Diagnoza2011 – badanie panelowe na szeroką skalę dotyczące mieszkańców Polski. Dane zbierane w latach 2000-2011. [katalog z danymi], [skrypt R wczytujące dane], [plik Rdata dla osob], [plik Rdata dla gospodarstw].
E
- Eurostat – API pozwalające na łatwe pobieranie danych z serwisu Eurostat znajduje się w pakiecie SmarterPoland dla R [tu znajdziesz pakiet i przykłady użycia].
G
- glosowaniaPoslow – dane o głosowaniach posłów VI kadencji Sejmu RP. 520 posłów, ponad 6500 głosowań, [katalog z danymi], [skrypt R wczytujący dane], [plik z opisem danych].
M
- mieszkaniaKWW2011 – dane o ofertach sprzedazy mieszkan z Warszawy, Wroclawia i Krakowa z lat 2006-2011, 9 cech, 188 884 obserwacji, [plik csv], [plik Rdata], [skrypt R wczytujacy dane].
P
- PISA2009 – dane z międzynarodowego badania PISA z roku 2009. W sumie wyniki dla przeszło 500 000 studentów. [plik Rdata], [skrypt R wczytujacy dane].
R
- rankingUczelni2011 – dane dotyczące jakości kształcenia w szkołach wyższych w Polsce opracowane przez Rzeczpospolitą. W sumie 90 uczelni 37 cech. [plik csv], [plik Rdata], [skrypt R wczytujacy dane], [dane oryginalne].
- RSS – nagłówki artykułów z polskiej pracy z miesięcy X-XI 2012. W sumie ponad 36500 nagłówków. [plik csv], [skrypt R wczytujacy dane].
T
- Twitter – wpisy z okresu od 4 do 12 lutego 2012 zawierające etykietę #debataACTA [plik csv z wpisami].
O
- Olimpiada Matematyczna – dane o finalistach z olimpiady matematycznej, wraz z informacją z jakich szkół i jakich województw pochodzą [plik csv z danymi], [skrypt R wczytujący dane].
Z
2 thoughts on “Zbiory danych”