Szablon Cytuj książkę w polskiej Wikipedii
Po przekopaniu się przez 1.300.000+ haseł polskiej Wikipedii, przyszedł czas na analizę danych i wyciągnięcie pierwszych wniosków.
Do uźródłowienia merytorycznych treści w Wikipediach służą przypisy.
Aby tworzenie przypisów ułatwić i nadać im ustaloną strukturę, wykorzystywana jest grupa szablonów określane nazwą szablonów cytowania.
Ważnym szablonem jest szablon o nazwie Cytuj książkę, występujący w kodzie wiki-tekstu jako {{Cytuj książkę|...}}
Ten szablon używamy, gdy informacje potwierdzające treść pierwotnie pochodzą z publikacji książkowej (w wersji elektronicznej lub nie).
Obecnie każda książka jest jednoznacznie identyfikowana przez ISBN.
Tego identyfikatora użyli autorzy zbioru danych (dataset), dla pozycji książkowych użytych w jakimkolwiek kontekście w polskiej Wikipedii.
Ja natomiast, we wcześniejszym poście przedstawiłem 20 książek najczęściej występujących w WP-PL w cytowaniach, na podstawie tego zbioru danych.
Teraz przedstawiam takie samo zestawienie, ale stworzone na podstawie mojego własnego zbioru danych.
Przyjęta metodologia była nieco odmienna, gdyż ja wyciągnąłem wszystkie szablony "Cytuj książkę” z haseł, a z nich następnie powyciągałem ISBNy.
Poza tym użyłem nowszego dumpa XML polskiej Wikipedii, bo z listopada 2018, a nie z marca 2018.
Dane liczbowe:
Łączna ilość szablonów Cytuj książkę: 535.006Szablony Cytuj książkę zawierające ISBN: 317.083
Szablony Cytuj książkę bez parametru "isbn": 187.323
Szablony Cytuj książkę, pusty parametr "isbn": 30.600
Pewna ilość szablonów zawierających jakąś wartość w parametrze "isbn" została odrzucona, ponieważ zawierały nieprawidłowe dane (np. ciągi znaków takie jak: "brak" lub "wtedy nie było adnotacji o ISBN").
Wyniki analizy
- Cichocki, Włodzimierz Polskie nazewnictwo ssaków świata (Polish names of mammals of the world), Muzeum i Instytut Zoologii PAN, Warszawa, 2015, ISBN 978-83-88147-15-9, OCLC 922215069 = 3083
- Paryska, Zofia Wielka encyklopedia tatrzańska, Wydawnictwo Górskie, Poronin, 1995, ISBN 83-7104-009-1, OCLC 35208429 = 2578
- Polak, Bogusław Polskie formacje graniczne 1918-1939 : Straż Graniczna 1918- 1939 : dokumenty organizacyjne : wybór źródeł, Wydawnictwo Uczelniane Politechniki Koszalińskiej, Koszalin ,1999, ISBN 83-87424-77-3, OCLC 49399163 = 1969
- Wojewoda, Władysław Checklist of Polish larger Basidiomycetes (Krytyczna lista wielkoowocnikowych grzybów podstawkowych Polski), W. Szafer Institute of Botany, Polish Academy of Sciences, Kraków, 2003, ISBN 83-89648-09-1, OCLC 62368937 = 1571
- Dominiczak, Henryk Granice państwa i ich ochrona na przestrzeni dziejów : 966-1996, Wydawnictwo Bellona, Warszawa, 1997, ISBN 83-11-08618-4, OCLC 37244743 = 1390
- Kurzyński, Henryk Historia finałów Lekkoatletycznych Mistrzostw Polski 1920-2007 : konkurencje męskie, KAdruk Komisja Statystyczna PZLA, Szczecin-Warszawa, 2008, ISBN 978-83-61233-20-6, OCLC 751207980 = 1228
- Rutkowski, Lucjan Klucz do oznaczania roślin naczyniowych Polski niżowej, Wydawnictwo Naukowe PWN, Warszawa, 2007, ISBN 83-01-14342-8, OCLC 183208377 = 1138
- Choiński, Adam Katalog jezior Polski, Wydawnictwo Naukowe UAM, Poznań, 2006, ISBN 83-232-1732-7, OCLC 169954726 = 1039
- Matuszkiewicz, Władysław Przewodnik do oznaczania zbiorowisk roślinnych Polski, Wydawnictwo Naukowe PWN, 2007, Warszawa, ISBN 83-01-14439-4, OCLC 214323325 = 988
- Kula, Henryk Polska straż graniczna w latach 1928-1939, Wydawnictwo Bellona, 1994, Warszawa, ISBN 83-110-826-71 = 980
- Kondracki, Jerzy Geografia regionalna Polski, Wydawnictwo Naukowe PWN, Warszawa, 1998, ISBN 83-01-12479-2, OCLC 40893735 = 877
- Mirek, Zbigniew Red list of plants and fungi in Poland (Czerwona lista roślin i grzybów Polski), W. Szafer Institute of Botany, Polish Academy of Sciences, Kraków, 2006, ISBN 83-89648-38-5, OCLC 78225357 = 861
- Chodkowski, Andrzej Encyklopedia muzyki, Wydawnictwo Naukowe PWN, Warszawa, 2007, ISBN 8301113901 = 857
- Fros, Henryk i Sowa, Franciszek Księga imion i świętych. T. 6, W-Z, Kraków, Wydawnictwo WAM - Księża Jezuici, 2007, ISBN 9788373187368 = 802
- Pawłowska, Ewa Hydronimy, Główny Urząd Geodezji i Kartografii,Warszawa, 2006, ISBN 83-239-9607-5, OCLC 749337946 = 778
- Mirek, Zbigniew Czerwona księga Karpat Polskich : rośliny naczyniowe, Instytut Botaniki im. W. Szafera PAN, Kraków, 2008, ISBN 978-83-89648-71-6, OCLC 401780346 = 750
- Januszewski, Jarosław Tatry i Podtatrze : atlas satelitarny, 1:15 000, Geosystems Polska, Warszawa, 2005, ISBN 83-909352-2-8, OCLC 181637523 = 748
- Kaźmierczakowa, Róża Polska czerwona lista roślin paprotników i roślin kwiatowych (Polish red list of pteridophytes and flowering plants), Instytut Ochrony Przyrody, Polska Akademia Nauk, 2016,ISBN 9788361191889, OCLC 982380143 = 730
- Sula, Marek Rejon Giewontu i Czerwonych Wierchów : mapa turystyczna 1:20 000 (Tourist map, Touristenkarte, Turistická mapa), WiT, Piwniczna Zdrój, 2006, ISBN 83-89580-00-4, OCLC 839072663 = 721
- Gajl, Tadeusz Herbarz polski od średniowiecza do XX wieku : ponad 4500 herbów szlacheckich 37 tysięcy nazwisk 55 tysięcy rodów, L&L, Gdańsk, 2007, ISBN 978-83-60597-10-1, OCLC 233447252 = 719
Wnioski
- Bardzo podobna lista, w zasadzie prawie to samo. Drobne przesunięcia pod względem częstości z poprzedniej listy i 2 nowe pozycje (zaznaczone na czerwono).
- Najczęstsza książka została użyta w ponad 3000 szablonów "Cytuj książkę"
- Zestawienie nie obejmuje wszystkich książek użytych w cytowaniach
- Wiele szablonów "Cytuj książkę" nie zawiera ISBNa, ani OCLC ID (ponad 200.000 szablonów)
- Sporo szablonów "Cytuj książkę" zawiera nieprawidłowe dane jako wartość parametru isbn
- Pewna ilość szablonów wymaga poprawy ręcznej, zdecydowana większość może być poprawiona za pomocą botów