Petscan: De Ultieme Gids voor Zoekopdrachten en Lijsten met Petscan

Pre

In de wereld van Wikimedian projecten is Petscan een onmisbaar hulpmiddel voor iedereen die efficiënt lijsten wil genereren van pagina’s, sjablonen, categorieën en andere elementen. Of je nu net begint met het verzamelen van data of een doorgewinterde onderzoeker bent die complexe sets wil samenstellen, Petscan biedt een intuïtieve interface en krachtige opties om precies te vinden wat je zoekt. In deze uitgebreide handleiding verkennen we wat Petscan is, waarom het zo’n waardevol instrument is, hoe je het effectief inzet en welke praktische voorbeelden je direct kunt toepassen.

Wat is Petscan?

Petscan, soms ook geschreven als PetScan, is een webgebaseerde query-builder en lijstgenerator voor Wikimedia-projecten. Het achterliggende doel is om meerdere pagina’s binnen één of meerdere wikis te verzamelen op basis van diverse criteria. Denk aan het ophalen van alle pagina’s in een bepaalde categorie, alle pagina’s die een specifiek sjabloon gebruiken, of alle pagina’s die aan bepaalde voorwaarden voldoen. Door de kracht van filters, operators en dataset-constructie kun je zeer gerichte lijsten produceren die je vervolgens verder kunt analyseren, exporteren of direct in templates kunt plaatsen.

De naam PetScan doet wellicht een beroep op het idee van „scanning” door een petraal veld van pagina’s te doorlopen. In de praktijk is het een veelzijdige tool die vooral wordt ingezet door editors, onderzoekers, docenten en ontwikkelaars die werken met Wikipedia, Wikidata, Wikimedia Commons en andere Wikimedian projecten. Een belangrijk kenmerk van Petscan is dat het niet beperkt is tot één taal of één project; het ondersteunt vele projecten en talen, waardoor het een universeel hulpmiddel is voor de Wikimedia-gemeenschap.

Waarom Petscan gebruiken?

Er zijn meerdere redenen waarom het gebruik van Petscan de workflow van iedereen die met Wikimedia werkt aanzienlijk kan verbeteren. Hieronder staan de belangrijkste voordelen op een rijtje:

  • Met Petscan kun je gigantische lijsten genereren in een fractie van de tijd die handmatig nodig zou zijn. Door filteren en combineren van criteria kun je precies de set pagina’s selecteren die relevant is voor jouw project.
  • Een goed opgebouwde Petscan-zoekopdracht kan door anderen worden herhaald. Je deelt simpelweg de query of export, waardoor onderzoeksresultaten reproduceerbaar blijven en updates eenvoudig zijn.
  • Petscan biedt directe exports naar verschillende formaten (CSV, JSON, XML, etc.) of kan lijsten integreren in templates en artikelen. Dit maakt het eenvoudig om lijsten meteen te gebruiken in Wikicode of data-analyse workflows.
  • Of je nu pagina’s wilt vinden die een bepaald sjabloon gebruiken, in een specifieke behoefte en namespace vallen, of gekoppeld zijn aan een categorie, Petscan biedt opties die aansluiten op uiteenlopende use-cases.
  • Zowel Wikipedia, Wikivoyage, Commons als andere Wikimedia-projecten worden ondersteund, waardoor je cross-project lijsten kunt creëren.

Hoe werkt Petscan? Een korte handleiding

Het gebruik van Petscan verloopt in een paar eenvoudige stappen, maar elke stap biedt ruimte voor verfijning en complexiteit. Hieronder nemen we je stap voor stap mee door het basisproces, met tips om direct aan de slag te kunnen en gevorderde functies te ontdekken.

Stap 1: Kies je project

In de eerste stap selecteer je het gewenste Wikimedia-project. Dit kan een taalversie van Wikipedia zijn (bijv. de Nederlandse Wikipedia), Wikidata, Wikimedia Commons of een ander Wikimedia-project. De keuze bepaalt welke namespaces, filters en data-bronnen beschikbaar zijn. Door de juiste projectinstelling te kiezen, leg je de basis voor nauwkeurige resultaten.

Stap 2: Stel namespaces en filters in

Petscan werkt met namespaces – denk aan hoofdtekst, bestanden, sjablonen, categorieën en meer. Door de juiste namespaces te selecteren zorg je ervoor dat de zoekopdracht alleen die pagina’s ophaalt die je wilt. Vervolgens kun je filters toevoegen zoals:

  • Categorieën en subcategorieën
  • Sjablonengebruik
  • Aangrenzende pagina’s of gelieerde pagina’s
  • Specifieke woorden of zinnen in de inleiding of het artikel
  • Bijzondere eigenschappen zoals titels, redirects, of historische versies

Door filters slim te combineren kun je complexe lijsten bouwen die precies voldoen aan jouw onderzoeksdoelstelling.

Stap 3: Gebruik logische operators

Net als bij andere query-systemen biedt Petscan logische operators zoals AND, OR en NOT. Hiermee kun je criteria combineren en uitsluiten. Bijvoorbeeld: “pagina’s in de categorie ‘Kattenrassen’ EN geassocieerd met het sjabloon ‘Infobox cat’ AND NOT pagina’s die nog geen artikel zijn.” Deze flexibiliteit maakt het mogelijk om heel specifiek te filteren.

Stap 4: Voorbeeldweergave en export

Wanneer je jouw criteria hebt ingesteld, kun je een voorvertoning van de resultaten bekijken. Het overzicht laat zien welke pagina’s aan de criteria voldoen. Vervolgens kun je de data exporteren naar CSV, JSON of andere formaten, of direct in een lijst voor gebruik in Wikipedia-templates omzetten. Als je wilt, kun je ook een “set” opslaan zodat je later opnieuw dezelfde query kunt gebruiken zonder alles opnieuw op te bouwen.

Belangrijkste functies van Petscan

Petscan bevat een breed palet aan functies die de kracht van de tool bepalen. Hieronder vind je een overzicht van de belangrijkste functies, met uitleg over hoe ze toegepast kunnen worden in dagelijkse workflows.

Naamruimtes en projectselectie

De mogelijkheid om verschillende naamruimtes te kiezen (zoals 0 voor hoofdtekst, 6 voor categoriepagina’s, 10 voor sjablonen, 2 voor bestanden, etc.) is cruciaal. Door de juiste combinatie van naamruimtes te selecteren, kun je lijsten preciseer maken en dubbel werk voorkomen. Daarnaast kun je per project bepalen welke taal en specifieke projectinstellingen je wilt gebruiken, wat erg handig is bij cross-language onderzoeken.

Filters op basis van categorieën, sjablonen en teksten

Petscan laat filters toe op basis van categorieën, het gebruik van sjablonen, en zelfs op basis van inhoudspatronen in de pagina. Dit opent de deur naar geavanceerde queries zoals het samenstellen van alle pagina’s die een bepaald veld of veldwaarde bevatten, of alle pagina’s die een bepaalde taal verwijzingen naar bronnen hebben.

Operatoren en set-constructie

Met AND, OR en NOT kun je meerdere criteria combineren tot complexe sets. Je kunt ook “sets” gebruiken om resultaten te groeperen en vervolgens meerdere sets te vergelijken of te combineren. Deze set-constructie is bijzonder nuttig bij grote onderzoekprojecten waarbij je stapsgewijs verschillende criteria wilt afspreken.

Exporteren en integreren

Na het opstellen van de query kun je de resultaten exporteren in diverse formaten (CSV, JSON, RSS-feeds, enz.). Dit maakt het makkelijk om lijsten te importeren in data-analyse tools, of om ze direct te gebruiken in Wikicode (bijv. templates, infoboxen of navigatiepanelen). Dit vergemakkelijkt verdere verwerking en publicatie.

Praktische voorbeelden van Petscan queries

Hoewel elke query afhankelijk is van het doel, hieronder staan enkele praktische voorbeelden die laten zien hoe Petscan in echte situaties wordt gebruikt. Deze voorbeelden beschrijven de aanpak en de verwachte resultaten, zonder vaste syntaxis te verklappen zodat ze breed toepasbaar blijven.

Voorbeeld 1: Alle Nederlandse Wikipedia-pagina’s in een specifieke categorie

Doel: Een lijst van pagina’s in de categorie “Kattenrassen” op de Nederlandse Wikipedia, uitsluitend in hoofdtekstpagina’s. De werkwijze omvat het selecteren van het project (Wikipedia NL), de naamruimte voor hoofdtekst, en de filter op categorieën. Resultaat: Een overzichtelijke CSV-lijst van pagina-titels die je kunt inladen in een data-analyse klant of gebruiken voor verdere bewerking in Wikicode.

Voorbeeld 2: Pagina’s die een bepaald sjabloon gebruiken

Doel: Alle artikelen die een specifiek infobox-sjabloon gebruiken, bijvoorbeeld een infobox voor “Dierverzorging” of “Kleurcode”. Deze aanpak helpt bij het anonimiseren of vergelijken van structurele elementen binnen artikelen en is handig voor onderhoudsprojecten of auditwerk.

Voorbeeld 3: Cross-project lijsten

Doel: Een lijst van pagina’s die in zowel de Nederlandse Wikipedia als op Wikimedia Commons voorkomen. Hiermee kun je media en artikels koppelen, bijvoorbeeld voor een overzicht van illustraties die relevant zijn voor een reeks dierenartikelen. Het resultaat kan direct worden geëxporteerd naar CSV of JSON en vervolgens worden geïntegreerd in een publicatieplanning of data-visualisatie.

Voorbeeld 4: Pagina’s zonder bepaalde elementen

Doel: Lijst van pagina’s in een taalwiki die géén infobox hebben of geen sjabloon bevatten. Dit soort queries is waardevol voor kwaliteitscontrole en content-gap analyses. Het helpt redacteuren te prioriteren waar verbetering nodig is.

Petscan in de praktijk: toepassingen per Wikimedia-project

Petscan wordt breed gebruikt, maar de toepassing verschilt per project. Hieronder een overzicht van enkele praktische scenario’s per project.

Petscan op Wikipedia (nl, en andere talen)

In de Nederlandse Wikipedia wordt Petscan veel ingezet voor het samenstellen van lijsten van pagina’s in categorieën, het inventariseren van pagina’s met specifieke sjablonen, en het vinden van artikelen die aan bepaalde kwaliteitscriteria voldoen. Het biedt een gestructureerde manier om grote hoeveelheden pagina’s te beheren en te organiseren.

Petscan en Wikidata

Voor Wikidata-gebruikers is Petscan handig om lijsten te genereren van items die aan bepaalde eigenschappen voldoen, of om lijsten van items te exporteren die later kunnen worden gekoppeld aan SPARQL-queries of data-analyses. Zo kun je bijvoorbeeld alle items vinden die bepaalde claims missen of die een bepaald type object beschrijven.

Petscan op Wikimedia Commons

Op Commons kun je met Petscan bestanden, tags en categorieën doorzoeken. Dit is handig voor het bouwen van visuele collecties of het controleren van beeldmateriaal op licentie en gebruiksvoorwaarden. Het steltredacteuren in staat om media efficiënt te indexeren en te evalueren voor publicatie of hergebruik.

Tips en trucs voor betere resultaten

Wil je het meeste halen uit Petscan? Hieronder enkele praktische tips die helpen om betere, schonere en betrouwbaardere lijsten te krijgen.

Tip 1: Begin met een eenvoudige query en voeg geleidelijk complexiteit toe

Start met een basale query en controleer de resultaten. Voeg vervolgens filters en extra criteria toe om de lijst te verfijnen. Deze stapsgewijze aanpak voorkomt dat je werd overweldigd door te veel opties tegelijk en helpt bij foutopsporing.

Tip 2: Gebruik duidelijke naming conventions voor opgeslagen sets

Wanneer je query’s opslaat als sets, kies duidelijke en consistente namen. Dit vergemakkelijkt hergebruik en samenwerking met anderen. Leg in notities kort uit wat de set bevat en welke filters zijn toegepast.

Tip 3: Maak gebruik van exportformaten die aansluiten bij jouw workflow

CSV en JSON zijn nuttig voor data-analyse en vervolgbewerking in spreadsheet-programma’s of scriptomgevingen. Gebruik deze formaten wanneer je lijsten wilt integreren in pipeline-workflows of verder wilt analyseren met programmeertalen zoals Python of R.

Tip 4: Controleer resultaten op consistentie en volledigheid

Na het genereren van een lijst is het verstandig om steekproefsgewijs pagina’s te controleren om te verifiëren dat ze aan de criteria voldoen. Dit helpt om onverwachte afwijkingen snel te herkennen en aanpassingen door te voeren.

Tip 5: Gebruik regex en geavanceerde filters waar mogelijk

Voor gevorderde gebruikers biedt Petscan mogelijkheden om patronen te definiëren met behulp van regex-achtige filters. Dit maakt het mogelijk om gestandaardiseerde titels, patronen in namen of specifieke tekens te herkennen en te selecteren.

Veiligheid en privacy bij het gebruik van Petscan

Petscan is een publieke tool die draait op Wikimedia-infrastructuur. Het gebruik ervan vereist geen speciale machtigingen en is doorgaans veilig voor iedereen die publiek beschikbare data wil verzamelen. Houd wel rekening met de licentie- en gebruiksvoorwaarden van de data die je exporteert, en wees attent op de herbruikbaarheid en attribution-vereisten bij hergebruik in eigen publicaties of datasets.

Toekomst van Petscan en verwante tools

De ontwikkelingen rondom Petscan richten zich op betere prestaties, nog intuitievere interfaces en meer integratiemogelijkheden met andere Wikimedia-tools en data-omgevingen. Verwacht evoluties zoals verbeterde API-toegang, gestroomlijnde workflows voor cross-project lijsten en uitgebreide documentatie met veel praktijkvoorbeelden. Door de continue feedback van de gemeenschap blijft Petscan een relevant en krachtig hulpmiddel voor onderzoekers, redacteuren en data-geïnteresseerden.

Veelgemaakte fouten en hoe ze te voorkomen

Zoals bij elke krachtige tool zitten er valkuilen. Hieronder enkele voorkomende fouten en concrete oplossingen:

  • Onvoldoende specificatie van naamruimtes leidt tot te brede lijsten. Oplossing: Controleer altijd de juiste naamruimtes en voeg zo nodig extra filters toe voordat je exporteert.
  • Fout: Vergeten om de juiste projectinstelling te kiezen voor cross-language queries. Oplossing: Ga eerst na welk project relevant is en pas daarna de filters aan.
  • Fout: Verkeerd gebruik van exportformaten die niet passen bij de beoogde toepassing. Oplossing: Kies het formaat dat het beste aansluit bij jouw data-werkflow en controleer de dataset na export op consistentie.
  • Fout: Niet controleren op licentie- of gebruiksvoorwaarden bij hergebruik van data. Oplossing: Controleer altijd de licenties en vermeld correct de bron bij publicatie of analyse.

Stappenplan: direct aan de slag met Petscan

Wil je meteen aan de slag met Petscan? Volg dit eenvoudige stappenplan om snel resultaten te behalen en te leren werken met deze krachtige tool.

  1. Open Petscan en kies het gewenste Wikimedia-project (bijv. Nederlandse Wikipedia).
  2. Stel de gewenste naamruimtes in (bijv. 0 voor hoofdtekst).
  3. Voeg eenvoudige filters toe (zoals een categorie of het gebruik van een sjabloon).
  4. Voeg optioneel extra criteria toe met AND/OR/NOT om de set verder te verfijnen.
  5. Bekijk de voorvertoning van de resultaten en pas aan waar nodig.
  6. Exporteer de resultaten naar CSV of JSON, of kopieer de lijst voor directe publicatie in Wikicode.
  7. Bewaar de query als een set voor hergebruik en documenteer de criteria voor toekomstige referentie.

Conclusie: waarom Petscan een onmisbaar hulpmiddel blijft

Petscan biedt een unieke combinatie van gebruiksgemak en krachtige functionaliteit die het mogelijk maakt om grote hoeveelheden data uit Wikimedia-projecten effectief te beheren. Door het combineren van naamruimtes, filters en logische operators kunnen zowel beginners als gevorderde gebruikers nauwkeurige en herhaalbare lijsten genereren. Of je nu bieneens een overzicht wilt maken van alle pagina’s die een bepaald sjabloon gebruiken, of een uitgebreide cross-project dataset wilt samenstellen, Petscan helpt je sneller en slimmer te werken. Begin vandaag nog met een eenvoudige query en ontdek hoe deze tool jouw Wikimedian werk naar een hoger niveau tilt.

Veelgestelde vraag

Wat is het verschil tussen PetScan en Petscan?

PetScan is vaak de formele, Engelstalige aanduiding van de tool, terwijl veel gebruikers in het dagelijks taalgebruik de schrijfwijze Petscan gebruiken. Beide verwijzen naar dezelfde krachtige functionaliteit: een flexibele query-builder voor Wikimedia-projecten die je helpt lijsten te genereren, te exporteren en te hergebruiken. Het belangrijkste is dat de functionaliteit hetzelfde blijft en je met beide varianten effectief kunt werken in jouw Wikimedia-werkflow.