Namescape zoekinterface: help

Met de pagina Namescape zoekinterface kunnen de verschillende boekencollecties doorzocht worden.

Zoekopdrachten

In het vak "zoekopdracht" kunnen trefwoorden opgegeven worden. De meest basale zoekopdracht bestaat uit één woord. Het zoeken naar namen, de zoekvelden "persoonsnaam", "locatie" en "organisatie", werkt precies hetzelfde als het zoeken in de tekst, met het verschil dat de zoekopdracht beperkt worden tot de geannoteerde namen.

Nota bene, het zoekopdrachtveld interpreteerd de zoekopdracht iets anders dan de naamsvelden. Dat wil zeggen, het algemene zoekveld past 'stemming' en 'stopwoord' filtering toe op de tekst (en zoekopdracht), de naamsvelden doen dit niet.

Er zijn diverse mogelijkheden om op meerdere woorden te zoeken. Een simpele spatie tussen twee woorden geeft een "OR"-zoekopdracht, bijv. geld geluk zoekt op beide trefwoorden en geeft alle documenten terug waarin minstens een van beide voorkomt (voorbeeld). Moeten beide woorden voorkomen in elk resultaat, gebruik dan het woord AND, dus geld AND geluk (voorbeeld). Het aantal treffers van de tweede zoekopdracht zal veel lager zijn dan die van de eerste.

Gebruik aanhalingstekens om op een frase van meerdere woorden te zoeken: "de cock" (voorbeeld) vindt alle voorkomens van de, direct gevolgd door cock.

Zoeken op varianten gebeurt met een sterretje: stamp* (voorbeeld) vindt stamp, stampen, stampvoetend,enz.

De volledige toegestane syntaxis voor uitgebreide zoekopdrachten staat beschreven in de documentatie van het zoekmachinepakket Lucene.

Auteurs en titels

In het vak Auteur kan gezocht worden op de auteurs van de werken. De zoekopdracht wordt als string gezocht in de auteursnamen, dat wil zeggen jacques vindt boeken van zowel "Jacques Kruithof" als van "Jacques Hamelink", voorbeeld

Titel vervult eenzelfde rol als het algemene zoekveld, maar beperkt de zoekopdracht tot de titels van de boeken. Een zoekopdracht als hond* (voorbeeld) geeft zowel resultaten terug betreffende de trouwe viervoeter als die voor het telwoord.

Genre

Met dit veld kan de zoekopdracht beperkt worden op het genre van het boek, voor zover deze bekend is. De genre informatie is niet voor alle boeken bekend.

De genres zijn:

Net als bij auteur kan er op elke deelfragment van het genre gezocht worden. Dit betekent dat "Essays", "Essay", "ssay" alle hetzelfde genre opleveren: voorbeeld.

Datums

Met de optie Datum kunnen een begin- en eindjaar opgegeven worden van het publicatiejaar van een boek. Jaartallen worden opgegeven in het volledige viercijferig formaat JJJJ, dus bijv. 1973 of 2001.

Zowel het begin- als het eindjaar is inclusief, dat wil zeggen dat als je boeken uit de jaren negentig zoekt je moet zoeken op 1990–1999, voorbeeld.

Collecties en alineafiltering

Het beperken van een zoekopdracht tot specifieke (sub)collecties geschiedt door middel van de velden Collectie en Alineafiltering.

Er zijn de volgende collecties boeken beschikbaar:

Sanders
Dit zijn de 542 gescande boeken die het INL van Ewoud Sanders heeft gekregen. Het is Nederlandstalige literatuur uit de periode 1960–2010.
Karina
De 22 Nederlandstalige boeken die Karina van Dalen-Oskam voor het pilot project (Names in novels: an experiment in computational stylistics) gebruikt heeft.
ebooks
7316 (voornamelijk) Nederlandstalige ebooks die van het internet verzameld zijn.
PG
530 Nederlandstalige boeken van Project Gutenberg. Alleen de PG boeken die in epub formaat beschikbaar waren zijn geconverteerd en geindexeerd. Alle PG werken zijn in het publieke domein, het betreft werken van voor 1900.
SoNaR
Een door Karina geselecteerde deelverzameling van 105 werken die in de SoNaR final release terecht gaan komen. Dit is tevens uitsluitend moderne literatuur.

Aangezien de alineadetectie niet foutloos is, bestaat er ook de mogelijkheid om de zoekopdracht te beperken tot de werken die geen alinea's met een abnormale lengte bevatten. Een overzicht van de verdeling van schone versus niet-schone alinea's per corpus is te vinden op clean-paragraphs.