Best practice: notarisarchief snel toegankelijk via repertoria

  • jun 2015
  • Christian van der Ven
  • ·
  • Aangepast 27 jun
  • 5
  • 34
Christian van der Ven
KIA Community
  • Violet
  • Verwijderde gebruiker

Tijdens de KVAN-dagen voerde ik een tafelgesprek over slimme ideeën voor het versneld toegankelijk maken van archieven. Een van die ideeën is al jaren het méér gebruikmaken van eigentijdse (dan wel later vervaardigde) nadere toegangen op materiaal. In het licht daarvan hebben we als BHIC op dit moment een project lopen via VeleHanden waarmee we onze omvangrijke notarisarchieven (t/m 1935) nader toegankelijk laten maken op basis van de bijbehorende repertoria. Lees meer over dit project op onze projectpagina binnen VeleHanden.

Voordelen

Onderzoekers zoeken ongelofelijk vaak - uit log files blijkt bijna uitsluitend - naar namen van vooral personen en ook plaatsen. Dat geldt zeker niet alleen voor genealogen. Daarnaast is ons gebleken dat onderzoekers die akten toegankelijk maken voor eigen gebruik vrijwel altijd hetzelfde soort format gebruiken: een aktenummer, de datum, soms het soort akte en vervolgens een korte samenvatting van de akte met daarin alle belangrijke namen van personen, plaatsen en goederen. Een van onze populairste databases is er eentje met daarin geacquireerde kopieën van dergelijke gebruikersindexen (op basis van platte tekst van websites, uit Word en Excel, ge-OCR'de boekjes, dat soort werk). Met inmiddels meer dan 260.000 akten en ook steeds meer foto's daarvan, eveneens geacquireerd, een vorm van samenwerking waar ik nog altijd blij van word.

Eigenlijk precies allemaal het format waarin ook de repertoria zijn opgesteld. Die zouden als digitale nadere toegang dus ook ruim voldoende moeten zijn voor verreweg de meeste onderzoekers. Voordeel is dat het ook veel minder scannen is dan de daadwerkelijke akten en dat het om een kant en klare toegang gaat die je zo kunt overnemen. Zodra je immers een toegang gaat baseren op de akten zelf, dan moet je veel meer lezen, uitpluizen van data om in velden te stoppen, samenvatten van akten en zo meer. Dat vergt veel tijd en ervaring; het goed samenvatten van een akte is bijvoorbeeld veel lastiger dan gewoon een samenvatting overtikken. Anders gezegd: een bestaande toegang overnemen gaat veel sneller dan er nog eentje moeten maken.

Ander voordeel is dat je vanuit de repertoria ook informatie over akten afgegeven in originali (brevetakten) in je database krijgt, waarvan dus geen minuutakten bewaard zijn gebleven. Op basis van onze ervaringen gaat dat al snel om een kleine 10% van het totaal aan akten. Je hebt dan in ieder geval een korte omschrijving.

Nadelen

Nadelen zijn er natuurlijk ook. Zo zijn de repertoria soms lastiger te lezen, want minder netjes geschreven dan de eigenlijke akten. En de informatie in repertoria is niet altijd even uitgebreid. Zo worden soms niet alle partijen genoemd of worden in plaats van voornamen alleen voorletters opgetekend. Dit is erg afhankelijk van de notaris, want anderen zijn dan weer (te) uitgebreid.

Vooral de vroegere repertoria zijn in het Frans, alhoewel dat ook voor de akten geldt. Wij hebben ervoor gekozen om deze gegevens gewoon onvertaald over te nemen, aangezien toch vooral op namen wordt gezocht. Alleen het veld voor de soort akte (testament etc.) wordt uiteindelijk vertaald, aangezien dit voor een zoekfilter wordt gebruikt.

Die nadelen wegen voor ons niet op tegen de voordelen: het snel verkrijgen van een nadere toegang van voldoende kwaliteit bij een van onze populairste bronnen. Zeker geen ideale toegang, maar ook in dit geval geldt dat goed genoeg echt ruim voldoende is. En later verrijken kan altijd nog.

Kwaliteit

Anders dan bij andere projecten op VeleHanden werken we bij dit project níet met een dubbele invoer. Bij een project als dit, waarbij er naast geïndiceerd vooral ook getranscribeerd moet worden, zijn een dubbele invoer en controle niet zinvol. Allereerst zullen er in de transcriptie al heel snel verschillen zitten (denk aan punten en komma's, hoofdlettergebruik, notatie van geldbedragen etc.), maar bovendien is het echt al werk genoeg om een scan één keer in te voeren, laat staan twee keer. Zonde van de tijd, vinden ook deelnemers (die bij andere projecten de dubbele invoer juist heel goed vinden). Invoerders kunnen de controleurs wel een handje helpen: speciaal voor dit project is in VeleHanden een markeerfunctie ontworpen waarmee invoerders delen van hun transcriptie kunnen markeren waarover ze twijfelen, zodat controleurs hier extra op kunnen letten.

Van onze controleurs krijgen we als feedback terug dat er erg secuur invoerwerk wordt geleverd. De controleurs kijken doorgaans de akten preciezer na dan ikzelf had bedacht, wat de kwaliteit alleen maar weer ten goede komt.

De kwaliteit zal ook hoger zijn doordat invoerders als voorkeur kunnen opgeven van welke plaats ze akten willen invoeren en van welke periode (t/m of na 1815). Met het tweede kunnen eventueel Franstalige akten worden omzeild, met het eerste kan een invoerder zich richten op een plaats waar zijn/haar belangstelling naar uitgaat, waarmee dan waarschijnlijk ook al (onderzoeks)ervaring is opgedaan en waarvan waarschijnlijk bepaalde namen en toponiemen eerder herkend zullen worden. Sowieso helpt het om steeds hetzelfde handschrift tegen te komen.

Tussenstand

We zijn nu zo'n drie maanden onderweg, er zijn zo'n 3.000 scans ingevoerd en gecontroleerd (bijna 10% van het totaal aantal scans), wat neerkomt op zo'n 30.000 toegankelijk gemaakte akten.

Ik ben benieuwd naar de ervaring van anderen die toegankelijk maken op basis van (eigentijdse) toegangen. En als er vragen zijn over ons VeleHanden-project, dan wil ik die natuurlijk graag beantwoorden. Hopelijk heb ik met deze blogpost in ieder geval een nuttig kijkje in de keuken van het BHIC gegeven. En een bijdrage geleverd aan een vervolg op mijn tafelgesprek: delen van ideeën waarmee anderen hun voordeel zouden kunnen doen, zodat we samen de oude Nederlandse archieven sneller toegankelijk krijgen.

Reacties

5 reacties, meest recent: 30 juli 2015
  • Ik vind dit in ieder geval een heel prettige blogpost die uitnodigt om op dezelfde manier aan de slag te gaan. Petje af voor ook weer een succesvolle manier om oude bronnen toegankelijk te maken.

    Verwijderde gebruiker
  • Dank voor je blog. Prima idee. De repertoria van de Bommelerwaardse notarissen (1811-1925; er zijn bij ons geen notariële archieven van vóór 1811) staan bij het Regionaal Archief Rivierenland (eerder bij het  Streekarchief Bommelerwaard) al zo'n 5 jaar gedigitaliseerd online (niet de akten). Het betreft 179 repertoria. We proberen die te indexeren met behulp van enkele vrijwilligers. Dat gaat niet snel (eerst via Memorix Maior van Picturae, net overgeschakeld op Mais Flexis Web). Inmiddels zijn er 6 repertoria geïndexeerd (ca. 23.000 namen). Probleem is niet zozeer het overtypen van de namen. Het uniformeren van de terminologie om de inhoud kort te omschrijven en die uniformiteit afdwingen is lastig. Het lijkt een goed idee om de inschrijvingen gewoon helemaal over te laten typen. Misschien ook iets voor ons om dat in de toekomst via Vele Handen te gaan doen.

    Verwijderde gebruiker
  • @Jan: Fijn om te horen dat mijn blogpost direct weer inspireert! Dankjewel voor je reactie. En je hebt gelijk, het uniformeren en normaliseren van allerlei invoer kost heel veel tijd en vertraagt het proces enorm.

    Het BHIC werkt trouwens mee aan een CATCH-project waarin ook een tool wordt ontwikkeld om vanuit teksten geautomatiseerd persoonsnamen (en relaties daartussen) te herkennen. De tests zijn veelbelovend, dus dit biedt mogelijkheden om in de toekomst toch ook specifiek op naamvelden te kunnen laten zoeken, ook al is er bij de invoer simpelweg overgetikt aan volledige inschrijvingen zoals het in de repertoria stond. (En dan nog, blijkbaar is de huidige digitale toegang al goed genoeg voor 99% van de onderzoekers.)

    Ben benieuwd of jullie je projectwijze gaan heroverwegen. (En proficiat nog met de nieuwe website!)

    Christian van der Ven

Trefwoorden