"Unsilencing the VOC Testaments"

  • mrt 2021
  • Milo van de Pol
  • ·
  • Aangepast 27 jun
  • 37
Milo van de Pol
Automatische Tekst Herkenning
  • Sebastiaan Vos

Hoe dekoloniseer je de archieven van het Nationaal Archief? Dat was de vraag waarover een groepje masterstudenten archiefwetenschap aan de Universiteit van Amsterdam zich de afgelopen maand boog tijdens hun project “Unsilencing the VOC Testaments”.

Onder leiding van Charles Jeurgens, hoogleraar archiefwetenschappen, onderzochten de studenten hoe ze de vele zwijgende getuigen, met name de totslaafgemaakten, in de VOC-testamenten een stem konden geven. Het Nationaal Archief ondersteunde dit project door automatische transcripties van de testamenten aan te leveren.

De VOC-testamenten

De Verenigde Oost-Indische Compagnie bood in de zeventiende en achttiende eeuw aan tienduizenden mensen werk. Een baan bij deze succesvolle werkgever had echter een keerzijde: de kans om het niet te overleven was groot. Velen stierven al tijdens de barre reis naar de Oost, nog veel meer personeel legde het loodje in de koloniën. Ziekte, ontbering, ongelukken en gevechtshandelingen waren daar debet aan. Om die reden lieten veel VOC-dienaren bij een van de VOC-notarissen in Batavia, Kaap de Goede Hoop of andere plaatsen hun testament opmaken. Kopieën van die testamenten werden naar het bestuurskantoor van de VOC in Amsterdam gestuurd.

Zwijgende getuigen

Die kopieën maken nu deel uit van het enorme VOC-archief in het Nationaal Archief. In de negentiende eeuw zijn deze stukken ontsloten op naam van de testateur. Dat leverde een toegang op met ruim tienduizend namen, maar wel vanuit een eenzijdig wit, mannelijk en koloniaal perspectief.

Later is deze index gedigitaliseerd en aan de website van het Nationaal Archief toegevoegd. Dat was een stap vooruit wat betreft het toegankelijker maken van deze stukken, maar op deze wijze hield het Nationaal Archief wel de negentiende-eeuwse benadering in stand. Want niet alleen de namen van de mannelijk testateur zijn terug te vinden in in de testamenten, maar ook die van hun echtgenotes, familieleden schuldeisers, getuigen, notarissen en ... totslaafgemaakten.

Al die namen zijn nog niet opgenomen in de digitale index van de VOC-testamenten. Dat levert een vertekend beeld op van de vroegmoderne samenleving. Het wordt dus hoog tijd om, zoals Charles Jeurgens zegt: “het zwijgen op te heffen van wat in archiefprocessen tot zwijgen is gebracht.”

Het project

Ten behoeve van dit project heeft het Nationaal Archief de scans van de testamenten automatisch getranscribeerd en machineleesbaar gemaakt met behulp van de HTR (Handwritten Text Recognition)-tool Transkribus van READ-coop. Deze transcripties maakten het de studenten mogelijk om de testamenten met behulp van AI (Artificial Intelligence)-tools op een nieuwe manier te ontsluiten.

Onder leiding van Charles Jeurgens en Mrinalini Luthra, research fellow bij CREATE, bogen masterstudenten van de UvA, Saskia Virginia Noot, Clare Shutt en Thijs Vorstenburg, zich -gewapend met Jupyter notebooks- over de VOC-testamenten. Hun doel was om een proof of concept op te stellen om de VOC-testamenten te dekoloniseren door middel van herindexering van alle namen in deze archiefstukken.

Onderzoeksresultaten

De transcripties van de testamenten werden doorgezocht met behulp van SpaCy: een platform dat entiteiten (zoals persoonsnamen) in grote hoeveelheden tekst kan herkennen. Dat vergde behoorlijk wat training van het programma. SpaCy herkent namelijk niet out of the box achttiende-eeuws Nederlands, noch persoonsnamen. Wekenlang hebben de studenten dan ook gewerkt om de software te trainen op het herkennen van persoonsnamen en omschrijvingen van personen (denk aan termen als: slaaf, slavinne, Indischvrouw, dienares, enzovoort). Met behulp van het annotatieprogramma Brat markeerden zij al die termen in de transcripties.
Uiteindelijk wisten ze met veel geduld interessante eerste resultaten te boeken. Zo bleek dat alleen al in één inventarisnummer in meer dan 60 procent van de documenten -naast de testateur- ook vrouwen werden genoemd. Daarnaast vonden de studenten dat er in bijna 30 procent van de transcripties sprake was van (namen van) totslaafgemaakten of vrijgemaakten. Dit laatste maakt verder onderzoek naar deze bijzondere rijke en belangrijke bronnen wel erg relevant.

NB: de transcripties van de testamenten zijn te vinden op: https://doi.org/10.5281/zenodo.4383748