Overleden of niet? Matching met externe databronnen

  • jan 2022
  • Wouter Brunner
  • ·
  • Aangepast 27 jun
  • 3
  • 101
Wouter Brunner
Toegang tot Data
  • Joyce Pennings
  • Esther Fidder
  • Leonoor Hamers
  • Jeroen Balkenende
  • Maaike van Driel
  • Annemieke Dekker
  • Daniele Mores
  • Liesbeth Keijser
  • Karin Kuilboer
  • Marianne Loef
  • Bob Coret

In juli 2021 bereikten we een mooie mijlpaal: alle Haagse en Loosduinse gezinskaarten kwamen online, waardoor 1,3 miljoen namen doorzoekbaar werden.

De gezinskaarten zijn de bevolkingsadministratie over de periode 1913-1939. Iedereen die in deze periode in Den Haag of Loosduinen ingeschreven stond, komt dus voor op één of meerdere kaarten. Op één kaart kunnen meerdere personen staan.

Niet zichtbaar

Er was echter één groot probleem: privacywetgeving verbiedt ons om de gegevens te tonen van personen die nog in leven zijn. En daar ontstond meteen een uitdaging, want wij weten helemaal niet welke personen nog in leven zijn en welke niet. Om deze reden hebben wij als volgt invulling gegeven aan de regels:

  • wij gaan er vanuit dat personen die langer dan honderd jaar geleden zijn geboren, inmiddels zijn overleden

  • als alle personen inmiddels de leeftijd van honderd jaar bereikt zouden hebben, dan tonen we de gezinskaart

  • als bezoekers kunnen aantonen dat personen jonger dan honderd jaar zijn overleden, dan geven we een kaart alsnog vrij

  • als er een melding komt van een betrokkene – bijvoorbeeld van iemand die de honderd inmiddels gepasseerd is – dan zetten we de kaart alsnog dicht.

In totaal hebben we 545.000 kaarten gedigitaliseerd. Daarvan konden we er 100.000 niet tonen vanwege bovengenoemde privacywetgeving. Bij ongeveer 200.000 van de 1,3 miljoen namen werd daardoor geen kaart getoond. Daarbij is het wel handig om te vertellen dat bij elke nog niet vrijgegeven kaart een datum staat waarop deze alsnog automatisch wordt vrijgegeven. Per jaar zijn dit ruim 5.000 kaarten. Eind 2039 zijn alle kaarten in te zien.

Voor (familie)onderzoek zijn de gezinskaarten ontzettend handig. Niet alleen worden de leden van een gezin benoemd, maar ook staan er beroepen, kerkelijke gezindten, woonadressen en nog veel meer op. Die gegevens kunnen weer aanleiding geven tot het aanwenden van nieuwe bronnen van onderzoek (zoals de woningkaarten of kerkelijke lidmatenregisters). Een bijkomend voordeel is dat ze relatief eenvoudig te begrijpen zijn vanwege de standaardisering, het ontbreken van ambtelijk taalgebruik en de – in de regel – goede leesbaarheid. Dat zoveel kaarten nog niet beschikbaar zijn, is dus enorm jammer.

Matching

In ons archief bevinden zich ook overlijdensakten. Deze lopen tot en met 1969 en ze zijn grotendeels beschreven. Dat wil echter niet zeggen dat wij gemakkelijk geautomatiseerd in ons eigen systeem kunnen kijken of een persoon is overleden. Daar zijn allerlei oorzaken voor, maar de belangrijkste zijn:

  • een naam is niet uniek. We hebben dus aanvullende gegevens nodig om een persoon te kunnen identificeren. Van de gegevens op de gezinskaarten hebben we voor elke persoon ook de geboortedatum en de geboorteplaats overgenomen. Echter, in een overlijdensakte komt geen geboortedatum voor, alleen een leeftijd bij overlijden. De geboorteplaatsen hebben we bij de overlijdensakten in zijn geheel niet overgenomen.

  • Wij weten alleen wie er in Den Haag zijn overleden

Matching met ons eigen bestand was dus heel lastig, en leverde ook maar weinig treffers op. Er zijn echter bronnen waarmee zo’n match wel uitgevoerd kan worden en dat hebben we eind vorig jaar ook laten doen.

Ten eerste is daar het Netwerk Oorlogsbronnen, dat een database beheert met slachtoffers van de Tweede Wereldoorlog. Een match van de 200.000 namen leverde ongeveer 3.000 treffers op. Dit betekent dus dat 3.000 Hagenaars en Loosduiners geboren na 1921 reeds in de oorlog zijn overleden.

Een tweede bron is het Nationaal Register van Overledenen (NRO), dat beheerd wordt door het CBG, het Centrum voor Familiegeschiedenis. Dit register bevat alle overlijdens vanaf 1994. Na de resultaten van de match met Netwerk Oorlogsbronnen en de natuurlijke vrijgave, waren er in december nog 189.000 namen te matchen. Daarvan bleek liefst de helft gevonden te kunnen worden!

Met gevonden wordt in dit geval bedoeld: er is op zijn minst een fuzzy match op naam, geboortedatum en geboorteplaats. ‘Fuzzy searching’ is wel nodig omdat onze data in de regel goed is overgenomen van de scans, maar die data zelf niet altijd 100% klopt (door schrijffouten van ambtenaren, door latere wijzigingen, door verkeerde opgave van de betrokkene). Zeker bij plaatsnamen kunnen verschillen bestaan in de schrijfwijze, en al helemaal bij plaatsen in het voormalige Nederlands Indië. Wel geldt altijd: als de match niet met zekerheid te maken is, dan is er dus geen match.

De resultaten

ca. 34.000 kaarten zijn inmiddels vrijgegeven

  • ca. 12.000 kaarten kunnen eerder worden vrijgegeven dan zonder matching (de jongste persoon is al overleden, oudere nog niet)

  • ca. 64.000 kaarten kennen nog een beperking (ca. 94.000 personen)

  • een volgende keer hoeven we dus veel minder personen te matchen

Het vrijvalschema voor de komende jaren:

Jaar

Zonder Matching

Met Matching

2021

6684

41316

2022

6338

4336

2023

6205

4160

2024

6053

3736

2025

5726

3633

2026

5618

3464

2027

5098

3089

2028

5168

3240

2029

5055

3161

2030

5207

3229

2031

5033

3241

2032

4974

3217

2033

4844

3188

2034

5132

3504

2035

5108

3438

2036

5658

3896

2037

6368

4221

2038

7490

4890

2039

3403

2203

Eindtotaal

105162

105162

In de praktijk zal dit schema niet zo gevolgd worden. Ten eerste omdat er al op incidentele basis kaarten kunnen worden vrijgegeven, maar dat is op de grote getallen verwaarloosbaar.

Het CBG is momenteel echter bezig met het digitaliseren van hun persoonskaarten, waarna deze geïndexeerd zullen worden. Daarmee ontstaat dan ook een grote database van overlijdens tussen 1939 en 1994. Zodra dit mogelijk is, zullen we een nieuwe match laten uitvoeren en daarna zullen naar verwachtingen nog maar heel weinig kaarten niet zichtbaar blijven (namelijk tot ze automatisch worden vrijgegeven of tot er bewijs wordt geleverd door een belangstellende.

Voor nu hebben we in ieder geval een mooi resultaat bereikt, waardoor we aan onze bezoekers meer materiaal kunnen en bovendien minder verzoeken tot vrijgave af hoeven te handelen.

Reacties

3 reacties, meest recent: 31 januari 2022
  • In het verleden bezig geweest met de "Rust In Vrede" API die op basis van naam + geboortedatum. Deze gaf als resultaat links terug naar bronnen die hoogstwaarschijnlijk iets zeggen over het feit dat de persoon is overleden (een leeg resultaat betekent dus dat er geen waarnemingen van het overlijden van de persoon zijn gevonden en als levend beschouwd zou kunnen worden).

    Deze API maakte gebruik van de volgende bronnen:

    • Overlijdensakten (Open Archieven)

    • WO2 slachtoffers (Oorlogsgravenstichting / Erelijst van Gevallenen 1940-1945 / Arolsen Archief / WO2Slachtoffers.nl / Vermistenlijsten in de Nederlandse Staatscourant / Joods Monument / Digitaal Monument Neuengamme / Oorlogsmonumenten (via Online Begraafplaatsen) / Oorlogsdoden in Nijmegen 1939-1945 / Databank Oorlogsslachtoffers Zeeland / Slachtofferdatabase van de Commonwealth War Graves Commission / Belgische Oorlogsdodenregister / Oranjehotel Dodenboeken / Japanse interneringskaarten / Brabantse gesneuvelden / Kamp Vught Nationaal Monument / Oorlogsdoden Dinkelland)

    • Graven (Graftombe / Online-begraafplaatsen)

    • Familieberichen (online-familieberichten / verenigingen / bidprentjes)

    • Onderzoeksresultaten (Genealogie Online)

    De API-gebruiker bepaald welke bronnen worden meegenomen, dus de mate van "risico". Dit zou moeten volgen uit een PIA, waarin bijv. een maatregel genoemd kan worden die mogelijke fouten door fuzzy match of online stambomen kunnen beperken.

    Bob Coret
  • Ha Bob, dat zou inderdaad een mooie aanvulling kunnen zijn. Wel zou ik die dan vooral inzetten om sneller kaarten vrij te kunnen geven, want vooralsnog is mijn verwachting dat bij het gereedkomen van de indexering van de persoonskaarten vrijwel alle nog niet vrijgegeven kaarten alsnog beschikbaar komen. Of heb jij andere verwachtingen?

    Overigens is het wel interessant om te weten wat de verhouding van de onderliggende bronnen binnen die dataset is. Ik verwacht dat wij met de twee matchingsacties die we nu hebben uitgevoerd al veel overlijdens uit die tijdvakken hebben zien langskomen.

    Wouter Brunner
  • Wouter,

    Onderstaande grafiek toont de verhouding (destijds) qua persoonsvermeldingen per bron per jaar (hierbij moet "onderzoeksresultaten" gelezen worden als WO2-bronnen en "overlijdensinschrijvingen" als krantenknipsels/bidprentjes).

    Als de overlijdens vanuit de BRP open beschikbaar zouden zijn zoals in Frankrijk (is afgewezen) dan zou de grafiek er vanaf 1994 tot heden natuurlijk anders uitzien.

    Bob Coret