Stadsarchief Amsterdam op de Transkribus User Conference 2024
Op 15 en 16 februari 2024 vond de Transkribus User Conference plaats. Tijdens dit terugkerende congre...
Het is gelukt: we hebben vanaf nu een geautomatiseerde inname voor digitaal geboren archieven in gebruik genomen! Daarmee werken we volgens de principes van het OAIS-model - de internationale maatstaf voor een digitaal depot. Wat voorheen veel handwerk kostte, gaat nu geheel geautomatiseerd.
Wat voorheen veel handwerk kostte, gaat nu geheel geautomatiseerd. Nu gebeurt dit alleen nog met de dossiers die vanuit de Woo actief openbaar worden gemaakt op open.amsterdam, later volgen alle soorten digitaal geboren archief via archief.amsterdam.
De nieuwe tool zorgt voor de inname van een pakketje van bestanden met bijbehorende metadata (SIP) in het e-depot, waarna de metadata wordt opgenomen in het collectiebeheersysteem, afgeleiden worden gemaakt in het DAM (de opslagplaats van de raadpleegkopiën), en alles wordt getoond op open.amsterdam.
Deze oplevering betekent een grote mijlpaal in het project. Voor het eerst zijn er nu geautomatiseerde koppelingen tussen onderdelen van die infrastructuur, namelijk het e-depot, het collectiebeheersysteem, het DAM en de raadpleegomgeving. De koppelingen werden voorheen gedaan door scripting en handmatige acties. De nieuwe pijplijn scheelt de medewerkers dus veel tijd. En de inname gaat razendsnel: een aangeleverd dossier staat de volgende dag al op open.amsterdam. Deze tool is gerealiseerd door de leverancier die de hele digitale infrastructuur verzorgt: Vitec Memorix (voorheen Picturae).
De pijplijn die nu is gemaakt is voor inname van archieven beschreven volgens TMLO (een standaard voor metadata). Dat betekent dat bij inname de archieven aan TMLO-voorwaarden moet voldoen, met aanvullende voorwaarden van het Stadsarchief om het op de juiste manier in het collectiebeheersysteem te krijgen.
In TMLO is er bijvoorbeeld één veld voor geografische metadata, terwijl ons datamodel meerdere opties daarvoor bevat. Door de metadata in een bepaald format te zetten, herkent de tool om wat voor soort metadata het gaat en naar welk veld het moet worden doorgezet in het collectiebeheersysteem. Doordat het pakketje aan gegevens in één keer geheel wordt verwerkt en vervolgens gepubliceerd, betekent dat ook dat de nodige controles voor inname moeten worden gedaan.
In de toekomst worden ook pijplijnen opgeleverd voor aanlevering in MDTO (een nieuwere standaard voor metadata) en direct op het datamodel van het Stadsarchief, en dat is gebaseerd op de beschrijvingsstandaard Records in Contexts. Veel bronsystemen hebben TMLO of MDTO in het systeem verankerd, en dat is een goede basis om vanuit te gaan.
Maar ook in TMLO en MDTO is er ruimte voor interpretatie van de metadata-standaard. We zien dat er toch altijd een mapping nodig is om het te kunnen innemen. Daarom is het prettig om ook direct op ons datamodel te kunnen aanleveren, dan is er slechts één mapping nodig. Die pijplijn is dan ook naast overheidsdocumenten geschikt voor de inname van digitaal geboren particulier archief, waar standaarden als TMLO en MDTO meestal geen rol spelen.
De dossiers die nu actief openbaar worden gemaakt vanuit de Woo gaan dus de TMLO-pijplijn in en worden gepubliceerd op open.amsterdam. Deze site gaat ook nog een doorontwikkelingstraject in. In een latere fase wordt de algemene website van het Stadsarchief (archief.amsterdam) vervangen, en daar komen dan alle digitaal geboren archieven te staan (inclusief de Woo). De verwachting is dat dit in de loop van 2024 wordt gerealiseerd.