Update
In opdracht van KVAN/BRAIN en met inout van de werkgroep AVG stelde Mathieu Paapst (ICTRecht) ook een ...
Beste collega's,
Graag jullie advies bij het volgende probleem dat wij hebben met een groot aantal TIFF-bestanden van ca. 13 jaar geleden gedigitaliseerd materiaal.
Een deel van de bestanden geeft bij de ingest in het E-depot (Preservica) een WARNING :
"Error Validating with JHOVE: Count mismatch for tag 306; expecting 20, saw 1"
Bij verder analyseren van de TIFF's met Jhove, ExifTool, DPF Manager blijkt dat in de problematische bestanden de secties Profiles en TIFFMetadata ontbreken. Zie bijlage voor een voorbeeld van een 'fout' en goed bestand.
Tag 306 (Modify Date) blijkt leeg te zijn.
DPF Manager geeft de volgende errors/warnings:
Conformance checker:
TAG-306-0002 tag 306 DateTime DateTime cardinality is not valid, cardinality should be 20
TAG-306-0003 IFD1 Incorrect format for DateTime
TAG-284-0005 IFD1 PlanarConfiguration is irrelevant if SamplesPerPixel is 1, and need not be included.
De vraag is wat de ernst is van deze errors/warnings en of/hoe deze eventueel nog zijn op te lossen (anders dan opnieuw digitaliseren).
De bestanden zijn namelijk wel te openen in een viewer en worden ook goed gerenderd in Preservica. Bij de technische metadata staan 'Valid' en 'Well-formed' op false.
Alvast veel dank voor jullie reacties!
Met vriendelijke groet,
Paul Osseweijer
Stadsarchief Rotterdam
Reacties
Paul,
1. Een WARNING is geen ERROR, dus dat Preservica de bestanden kan renderen is niet zo heel gek.
2. Een WARNING is er niet voor niets. Het bestand is niet 100% compliant aan de standaard. Dus dat "Well-formed" op false staat is m.i. correct.
3. Blijft over: Wat bedoelen we met "Valid" ? "Bruikbaar" of "Compliant" ?
4. In elk geval is een extra opmerking over het ontbreken van de technische metadata als nieuwe metadata wel nodig.
5. Keuren we de bestanden af in de huidige vorm, dan moet er een conversie naar een geldig format worden uitgevoerd. Anders komen we niet verder en is de informatie voor altijd onbereikbaar geworden... Dat kan blijkbaar via een fileviewer en van daaruit als geldig format exporteren. Handwerk of geautomatiseerd (batch-conversie) is dan de volgende vraag...
Er is, zoals je meldt, iets mis met de metadata in de TIFF-header. Zie ook op http://dpfmanager.org/reference-documentation.html. Voor het renderen blijkt dit niet problematisch te zijn.
Je zou deze metadata volgens mij moeten toevoegen aan/corrigeren in de header van elk bestand, het materiaal opnieuw digitaliseren, of laten zoals het is (tiffs zullen jullie wel als masterbestanden willen (be)houden?)
Veel dank voor jullie reacties, Mark en Jules!
We gaan bekijken of we de metadata kunnen toevoegen/corrigeren (aan de hand van de bestanden die wel goed zijn).
Hoi Paul,
Bij het Nationaal Archief zijn wij deze meldingen ook tegengekomen.
TAG-306-0002 tag 306 DateTime DateTime cardinality is not valid, cardinality should be 20
Dit geeft aan dat DPF Manager bij tag 306 20 karakters verwacht en deze niet tegenkomt.
De melding van JHOVE is eigenlijk dezelfde melding met nog iets meer informatie, namelijk dat er maar één karakter/positie gevonden wordt.
TAG-306-0003 IFD1 Incorrect format for DateTime
Deze melding gaat over dezelfde tag (306) en geeft aan dat de waarde niet het correcte format (YYYY:MM:DD HH:MM:SS) conform TIFF specificatie heeft (TIFF 6.0 specificatie). Omdat deze tag leeg is voldoet hij hier natuurlijk niet aan. Mijn ervaring is dat bij veel TIFF's er problemen zijn met datumnotatie. Niet perse dat ze ontbreken, vaker dat de notatie niet conform eerder genoemd format is.
Omdat het bestand wel rendert kun je je afvragen hoe belangrijk de modify date is voor jullie. Als er bijvoorbeeld ook een creatiedatum is, dan zou dat misschien voldoende voor jullie kunnen zijn? Mocht dit wel een probleem zijn dan geeft Mark een aantal opties die je zou kunnen uitvoeren.
Wij zijn bij het NA ook bezig met het verklaren van meldingen die uit JHOVE en andere validatie- en identificatietools komen en willen een knowledge base opbouwen. Het lijkt
ons handig om dit gezamenlijk te doen, we lopen allemaal tegen dezelfde meldingen aan.
Zie deze oproep!