Tools voor bestandsidentificatie en conversie

  • apr 2017
  • Pim Oxener
  • ·
  • Aangepast jun 2024
  • 2
  • 88
Pim Oxener
KIA Community
  • Verwijderde gebruiker

In het kader van het opstellen van een notitie over de strategie voor langdurige bewaren van digitale overheidsinformatie ben ik benieuwd naar het bestaan van softwaretools waarmee bestanden met onbekende of multi-interpretabele extensies kunnen worden geïdentificeerd.

Een ander punt in dit verband is het omzetten van bestanden met een extensie die niet voorkomt op - bijvoorbeeld - de lijst bestanden die door het Nationaal Archief als duurzaam of acceptabel zijn benoemd. Conversie is een mogelijkheid om deze bestanden duurzaam te maken. Kent iemand softwaretools waarmee dat voor elkaar te krijgen is? En waarvan ook gedocumenteerd wat er bij deze conversie verloren gaat en wat behouden blijft?

Reacties

2 reacties, meest recent: 6 juni 2017
  • Dag Pim,

    Voor softwaretools zijn er een aantal go-to online bronnen, zoals Digital POWRR: http://digitalpowrr.niu.edu/tool-grid/. Die afgaande, kom ik uit op het volgende tool-overzicht. 

    Voor het identificatiedeel van je vraag:

    DROID (Digital Record Object Identification)

    FIDO (Format Identification for Digital Objects)

    JHOVE (JSTOR/Harvard Object Validation Environment) & JHOVE2

    Niet alle bovenstaande tools zijn even gebruiksvriendelijk, volledig, en up to date. 

    Bij audio- en videoformaten wordt naast het containerformaat ook belang gehecht aan de video- en audio-encodering. Die krijg je met behulp van tools als MediaInfo te zien. 

    Qua conversie is er een aanzienlijke lijst software te verzinnen -- maar belangrijker nog dan de software zelf is de instellingen waarmee je de conversie doet en de mate waarin het eindresultaat voldoet aan je voorziene standaard. Om dat te controleren, worden binnen PREFORMA validatietools ontwikkeld zoals:

    • veraPDF voor PDF/A 

    • DPFmanager voor archiefbestendige TIFF-profielen

    • MediaConch voor videobestanden

    Wat betreft de lijst bestanden van het Nationaal Archief, is het belangrijk dat NA de lijst voor zichzelf heeft samengesteld. Wat ze voor zichzelf niet als duurzaam beschouwen, kan afwijken van de noden van uw depot of archief. Indien er bij conversie vermoeden is dat er informatie verloren gaat, kan het te adviseren zijn het origineel naast de geconverteerde archiefmaster mee op te slaan.

    Wordt de notitie ook op dit forum gedeeld als deze klaar is? Ik hoop alleszins van wel.

    Hartelijke groet en succes, Erwin

    Verwijderde gebruiker
  • Dank Erwin, voor je reactie. Het eerste deel van je observatie moet ik helaas onderschrijven. De tweede is heel bruikbaar. Zodra een en ander zijn beslag heeft gekregen - en de opdrachtgever is akkoord met delen - verschijnt hij hier.

    Groet!

    Pim

    Pim Oxener

Trefwoorden