Warc bestanden Capsis

  • apr 2021
  • André Skyaasen
  • ·
  • Aangepast 27 jun
  • 5
  • 29
André Skyaasen
Particuliere Websites en SoMe
  • Chido Houbraken
  • Léon Masselink
  • Twan Mars

Hallo allemaal,

Wij hebben als organisatie rond 3TB met warc bestanden aangemaakt in het programma Capsis PreSurf. Die willen wij kunnen ingesten en tonen in ons E-depot. De bestanden kunnen alleen niet worden getoond in een ander software als Capsis. Heeft iemand ander hetzelfde probleem gehad?

De warc-bestanden uit Capsis blijken bijzonder te zijn. Archiefweb.eu hebben ook problemen gehad met deze warc's te tonen/gebruiken.

Ik heb ze geprobeerd te analyseren. De bestanden blijken prima te voldoen aan de eisen van het WARC-formaat.

Ik heb geprobeerd ze te tonen in andere software zoals replayweb.page en Preservica. Replayweb.page pakt de bestanden, maar vinden geen URL's en geen inhoud.

Heeft iemand ervaringen met dit gehad, of weet iemand een oplossing voor dit?

Alvast bedankt!

André

Reacties

5 reacties, meest recent: 26 april 2021
  • Hallo André,

    Heb je toevallig al een poging gedaan met Conifer? Conifer | Homepage (rhizome.org)
    Dit is weer een andere webarchive viewer.

    Ik heb zelf geen ervaring met een dergelijke situatie, maar ik kan me nog bedenken dat de WARC's zijn gemaakt in een specifieke webbrowser en dat je deze nodig hebt om de pagina's terug te zien. Wellicht dat er iemand van het NDE (Netwerk Digitaal Erfgoed) is (coördinatoren) die je in contact kunnen brengen met een WARC-expert?

    Ik hoop dat je er nog uitkomt!

    Hartelijke groet en veel succes,

    Twan

    Twan Mars
  • Beste André,

    Het Zeeuws Archief heeft in 2017 een pilot gedraaid waarin Capsis WARC-bestanden in het e-depot zijn geïmporteerd. Zie https://www.zeeuwsarchief.nl/content/uploads/Pilot-webarchivering-eindrapport-versie-1.0.pdf . Daarin is destijds de volgende regel opgenomen:
    'Voor het raadplegen van de inhoud is nog wel aanvullende actie nodig. Zo moet Capsis zorgen dat de snapshots onafhankelijk van de eigen applicatie te raadplegen zijn. Om ook de livewebsite zonder enig hulpmiddel te kunnen bekijken in het e-Depot dient de betreffende software nog doorontwikkeld te worden.'

    Wellicht weten zij inmiddels meer over dit vraagstuk. Ik ben benieuwd naar de uitkomst.

    Met vriendelijke groet,
    Léon Masselink

    Léon Masselink
  • Ik heb enkele bestanden nu geüpload en geprobeerd te tonen in Conifer, maar Conifer kunnen ze ook niet tonen. Het idee over een specifieke browser is interessant. Een voorbeeldbestand werd gemaakt in Firefox 4.0. Tegenwoordig gebruik ik Firefox 87.0. Ik neem deze idee mee, browser emulatie kan een optie worden.

    Het rapport van de pilot van Het Zeeuws Archief is inderdaad interessant. Ze hebben dezelfde ervaringen als ons opgemaakt. In de rapport zie ik dat een gesprek heeft plaatsgevonden in 2017 met Capsis, waarin Capsis heeft gezegd dat ze hun bestanden raadpleegbaar buiten hun software zullen maken. Dit is volgens mij niet gebeurt, en als het is gebeurt dan is het volgens mij niet achterwaarts op al gemaakte WARC's in het software gedaan.

    Dank jullie wel voor jullie antwoorden, als er meer antwoorden, ideeën of ervaringen zijn op dit gebied hoor ik het graag. Als ik een oplossing voor dit vind zal ik deze post updaten.

    André Skyaasen
  • André, had je deze blog op KIA over WARC-validatie al gevonden?

    En meld dit ook bij het Nationaal Archief (bijv. bij Remco, ook de schrijver van de link hierboven), want die zijn nu bezig de Handreiking WARC-validatie te vernieuwen.

    Chido Houbraken
  • Hoi,

    Dankjewel Chido. Ik heb dit nu gemeldt bij het Nationaal Archief, bij Remco. Ik had inderdaad die blog gezien. Ik heb JHOVE, DROID en Warcio gebruikt op de WARC's. JHOVE en DROID geven aan dat er niks aan de hand is. Maar Warcio vindt fouten in verhouding tot de WARC formaat standaard. In ieder geval gaat iets fout. Ik heb dit nu gemeldt bij meerdere organisaties, en wij werken zelf ook verder om dit op te lossen. Als een oplossing wordt gevonden zal ik deze post updaten!

    André Skyaasen

Trefwoorden