Is er een lijst van OAI-PMH data providers van Nederlandse erfgoed instellingen?

  • mrt 2011
  • Bob Coret
  • ·
  • Aangepast 27 jun
  • 12
  • 31
Bob Coret
KIA Community
  • Ivo Zandhuis
  • Verwijderde gebruiker

Voor de Scans zoeken service van Genealogie Online ben ik toegewezen op de bronbeschrijvingen die op de websites van erfgroedinstellingen worden geboden, in diverse HTML formaten, soms PDF, weinig uniformiteit. Hadden we daar niet de OAI-PMH standaard voor? Is toch een heel concreet voorbeeld van open data... Lees ook nog eens de OAI-PMH pagina op de Taskforce Archieven site of bekijk het voorbeeld van Genealogie Online (ook toegankelijk als OAI-PMH data provider).

De enige mij bekende lijst met OAI-PMH data providers is die op de Open Archives site: Registered Data Providers. Op deze lijst staan enkele Nederlandse providers maar ik kan hier geen erfgoed instelling in ontdekken. Helaas ook niets over OAI-PMH op de ArchiefWiki (wellicht op de pagina van elk archief ook de "Base URL repository" opnemen?).

Dus mijn concrete vraag: zijn er Nederlandse erfgoed instellingen die hun beschrijvingen van archiefmateriaal, afbeeldingen en publicaties beschikbaar te stellen via OAI-PMH? Zo ja, wat is de URL van de betreffende data provider? Zo nee, op welke wijze wordt er al wel data beschikbaar gesteld anders dan HTML?

mvg,

Bob Coret

Reacties

12 reacties, meest recent: 17 maart 2011
  • Hoi Bob,

     

    Gebruikers van Memorix (Pictura) hebben meestal een OAI-PMH endpoint beschikbaar. Ze weten vaak zelf niet dat dat zo is, en als ze het wel weten  publiceren ze deze endpoints niet. Een wereld te winnen...

    Voor Atlantis geldt iets vergelijkbaars, maar daar ben ik nog minder mee in aanraking gekomen, dus weet ik niet precies.

    Ken je OAIster? Ik zie niet zo snel hoe je zou kunnen selecteren op land, maar misschien zie ik iets over het hoofd.

    Groet,

    Ivo

     

     

    Ivo Zandhuis
  • Ivo Zandhuis zei:

    Hoi Bob,

     

    Gebruikers van Memorix (Pictura) hebben meestal een OAI-PMH endpoint beschikbaar. Ze weten vaak zelf niet dat dat zo is, en als ze het wel weten  publiceren ze deze endpoints niet. Een wereld te winnen...

     

    Standaard staan die OAI-PMH-interfaces geblokkeerd voor requests van buitenaf. Met de oude Memorix worden requests gefilterd op IP-adressen die in de whitelist staan, met de nieuwe Memorix Major moet je je autoriseren geloof ik. Het is dus niet zo dat je alle Memorixen zomaar kunt raadplegen via OAI-PMH, je zult daar dus nog steeds afspraken met de betreffende archiefdiensten voor moeten maken.

     

    Onze eigen beeldbank wordt bijvoorbeeld via OAI-PMH bevraagd door Geschiedenis van Zuid-Holland en Indie in Oorlog.

    Verwijderde gebruiker
  • Yvette Hoitink zei:

    Standaard staan die OAI-PMH-interfaces geblokkeerd voor requests van buitenaf. Met de oude Memorix worden requests gefilterd op IP-adressen die in de whitelist staan, met de nieuwe Memorix Major moet je je autoriseren geloof ik. Het is dus niet zo dat je alle Memorixen zomaar kunt raadplegen via OAI-PMH, je zult daar dus nog steeds afspraken met de betreffende archiefdiensten voor moeten maken.

     

    Wat is de gedachte achter deze geslotenheid? Wat valt er af te spreken en wie komt er voor in aanmerking?

    Bob Coret
  • Dit gaat me toch wel boven de pet. 

    Maar misschien helpt het als jij, Bob, met iemand van Pictura praat en daar je vraag neerlegt? Ik wil dat wel regelen.

    Verwijderde gebruiker
  • Luud,

     

    Het lijkt me goed dat jij (en ook de andere archieven) deze vraag neerleggen bij de leverancier. Gebruik je als archief een tool die de data op een open wijze kan ontsluiten (via OAI-PMH of ander formaat)? Is het bij jouw archief ingesteld? 

    Maar uit de reacties van Yvette en Ivo lees je ook dat het op een open wijze ontsluiten van de beschrijvingen van archiefmateriaal, afbeeldingen en publicaties een keuze is (of zou moeten zijn) van het archief.

    Dus de vraag die archieven voor zich zelf moeten beantwoorden, geloven wij in open data?

    Bob Coret
  • @Bob Bij ons gaat het om een beeldbank waar in veel gevallen nog auteursrecht op rust. Het is dus geen 'open data' en die kunnen we dus ook niet open beschikbaar stellen. 

    Voor sommige collecties hebben we afspraken gemaakt met de rechthebbenden (of vertegenwoordigers daarvan) dat foto's alleen in onze eigen context gepresenteerd mogen worden. Die kunnen we dus niet via OAI-PMH voor willekeurige derden openzetten.

    Bij scans van archiefstukken waar geen auteursrecht opzit, zou dat juridisch wel kunnen denk ik. Disclaimer: I am not a laywer!

    Verwijderde gebruiker
  • Ik merk op Twitter dat mijn reactie vragen oproept. Zoals misschien bekend ben ik zelf een groot voorstander van open data. Maar volgens mij kun je daar alleen voor kiezen als het je eigen data is. Net zoals dat ik ook de voordeur van de buren niet open kan zetten, kan ik dat ook niet van data die niet mijn eigendom is. Of zie ik dat verkeerd? Is er een jurist in de zaal?

    Verwijderde gebruiker
  • Hoewel ik ook geen jurist ben - voor mij geldt dezelfde disclaimer als voor Yvette -  ben ik toch zo vrij om een aanvulling op de auteursrechtenkwestie te geven. Ik heb er in de tijd dat ik met vormgevingsarchieven werkte veel mee te maken gehad en ben nog steeds van mening dat auteursrechten geen obstakel mogen worden.

     

    Het principe van auteursrecht is dat je vooraf toestemming van de rechthebbende nodig hebt wanneer je een werk wilt verveelvoudigen en openbaarmaken (of exploiteren). En soms kan er over een vergoeding tegenover staan om deze toestemming te krijgen.Het auteursrecht is een economisch recht, die regelt dat een maker het recht kan uitoefenen om zijn of haar creatieve prestatie te exploiteren, voor een beperkte periode weliswaar. In de meeste gevallen gaat het delen van data dus over 'rechten' in de zin van centen. Dat kun je regelen.

     

    Yvette merkt terecht op dat voor veel beeldbanken de rechten op de beelden niet bij de archiefdienst berusten. En al heeft een archiefdienst daarover afspraken met de rechthebben (of hun vertegenwoordigers) gemaakt, dan is nog niet geregeld dat vervolgens iedere gebruiker van die beeldbank dezelfde rechten (of licentie) heeft. Degene die (opnieuw) openbaarmaakt of verveelvoudigd moet zelf opnieuw met de rechthebbende of hun vertegenwoordigers afspraken maken over de (vergoeding voor) exploitatie van die data.

     

    Ik weet overigens niet in hoeverre de afspraken die het NA heeft gemaakt, uitsluiten of bepalen op welke wijze zij de data beschikbaar mag worden gesteld aan derden.  Zijn er restricties vastgelegd in de manier waarop de beelden door de archiefdienst wordt verveelvuldigd? Yvette sprak over 'in context', is dat volgens de afspraak die met Pictoright is vastgelegd? Overigens is de data over de beelden - de beschrijvingen of metadata - van de archiefdienst zelf, daar mag ze mee doen wat ze zelf wil.

     

    Daarnaast hebben we een grote hoeveelheid andere data die door archiefdiensten wordt beheerd, de overheidsdata. Ik citeer de Juridische wegwijzer Archieven en musea online: "De Auteurswet bepaalt dat een deel daarvan, namelijk werken die door de openbare macht openbaar zijn gemaakt (dus geen interne stukken), vrij mag worden verveelvoudigd en openbaar gemaakt. Echter, een uitzondering geldt als de betreffende overheid een auteurs- rechtvoorbehoud op het werk heeft gemaakt.....Wel mogen werken die zijn gecreëerd door de openbare macht vrij worden hergebruikt (tenzij een auteursrechtvoorbehoud is gemaakt) wat online zetten mogelijk maakt, bijvoorbeeld voor archiefinstellingen met overheidsarchieven."

     

    De meeste archiefdiensten maken tegenwoordig afspraken over de rechten op archiefdocumenten die ze in huis nemen. Daarmee wordt verzekerd dat archieven of collecties openbaar gemaakt kunnen worden op de wijze die de archiefdienst goeddunkt. Nog los van alle andere juridische belemmeringen die we nu maar even buiten de discussie laten.

     

    Moraal van het verhaal: auteursrechten zijn relevant maar kunnen veelal geregeld worden. Dat geldt m.i. ook voor hergebruik door derden.

    Verwijderde gebruiker
  • Zoals een aantal deelnemers al aangeeft heeft Pictura bij elke Memorix klant een OAI-PMH interface beschikbaar, heet maakt standaard deel uit van Memorix. Niet elke klant heeft dit ingericht (mapping), en niet elke klant wil het gebruiken. Het is inderdaad zo dat standaard de Memorix OAI interface geblokkeerd is. Dit is van ons uit een technische bescherming, zodat niet wij als Pictura de data beschikbaar stellen van onze klanten. De gebruiker kan wel zelf eenvoudig de OAI interface openzetten, omdat alle geblokkeerde Harvesters in een log komen waar in je deze partijen toegang kunt geven door een knopje om te zetten.

     

    Zoals Yvette al aangeeft hebben we in ons nieuwe systeem, Memorix Maior, gekozen voor toegang middels een API-Key. Wederom beperken we dus toegang, om bovenstaande redenen. Het is gewoon niet aan ons om data beschikbaar te stellen, maar we faciliteren het wel. Binnen Memorix Maior is de mapping van metadata naar Dublin Core wel wat complexer geworden, omdat collecties nu volledig relationeel zijn ingericht, met o.a. gebruik van Authority Files. 

     

    Met onze OAI-PMH oplossing worden ook de gekoppelde assets meegezonden, die desgewenst als thumbnail zijn op te vragen via onze imageserver, ook daar gelden weer restricties die wij via onze klanten opleggen. Voor de meeste klanten zal ook een Deeplink naar het object op de eigen website worden meegeleverd.

     

    De OAI-PMH die momenteel op onze Memorix beheeromgeving draait, gaat over het algemeen uitsluitend over beeldcollecties, maar... goed nieuws! In het kader van WieWasWie hebben wij opdracht gekregen van onze klanten om een OAI-PMH interface op Memorix Maior te maken voor genalogische collecties. Deze OAI-PMH interface zal de metadata niet in Dublin Cure uitleveren, maar volgens het WieWasWie metadataformaat A2A. Ook hier geldt weer dat de klant zelf bepaalt wie toegang heeft.

     

    Voor een heel concreet antwoord op Bob's vraag, een lijst van OAI-PMH providers, heb ik even gekeken welke OAI interfaces van onze klanten echt momenteel gebruikt worden door derden. Dit zouden dus allemaal instellingen zijn waar de mapping op orde is. Ik heb deze lijst gebasserd op logbestanden van de laatste 24 uur, dus ik kan niet instaan voor volledigheid. Vaak betreft het een deelcollectie van een instelling.

    Helaas zal dus per instelling contact gezocht moeten worden voor toestemming om de data te mogen harvesten.

     

    Verwijderde gebruiker
  • Mark,

     

    Bedankt voor je antwoord. Ik hoop dat de OAI-PMH interface voor genealogische collecties (op basis van het metadataformaat A2A) wordt gepubliceerd!

     

    Voor de discussie over het open zetten van de OIA-PMH-interfaces nog even het volgende:

    The OAI-Protocol for Metadata Harvesting (OAI-PMH) defines a mechanism for harvesting records containing metadata from repositories.

    Gaat het nu om data of meta-data (de beschrijving van data)? Als het om meta-data gaat: daar rust toch geen auteursrecht op, dat wil je toch niet per definitie dichtgooien?

    Bob Coret
  • Gaat het nu om data of meta-data (de beschrijving van data)? Als het om meta-data gaat: daar rust toch geen auteursrecht op, dat wil je toch niet per definitie dichtgooien?

    Het gaat om de beschrijving van de records, dat kan metadata zijn, maar ook data. Onze beveiliging is niet eens zo zeer om auteursrecht te beschermen, dat is niet onze rol, maar gewoon een kwestie van goed fatsoen: wij zijn een servicebedrijf die de data op een goede, veilige en duurzame manier opslaan, maar niet zelfstandig publiceren.

    Verwijderde gebruiker

Trefwoorden