Google Archives: willen we dat?

jan 2011
Christian van der Ven
·
Aangepast jun 2024
11
292

Gisteren las ik op de Google Blog over de samenwerking van Google met Yad Vashem waardoor een slordige 130.000 foto's en documenten met betrekking tot de Holocaust online zijn gekomen. Met een dergelijk project laat Google zich weer eens van z'n beste kant zien. Mooi vind ik ook dat zelfs de teksten óp de foto's deels via OCR toegankelijk zijn gemaakt.

Al eerder werkte Google samen met instellingen om dergelijk grote collecties online beschikbaar te krijgen. Zelf heb ik me bijvoorbeeld uren vermaakt met de miljoenen foto's uit de archieven van LIFE, maar ook het Prado in Google Earth mag er zijn.

Aanmeldformulier

Meest opvallend dit keer vond ik de volgende oproep van Google:

We encourage organizations interested in partnering with us in our archiving efforts to enter their information in this form.

(...)

If you have a digital archive that's important to world history and culture and you'd like to present it online using Google tools, we'd like to hear from you.

Een aanmeldformulier dus, om samen te gaan werken met Google. Gezien de collectievoorkeur voor de meeste van onze archiefinstellingen op dit moment nog niet voor de hand liggend, maar na Google Books is dit wel een eerste stap richting Google Archives.

Op Archief 2.0 zwengelde Ingmar de discussie al eens aan. En ik zie nu net, dat hij op zijn eigen blog eerder vandaag al stelde:

En ik denk niet dat de vraag nu is of dit een goede of slechte ontwikkeling is. De vraag is meer: hoe zorgen de archieven dat ze hier optimaal van profiteren?

Amerikaans voorbeeld

Zelf lijkt het me prima als Google Archives wordt opgestart en dat archiefinstellingen met Google (of een andere partner) gaan samenwerken. Ik zie vooral veel in het samenwerkingsmodel zoals de NARA en Footnote hebben: Footnote scant en ontsluit archieven van de NARA en mag die vijf jaar lang naar eigen inzicht exploiteren. Na die termijn komen de scans en indexen voor iedereen vrij beschikbaar via de website van de NARA.

Het is archiefinstellingen inmiddels duidelijk dat ze een groot publiek alleen kunnen bereiken als alle informatie gescand en geïndexeerd, en liefst ook nog getranscribeerd en vertaald online staat. Ontsluiten van informatie, niet van documenten. Precies datgene waar onder meer Google goed in is. Pure winst voor alle partijen dus.

Of liggen er nog beren op de weg?

Reacties

11 reacties, meest recent: 13 januari 2012

Omgekeerde volgorde

Verwijderde gebruiker
1296299280

Niet alle archieven hebben collecties in huis die important to world history and culture zijn. Daaruit lees ik even dat Google dat blijkbaar gaat bepalen: selectie via aanmeldformulier. Dus voor archivarissen die een carrièreswitch overwegen: solliciteer bij Google. Dat is sowieso een hele fijne werkgever heb ik begrepen.

Ik heb er even de blogpost van Ingmar en de eerdere discussie op nagelezen en wat moeten we hier nog op zeggen? Het is een verhaal dat nu al enkele jaren wordt verteld en waar braaf naar wordt geluisterd. Maar doen we ook iets? Nee. En als wij (de archiefdiensten) er niets mee doen, dan pakken anderen het op. Een gigant als Google is vele malen slagvaardiger van de overheid in Nederland (of ergens anders) en daarmee is het lot eigenlijk al meteen duidelijk. We zullen opnieuw achter de feiten aanlopen.

Kan dit meteen even meegnomen worden in de nieuwe Informatiewet die er al geruime tijd aan zit te komen? Regels. Daar heb ik al eens een ei over gelegd.

De enige informatie die over een aantal jaren nog telt, is vindbare digitale informatie, zoals Christian al aangaf. Alle interessante papieren in onze depots ten spijt.

Misschien is het goed als we met een aantal Archief 2.0lers (ik niet, want ik val buiten de leeftijdsgrens van Google) bij Google gaan solliciteren, of tenminste praten, om via die weg dingen te veranderen.

Heb ik beren op de weg genoemd? Hope not.

Zoals altijd geldt er maar een credo: aan de slag. Veranderen. Durven en doen.

(negeer de punten, anders zijn het ineens 3 credo's geworden)

Verwijderde gebruiker
1296569040

Net nav 23-dingen-ding #20 een blog geschreven, dat nu ik dit lees wel heel erg op plagiaat lijkt ...Ik vind Footnote ook een goed voorbeeld van een geslaagde publiek/private archiefsamenwerking. Als je je ziel aan de duivel verkoopt, moet je dat wel onder goede voorwaarden doen. En dan blijkt misschien dat die duivel helemaal niet zo duivels is als je had gedacht.

Christian van der Ven
1296987060

@Luud: Ze beginnen inderdaad met collecties waarvan het publieksbereik groot is. Maar ik geloof op basis van de missie van Google niet dat het daar zal stoppen. "Het doel van Google is om alle informatie wereldwijd toegankelijk en bruikbaar te maken." Dus ook archieven. In Google Books zitten al talloze zaken waarvan je je af kunt vragen of er publiek voor is. Google vraagt zich dat niet af, die scant en ontsluit gewoon.

Misschien is dat ook het verschil. Archivarissen selecteren tot ze een ons wegen, ontsluiten tot ze erbij neervallen, en als we ineens in een nieuw paradigma of zoiets belanden, zijn er zelfs archivarissen die opnieuw beginnen inventariseren wat al eerder geïnventariseerd was. En we praten er veel over. Net wat je zegt: wij zijn een stuk minder slagvaardig dan een bedrijf als Google. Wij praten nog steeds over jpeg en tiff, over 200 en 300 dpi, over hoge en ware kleuren, over velden in een database of xml of waarin dan ook. En we denken er vooral allemaal verschillend over. Google niet. Daar hebben een aantal mensen goed nagedacht en voor de rest wordt er gewoon doorgewerkt. Goed is goed genoeg. ("Het betere is de vijand van het goede" is een gezegde wat veel archivarissen eens op een tegeltje zouden moeten zetten.) Een beetje de mentaliteit van iets als VPND gecombineerd met de kracht van de grote G.

Over een paar jaar rijden de autootjes van Google niet meer alleen door de straten, maar stoppen ze voor onze deur en gaan ze massaal stukken fotograferen. ;-)

Nou goed, wij zijn het wel met elkaar eens natuurlijk. Maar ik hoopte met dit bericht weer anderen te bereiken, die misschien niet de discussiearchieven induiken om daar inspiratie te zoeken. Maar goed, voorlopig vrees ik die opzet jammerlijk is mislukt... haha!

@Anje: Leuk, die blogpost van je! En inderdaad een gevalletje van "twee zielen, één gedachte."

Verwijderde gebruiker
1325779680

Door nieuwe berichten over Google Books en de KB zie ik dit in een ander daglicht. Zie KB en Google. Ofwel, kijk heel goed welke voorwaarden Google in een contract stelt ! Wat vrij is moet naar mijn mening ook digitaal vrij worden en blijven ! Een (korte) overgangsfase om Google of andere bedrijven iets te laten verdienen valt in sommige gevallen te overwegen.

Christian van der Ven
1326090060

@Joost: De berichten zijn wat tegenstrijdig, zoals je weet, over wat de reden is van de vertraging bij de KB. Het zou niks met Google te maken hebben, volgens de KB dan.

Maar wat jij zegt, dat is natuurlijk hoe dan ook helemaal waar en geldt eigenlijk altijd: altijd goed naar alle voorwaarden kijken die worden gesteld.

Ik vind zelf nog altijd mooi hoe in Amerika NARA een samenwerking heeft met Fold3 (voorheen Footnote). Fold3 scant materiaal van NARA, het wordt toegankelijk gemaakt en ze mogen het online voor 5 jaar exploiteren. Na die periode mag ook NARA het op hun site aanbieden.

Mooi detail: het persbericht van die deal is gedateerd 10 januari 2007, dus morgen precies 5 jaar geleden.

Verwijderde gebruiker
1326095460

Zo is het Christian. Altijd goed kijken naar de voorwaarden en de consequenties daarvan verder door / overdenken !

In de constructie die de National Archives and Records Administration (NARA) heeft gekozen kan ik me, in beginsel, redelijk vinden. Hoewel ik liever een en / en verhaal zie, ofwel een betere deal. Volgen medewerkers van archieven die betrokken zijn bij dergelijke deals / contracten al cursussen onderhandelingstechnieken/-tactiek ?

Bij een eventueel volgend contract tussen NARA en Fold3 zal blijken of die vijf jaar voldoende terugverdientijd biedt (volgens Fold3 dan...). Ik ben benieuwd. Ik las Anje van der Lek's (Twitter: @anjevdlek) blogpost, waarnaar ze hierboven linkt over Footnote / Fold3. Hartelijk dank voor jouw aanvullende informatie.

Christian van der Ven
1326124200

@Joost: Op die vragen kan ik natuurlijk geen antwoord geven, maar misschien willen medewerkers van NARA en Fold3 op Archief 2.0 reageren. ;-)

Welke deal had je trouwens nóg beter gevonden... en bovendien realistisch? Je hebt het over 'een en / en verhaal'. Je bedoelt dat NARA al meteen na scanning door Fold3 alles ook digitaal op haar eigen site mag zetten?

Verwijderde gebruiker
1326153660

Google Translate kan die mensen vast helpen ;-)

Misschien is drie jaar ook genoeg. Geen idee. Het gaat er denk ik om of je over en weer transparant wilt zijn. Uiteindelijk heb je een soort gezamenlijk belang. En als je 'launching customer' bent mag dat ook bepaalde voordelen hebben. Al is het op de middellange of langere termijn.

Bij en / en dacht ik inderdaad ook aan meteen aan het ook meteen zelf online mogen zetten. Ik meen ergens gelezen te hebben dat ook één van de aan VeleHanden.nl deelnemende partijen zoiets heeft bedongen. Schreef jij daar misschien over en / of weet jij hoe dat zit?

Christian van der Ven
1326174840

@Joost: Bij VeleHanden.nl was er inderdaad een partij die dit had bedongen, maar die situatie was anders. Het Markiezenhof (Bergen op Zoom) had namelijk zelf al scans van de militieregisters en die werden op de eigen site al beschikbaargesteld. Het zou wat vreemd zijn om van ze te eisen dat ze die scans offline zouden halen, zo lang ze met VeleHanden.nl mee zouden doen. Maar natuurlijk blijven die scans gedurende de loop van het project zónder index.

Een bijkomende factor was dat de website VeleHanden.nl natuurlijk behoefte had aan een bulk scans. En in aanloop van het project was natuurlijk nog onduidelijk hoe succesvol een en ander zou worden. Bovendien speelt (volgens mij) in deze ook de relatie een rol: je wilt samenwerken met archiefdiensten onderling, dan moet je niet te moeilijk gaan doen.

Sowieso is VeleHanden.nl natuurlijk een geheel ander project, omdat archiefdiensten de scankosten voor eigen rekening nemen.

Verwijderde gebruiker
1326422760

Wat ben je toch goed op de hoogte Christian ! Fijn, dank je voor de uitleg. Logisch dat het met de scans van Bergen op Zoom zo gaat.

Samenwerken vraagt en vergt inderdaad souplesse. Dat ben ik helemaal met jou eens.

Naar aanleiding van jouw bericht Goed nieuws uit krantenland en het meten van de opbrengst vroeg ik me af welke organisaties zelf scannen en welke dat (door marktpartijen) laten doen en of die kosten (erg) ver uiteen lopen ? Voor zover daar zicht op is / dat bekend is. Heb jij daar zicht op / inzicht in ?

Christian van der Ven
1326430560

@Joost: Het BHIC neemt ook deel aan het project, dus zodoende zat ik bij wat overleg bij waar een en ander werd besproken.

Op je tweede vraag kan ik geen antwoord geven, simpelweg omdat ik geen inzicht heb in de kosten die anderen maken. Er spelen wel heel veel factoren mee in deze. Want de kosten worden niet alleen gevormd door laten scannen, want het werk moet ook worden voorbereid (manuren). En als je zelf scant, dan heb je apparatuur nodig, mankracht (vrijwilligers? Die moeten ook worden begeleid) en wat dan ook. En wat is in beide gevallen de kwaliteit van het gescande? Met andere woorden: ik denk dat het een erg moeilijke vergelijking zou worden.

Maar wie weet zijn er anderen die het cijferwerk al eens hebben gedaan...

Deel

Help

Google Archives: willen we dat?

Reacties

Trefwoorden

Deel

Help

Google Archives: willen we dat?

Reacties

Trefwoorden

Verken

De archivaris op straat!

Resultaten enquête hergebruik historische persoonsgegevens #opendata

De verkwanseling van een unieke muziekbibliotheek