Foto's geocoderen en wiki loves archives (kvandag 2)
Met enige vertraging een verslag van dag 2 van de KVANdagen. De presentaties van de KVAN-dagen staan i...
Mijn recensie van Gahetna.nl kon niet meer mee met het juli-nummer van het Archievenblad en omdat het volgende nummer in september komt, leek me publicatie op archief2.0 zinvoller. Mogelijk kunnen meteen bepaalde keuzes toegelicht worden door het Nationaal Archief.
Ik beperk me tot het zoeken naar archieven/archiefbestanddelen, het onderdeel van Gahetna dat volgens de Digitale Archivaris in zijn recensie niet is bedoeld voor normale mensen. Het aanmaken van een profiel met de nieuwe mogelijkheden voor reserveren, reacties of transcripties en de foto’s,kaarten, thema’s, gidsen, nieuws en leuke acties (archiefstukken met een X-factor) en zelfs de algemene vormgeving en usability laat ik buiten beschouwing. Voor het bouwen van een gebruiksvriendelijke website en het goed tonen van foto’s of kaarten hoef je tenslotte geen archivaris te zijn. De uitdaging in het archiefvak ligt (o.a.) bij het vraagstuk hoe de archieven op internet makkelijk toegankelijk te krijgen, het liefst ook voor een breed publiek ('normale mensen'). Volgens mij is hierbij deels van een verslechtering sprake in vergelijking met de vorige website van het Nationaal Archief (ik beschouw Gahetna van de Vrienden van... toch maar als de opvolger). Ik heb 'Waalbrug' als zoekterm genomen voor de test, in verband met het 75jarig bestaan van de Nijmeegse Waalbrug.
De zoekterm Waalbrug leverde acht treffers in de archieven op, al kreeg ik er in het algemene resultatenscherm soms maar zes te zien, zelfs toen ik het archiefresultatenscherm maximaliseerde. Het zijn overigens acht archieven met daarin, in totaal, 55 archiefbestanddelen met het woord Waalbrug. Als je een van de archieven aanklikt kom je bij de uitgebreide beschrijving van het archief én de volledige inventaris onder het tabblad Archiefinventaris. Onder het derde tabblad Archiefbestanddelen zitten de beschrijvingen die de treffer opleverden (er is een wat vage aanwijzing: klik op het tabblad om de resultaten te tonen.). Waarom niet meteen naar het tabblad met deze bestanddelen vanuit het zoekresultaat doorlinken? In sommige gevallen zie je de zoekterm pas als je de uitgebreide beschrijving van het bestanddeel bekijkt. Deze uitgebreide beschrijving (na de derde klik) betreft de beschrijving van het bestanddeel in de structuur van de toegang én onder het kopje Archiefbeschrijving (?) de nota bene (of opmerkingen) met daarin de zoekterm en, enigszins voorbarig, de citeerinstructie voor het archiefbestanddeel.
Door het presenteren van de resultaten op archiefniveau moet je bovenstaande weg voor elk archief doorlopen en omdat je niet naar het volgende resultaat (archief) kunt klikken moet je daarvoor altijd terug naar het zoekresultaat. Extra vervelend daarbij is dat in dat zoekresultaat het archief met de meeste treffers in de bestanddelen niet bovenaan staat (zoals wel bij de indexen het geval is). Zo komen van de 55 archiefbestanddelen met Waalbrug er 37 (67%) voor in het consequent als laatst getoonde archief: Commissie Onderzoek Waalbrug. Dit archief had niet alleen door het grote aantal bestanddelen maar ook door het voorkomen van de zoekterm in de naam van het archief een plek bovenaan verdient. Sortering van de zoekresultaten op relevantie dus waarbij je dan overigens wel ergens uitlegt hoe die relevantie bepaald is. (n.b. Bij een nieuwe test kwam het archief van de commissie als derde, de huidige sortering lijkt dus willekeurig te zijn.)
Het is mij nog steeds niet duidelijk of het alternatief voor het zoeken in archieven - een eerste zoekresultaat met meteen de betreffende archiefbestanddelen (in dit geval dus 55) met daarbij de optie om op de naam van het archief te filteren (zoiets als deze google-opdracht)– door principiële bezwaren of technische problemen niet mogelijk is.
Het archief van de Commissie Onderzoek Waalbrug brengt me nog op een ander punt: het archiefniveau als zoekingang is namelijk verdwenen. Stel dat je voor de gestructureerde zoekmethode kiest en eerst een archief wilt zoeken en selecteren waarin je vervolgens, al dan niet via een zoekterm of via de structuur, naar relevante stukken wilt zoeken, dan zul je het nummer van de archiefinventaris moeten weten. Opmerkelijk genoeg kun je in het specifieke zoekvenster voor archieven namelijk wel op het nummer van de archiefinventaris (niet te verwarren met een archiefinventarisnummer) zoeken maar niet op de naam van een archief (of archiefvormer). Door 6000 archieven bladeren, wat wel mogelijk is, werkt uiteraard niet. Op de vraag ‘Welke archieven bevinden zich bij het Nationaal Archief?’ in de vraagbak wordt overigens nog wel naar een archievenoverzicht verwezen.
Als je dan een archief of de archiefbestanddelen eenmaal gevonden hebt dan is de presentatie hiervan keurig op basis van ISAD en gebruikmakend van EAD. Toch is het niet meteen heel overzichtelijk en had de opbouw van het scherm in de vorige website mijn voorkeur. Dat komt mede door de beperkte ruimte in het scherm dat resteert om al die gegevens te tonen. Ook het nut van het tabblad Archiefbeschrijving blijft onduidelijk, zelfs als het tweede wel aanklikbaar is. Het lijkt een poging het ontbreken van een overzichtelijke afzonderlijke inhoudsopgave van de inventaris te compenseren. Hiermee kon je snel naar aanwijzingen voor de gebruiker en duidelijk de structuur van de toegang zien. Gelukkig is er het PDF met de bladwijzers nog, want van elke inventaris is heel mooi een PDF en EAD/XML export beschikbaar.
Wat tot slot werkelijk voortreffelijk is en speciale vermelding verdient, is de consequent logische opbouw van de url’s en de (daardoor) uitstekende navigatiemogelijkheden met het kruimelpad of de back-toets van je browser. Technisch zit de website volgens mij ook uitstekend in elkaar maar de zoekfunctionaliteit en vormgeving, voor archieven in het bijzonder, kunnen beter. Daarvoor kan nog een keer naar de oude site gekeken te worden.
Reacties
Goede bespreking, Ernest! En fijn dat je juist ook een onderdeel bespreekt waar ik zelf minder uitgebreid naar heb gekeken. Een vergelijking op dit punt met de oude site van het Nationaal Archief heb ik niet gemaakt, maar ik kan me van de oude site nog wel herinneren dat ik het gedeelte rond archieven zoeken ontzettend irritant vond. Ik raakte voortdurend de weg kwijt en begreep vaak niet waarom bepaalde resultaten een resultaat waren.
Trouwens, respect dat je deze recensie gewoon online hebt gezet en niet wacht op het volgende Archievenblad - op Archief 2.0 is altijd voldoende plek! :-)
Hopelijk reageert er nog een collega van het Nationaal Archief (of een vriend van het archief natuurlijk... haha!).
I
k heb vanochtend in de 'A tot Z index' het trefwoord 'archievenoverzicht' aangeklikt, ik kwam terecht op een zoekformulier en daaronder een lijst van 6503 archieven, naar eigen believen te sorteren op Nummer archiefinventaris, Archiefnaam of Periode. 20 hits per pagina, ik mag zelf uitzoeken op welke pagina ik moet zijn. Niet echt handig als je niet de exacte inventarisgegevens hebt. Uiteindelijk heb ik na wat geblader en gokken op paginanummer op pagina 20 het archief Binnenlands bestuur 1879-1950 gevonden. In het zoekformulier zoeken naar Binnenlands Bestuur levert 246 hits op, alle inventarissen waar Binnenlands en Bestuur in voorkomen. Exact zoeken dmv aanhalingstekens, dus "Binnenlands Bestuur", levert nog steeds 226 hits op.
Een mogelijkheid om wat meer gestructueerd te kunnen zoeken lijkt me op zijn plaats.
Informatie-explosie is inderdaad de nieuwe uitdaging. Tijdens het afgelopen KBenP zomerevent heb ik een demonstratie bijgewoond van Exalead. Deze richt zich vooral op het bedrijfsleven zoals b.v. de Engelse versie van Funda, maar het is een nieuwe wijze van filteren van informatie om de juiste te kunnen vinden door b.v. combinatie met google maps.
Zou het een idee zijn om eens te kijken hoe zo'n structuur tot stand komt? Wie zitten aan tafel bij de ontwikkeling er van? Zijn het de makers, de bouwers van het systeem met wellicht een of meerdere archivarissen? Zet eens iemand van educatie of publiek aan tafel (ervan uitgaande dat er die niet bij zat) of zelfs een 'normaal' mens. Ook het ontwikkelen van nieuwe tools en daarbij gebruik maken van de crowd is een nieuwe vorm van participatie. Als wij als archiefmensen dit soort moeilijke handelingen moeten uitvoeren, hoe kan een normaal mens - laat staan studenten en of anderen die niet dagelijks met archieven in aanraking komen - dan zijn weg vinden? Digitaal ontsluiten is één, toegankelijk maken is twee.
@Petra, geheel mee eens.
Een korte aanvulling: een uitgebreidere versie van deze recensie zal in het septembernummer van het Archievenblad verschijnen. Maar het gesprek/de discussie kan hier losbarsten...
@Petra. Ik denk/vermoed dat bij Gahetna wel degelijk ook publieksmedewerkers en 'normale mensen' mee hebben gekeken en getest. Volgens mij hebben Christian en Bob Coret geschreven over hun betrokkenheid als testers. Bij veel meningen van mensen die meekijken en -denken blijft het een kwestie van keuzes maken tussen één visie of een compromis. Ik ben wel benieuwd of er technische beperkingen of principiële archivistische ideeën een bepaalde publieksvriendelijke oplossing voor het zoeken in of naar archieven in de weg zaten.
@Yvonne De meerwaarde van Exalead kan ik moeilijk inschatten. Goed kunnen filteren veronderstelt wel opgeschoonde metadata en een combinatie met googlemaps begrijp ik niet helemaal. Alles zal in mijn geval op de coordinaten van de Waalbrug staan, neem ik aan?
Overigens kan ik niet zo snel een archiefwebsite bedenken waar het wel heel makkelijk zoeken is in archieven en waarin bovenstaand zoekproces heel duidelijk gaat. Of kent iemand hele goede voorbeelden?
@Petra @Ernest: Zowel Bob als ik (en nog een stuk of wat anderen) hebben inderdaad flink wat feedback gegeven, maar dat was aan het eind van het hele bouwproject en bovendien zijn wij geen 'normale gebruikers'. Ik ben dus wel benieuwd in hoeverre er ook tijdens het hele traject al is getest. En zijn er bijvoorbeeld usability-onderzoeken uitgevoerd?
Ik weet dat het project hoe langer hoe meer onder een flinke tijdsdruk is komen te staan (wat normaal is). Dat soort druk gaat vaak als eerste ten koste van gebruikersonderzoeken en andere dingen die niet direct nieuwe pagina's en knoppen opleveren. Het Nationaal Archief had goede voornemens op dat vlak, maar het is de vraag of die overeind zijn gebleven tijdens het traject.
Het BHIC is inmiddels ook op weg met het ontwikkelen van een nieuwe site - ik ben benieuwd hoe dat bij ons zal gaan, qua inbouwen van testmomenten.
@Ernest, Exalead heb ik als voorbeeld genoemd dat er buiten de archiefwereld zoekmethodes worden en zijn ontwikkeld, niet altijd gerelateerd aan metadata, die bij kunnen dragen tot het complexer zoeken en vooral vinden van informatie.
Ik geef graag een toelichting bij een aantal keuzes gemaakt voor de gahetNA website en bij genoemde onvolkomenheden. Bij de online presentatie van archieven zijn wij in eerste instantie uitgegaan van de dienstverlening die we onze bezoekers willen bieden. Het grootste probleem voor het 'brede publiek’ dat in een archiefinventaris terecht komt, is dat de zoektocht daar doodloopt op het zoekwoord, gevonden in de beschrijving. Wat een bezoeker eigenlijk zouden willen is (het liefst online) zien wat daaronder schuil gaat. Het is een bewuste keuze geweest om bij de zoekresultaten uiteindelijk te verwijzen naar het laagste niveau - de beschrijving van het inventarisnummer - en om dat ook apart te presenteren. Daar kunnen we namelijk een aantal diensten aanbieden: een inventarisnummer kan besteld of gereserveerd worden en er kunnen kunnen scans getoond worden als die tenminste beschikbaar zijn. Dit zijn opties om verder te komen voor een bezoeker die doodloopt op een archiefbeschrijving. De drempels blijven, behalve als er scans getoond kunnen worden, natuurlijk hoog met kosten voor een bestelling of een bezoek aan Den Haag. Voor diegenen onder ons die al bekend zijn met archiefinventarissen en weten wat ze daarvan kunnen verwachten, zijn dit natuurlijk ook essentiële diensten die het onderzoek vergemakkelijken. Een probleem van de oude site was juist het ontbreken van een presentatie van de afzonderlijke inventarisnummers. De zoekresultaten verwezen naar een pagina met daarop meerdere inventarisnummers waardoor dienstverlening bij een afzonderlijk nummer niet mogelijk was. Terecht punt is het aantal klikken dat nu nodig is om bij het zoekresultaat op detailniveau terecht te komen. Het duurt te lang voordat je ziet waarom een resultaat er tussen staat. Dit staat op hoog op onze lijst met door te voeren verbeteringen. Direct doorklikken vanuit de zoekresultaten naar de tab met archiefbestanddelen is daarbij een eerste stap. Ander genoemd punt is de sortering van de zoekresultaten op relevantie. Die is helaas niet optimaal. Het probleem dat daar speelt is de balans tussen de complexe berekening van de relevantie en de 'performance' van de zoekfunctie. Een betere sortering leverde een niet acceptabele performance op. Het uitvoeren van een zoekactie duurde te lang. Ook hiermee gaan we in de komende releases van gahetNA hard aan de slag. De vraag naar een archievenoverzicht sluit hierbij aan. Bij de oude site was er een archievenoverzicht waarmee gezocht werd in de hoogste niveaus van de archiefinventarissen. Daarnaast zocht de zoekfunctie door de complete archiefinventaris. Dat wekte verwarring. Bezoekers namen bij de gecombineerde zoekfunctie de 'afslag' naar het archievenoverzicht en misten daardoor de treffers in de compleet doorzochte inventarissen. Door de sortering op relevantie te verbeteren zullen de archieven waar het zoekwoord in de hoogste EAD niveaus (om te beginnen in de titel) voorkomt weer boven komen drijven, zonder dat de treffers uit diepere niveaus uit het zicht verdwijnen. Kortom: in de komende periode zijn we actief bezig met het verbeteren van de website en het aanpakken van een aantal (hardnekkige) problemen zoals het sorteren op relevantie. Met de resultaten daarvan in een aantal releases hopen we onze bezoekers ('normale mensen' en de rest) nog beter van dienst te zijn.
Eerder deze week heb ik wat geklaagd over het gebrek aan mogelijkheden om op www.gahetna.nl gestructureerd te kunnen zoeken. Inmiddels ben ik wat verder gekomen en heb een mogelijkheid gevonden om toch wat meer naar mijn zin te kunnen zoeken. De link http://www.gahetna.nl/archievenoverzicht/index/index/sortering/nummer/volgorde/oplopend/aantal/1300 geeft een net overzicht van alle door het Nationaal Archief op Gahetna gezette toegangen, geordend op toegangsnummer, archiefnaam of periode, verdeeld over 6 pagina's (en dat is een stuk beter dan 130 pagina's, veel sneller door te lopen). Naar believen oplopend of aflopend te sorteren. Op zich niet anders dan het zoekresultaat als je via het standaardfurmulier zoekt, maar voor mij is de winst dat ik meer hits op een pagina krijg waardoor het gokken op welke pagina ik moet zijn aanzienlijk kan worden ingeperkt.
Het getal '1300' aan het einde van de link is eventueel te vervangen door een ander getal, het geeft namelijk aan hoeveel hits er per pagina moeten worden vermeld. Aangezien het NA zo rond de 6500 toegangen heet opgenomen is 1300 praktisch, het geeft dan een pagina of 5, 6 aan hits op een snelle manier.Als je een beetje snapt hoe het toegangsnummersysteem van het NA werkt bladert het nu lekker snel door de toegangen.
Alle toegangen kunnen ook op één pagina worden gepresenteerd in de browser (zet dan aan het eind van de link bijvoorbeeld 7000), maar het kost dan vrij veel tijd om de hits ook daadwerkelijk te zien.
Wat ik me nog wel afvraag of het Nationaal Archief nu het op één na oudste archiefstuk in Nederland beheert, na het schrijfplankje van Tolsum. Toegangsnummer 2.09.46, vennootschapsdossiers van het Ministerie van Justitie, geeft namelijk aan dat het oudste in deze toegang beschreven stuk dateert van 820. Maar ik ben bang dat dit toch een omissie is ...
Jammer, Auke, geen wereldschokkende vondst. Het foutje in de datering van de vennootschapsdossiers heb ik hersteld. De serie begint in 1820. De dossiers ontstaan vóór 1945 zullen blijvend bewaard worden. De jongere worden op termijn vernietigd. Voor de informatie kun je ook terecht in de diverse Handelsregisters.
Het oudste stuk in beheer bij het Nationaal archief stamt uit de 12e eeuw en is gedateerd "c. 1166" (1.08.06, Nassause Domeinraad / stukken van Anna van Buren, inv.nr. 33). Helemaal zeker waren onze medievisten dus blijkbaar ook niet over dat stuk. Eigenlijk een flutstuk, gewoon een akte van verpachting van een stuk land te Eiteren, in de nabijheid van IJsselstein. Die zouden we nu waarderen als vernietigbaar. Maar uit die tijden is er zó weinig bewaard gebleven, dat je zelfs een simpele kwitantie nog zou bewaren. En wie weet zijn er nog wel genealogen die kunnen aantonen dat de pachter Johannes van Merloe (= Jan van Meerlo) tot hun voorgeslacht behoort.
@Henny: Zijn er ergens oudste stukken bewaard gebleven die ook leuk zouden zijn geweest zónder dat ze het oudste stuk waren?
Toen ik nog in Waalwijk werkte, was ons oudste stuk dusdanig oninteressant, dat het zelfs in de tijd zelf al als oud papier werd hergebruikt als kaft voor een (eveneens oninteressant) boekje (het zal wel een speciale naam hebben, dat fenomeen). op het BHIC is het oudste stuk ook al niet veel bijzonders, behalve dan dat het zo'n chirograaf is. In beide gevallen had/heb ik tijdens rondleidingen dus wel een leuk verhaal klaar, maar met de inhoud van die stukken heeft het niks te maken.
Er zijn wel meer van die oninteressante oudste stukken, simpele grondtransacties, eenvoudige schenkingen etc. Meestal slechts van tijdelijk belang. Zo heeft Het Utrechts Archief als oudste stuk slechts een stukje van een stuk, dus niet eens een volledig oudste stuk en ik als Drent vind het een stuk van niks.
Christian,
Bedoel je misschien de term 'membra disjecta'? Van die stukjes papier, perkament met tekst die zijn gebruikt als vulmiddel in banden, schutbladen etc.. Zie bijvoorbeeld http://wereldaanboeken.ub.rug.nl/?p=385
@Aike: Ja, zoiets bedoel ik precies! Ik zal eens kijken of ik thuis nog een afbeelding van het stuk wat ik bedoel kan vinden. Misschien...