Zoekresultaten

  • De recente ontwikkelingen op het gebied van OCR en HTR hebben mij ertoe gebracht te testen hoe Google 's en Apple 's software kan bijdragen aan de transcriptie-productie en hoe betrouwbaar deze kan zijn. Om die reden heb ik gekozen om te experimenteren met drie soorten documenten van handschrift - getypt en gedrukt materiaal. Deze drie categorieën zijn het belangrijkst als het gaat om de transcriptie productie. Dit experiment vond plaats in beperkte omvang, aangezien vier pagina's zijn getest...

  • Het Nationaal Archief digitaliseert historische archieven op grote schaal. Om het navigeren door de scans op de website te vergemakkelijken worden bepaalde scans tijdens het digitaliseren gelabeld en van een beschrijving voorzien. Zo wordt in verbaalarchief de eerste scan van een dagbundel gelabeld en wordt de datum overgetypt. De items binnen een dagbundel worden ook gelabeld. Bij een aantal inventarisnummers is het labelen niet correct uitgevoerd. Omdat het opnieuw digitaliseren te kostbaa...

  • De onderzoeksgroep Politieke Cultuur en Geschiedenis van het Huygens Instituut is ten behoeve van het project REPUBLIC per direct op zoek naar een tijdelijke Coördinator crowdsourcing en communicatie. Heb jij inzicht in de politieke, diplomatieke, sociale en/of religieuze geschiedenis van de Republiek? Ben je bedreven in het transcriberen van 16e/17e-eeuwse handgeschreven bronnen? Werk je graag in een wetenschappelijke omgeving, dan nodigt het Huygens ING je van harte uit om op deze vacatur...

  • Blog ontleend aan Maritiem Portal. Over de Engelse archiefcollectie Prize Papers, documenten die door Britse kapers in de periode 1652-1815 op vijandelijke schepen werden buitgemaakt, zijn op het Maritiem Portal meerdere berichten te vinden. Logisch, want haar internationale betekenis voor onderzoekers en geïnteresseerden op het terrein van bijvoorbeeld maritieme geschiedenis staat buiten kijf. Op het Portal is ook informatie te vinden over de website Dutch Prize Papers, die het Huygens ING ...

  • De ontwikkelingen op het gebied van transcriptietechniek staan niet stil. Op dit moment maken de meesten van ons gebruik van Transkribus. Dit programma, dat grotendeels op open source code is gebaseerd, bleek tot nu toe een uitstekend hulpmiddel. Dat andere instellingen ook gebruik maken van dergelijke (en vaak dezelfde) open source software moge niet vreemd zijn. Zo is sinds begin dit jaar eScriptorium beschikbaar via Gitlab. Dit programma is een initiatief van eScripta van de Universit...

  • Het heeft maar zijdelings met HTR te maken, maar is toch leuk om via dit platform te delen: Universiteit Leiden heeft een serie video's online gezet, de zogenaamde tafelgesprekken ‘Van kluis naar kussen’ . Hierin krijgt de kijker een blik achter de schermen van de Bijzondere Collecties van de Universitaire Bibliotheken Leiden (UBL). In de aflevering die ik met jullie deel staat de collectie middeleeuwse handschriften uit de ‘kluis’ centraal. De Leidse collectie middeleeuwse handschrift...

  • Op 17 mei, tijdens het symposium De IJsberg zichtbaar maken lanceerde het Nationaal Archief de projectwebsite www.zoekintranscripties.nl. Op deze website kunnen bezoekers handgeschreven bronnen bekijken en doorzoeken. Dat maakt archiefonderzoek veel sneller en locatieonafhankelijk. Het doorzoeken van archiefstukken op zoekintranscripties.nl is mogelijk omdat handgeschreven bronnen met behulp van transcriptietechniek machineleesbaar zijn gemaakt, en zijn verrijkt met kunstmatige intelligen...

  • Op zoek naar nieuwe uitdagingen nu het maken van grote corpora van transcripties al bijna oud nieuws is? Gerhard de Kok is al bezig met de volgende stap: met behulp van Tensorflow zocht hij naar semantische relaties op basis van woorden als "rebellie". Zijn allereerste(!) bevinding deelde hij op Twitter: https://twitter.com/gerharddekok/status/1381673945485692931 Dit smaakt naar meer, Gerhard.

  • Op 17 mei 2021 organiseert het Nationaal Archief een online symposium over de resultaten van het project over automatische handschriftherkenning De IJsberg zichtbaar maken. Historisch onderzoek in oude handschriften kan met de nieuwe technieken voorgoed veranderen. De IJsberg zichtbaar maken Archieven hebben veel handgeschreven archieven. Maar wie kan oude handschriften nog lezen? En snel gescande archieven kunnen doorzoeken, wie wil dat niet? In het project De IJsberg zichtbaar maken, wer...

  • Hoe dekoloniseer je de archieven van het Nationaal Archief? Dat was de vraag waarover een groepje masterstudenten archiefwetenschap aan de Universiteit van Amsterdam zich de afgelopen maand boog tijdens hun project “Unsilencing the VOC Testaments”. Onder leiding van Charles Jeurgens, hoogleraar archiefwetenschappen, onderzochten de studenten hoe ze de vele zwijgende getuigen, met name de totslaafgemaakten, in de VOC-testamenten een stem konden geven. Het Nationaal Archief ondersteunde dit ...

  • 4 februari was het zover. Met meer dan een half jaar vertraging hadden we eindelijk een bijeenkomst met de Regionaal Historische Centra over het project De ijsberg zichtbaar maken. In dat project zetten we handgeschreven teksten om naar informatie die de computer kan lezen. We noemen dat transcriberen. We doen dit met kunstmatige intelligentie. We transcribeerden 1 miljoen scans van de VOC van het Nationaal Archief. Het Noord-Hollands Archief en de andere Regionaal Historische Centra doen m...

  • Gerhard de Kok, universitair docent koloniale geschiedenis aan de universiteit Leiden, vertelt over de interessante vondsten in automatisch getranscribeerde archiefstukken.Het Nationaal Archief transcribeerde archieven zoals de Verenigde Oost-Indische compagnie (VOC), de West-Indische Compagnie (WIC), de Sociëteiten van Suriname en Berbice met automatische handschriftherkenning. In totaal gaat het om 3 miljoen transcripties, een resultaat van het project De IJsberg zichtbaar maken. Gerhar...

  • Inmiddels hebben zich 238 vrijwilligers ingeschreven bij het crowdsourcingproject Goetgevonden! op Vele Handen. Zij hebben al 4.300 scans ingevoerd! Er zijn een paar heel goede en fanatieke invoerders bij en hun werk leverde bijzondere vondsten op. Ook pikte Nu.nl het op, wat veel nieuwe anmeldingen opleverde: https://www.nu.nl/uit/6090951/burgeronderzoek-word-wildkenner-of-duik-de-vaderlandse-geschiedenis-in.html?redirect=1 Om meer vrijwilligers aan te trekken, is het Goetgevonden-team ee...

  • Op donderdagmiddag 17 december organiseert DEN samen met KIA een online inspiratiesessie over de inzet van AI voor het nog beter doorzoekbaar maken van een collectie. Archiefinstellingen beheren vele collecties met handgeschreven materiaal, foto's of scans. Maar niet elk handschrift is even makkelijk te lezen en niet alles is even makkelijk te herkennen op een foto. Zou je niet makkelijker willen kunnen zoeken in de scans van deze archieven? Het Nationaal Archief werkt samen met Noord-Holla...

  • Altijd al willen zoeken in de archieven van de West Indische Compagnie, Raad der Koloniën of de sociëteiten van Suriname en Berbice? De lastige handschriften kunnen nu geen obstakel meer zijn, want het Nationaal Archief heeft een groot deel van deze archieven automatisch getranscribeerd met behulp van Transkribus. De teksten die dit heeft opgeleverd zijn vanaf nu beschikbaar op Zenodo.org. De set transcripties van archieven van "De West' is de vijfde in een reeks van grote transcribeeracti...

  • Kritisch onderzoek van bronnen heeft altijd de basis gevormd van de geschiedwetenschappen. Maar nu we schijnbaar onbeperkte toegang hebben tot retro-gedigitaliseerd materiaal en born-digital data, moeten we leren hoe we digitale bronnen kritisch kunnen beoordelen, net zoals we altijd hebben gedaan met "analoog" materiaal. Historici van de 21ste eeuw moeten zich namelijk bewust zijn van de specifieke aard van de digitale bronnen die ze in hun onderzoek gebruiken. Om met deze veranderingen o...

  • Via het projectteam van Chronicling Novelty kwam onderstaand bericht binnen. Bekijk ook het mooie filmpje! Twee jaar geleden is het project Chronicling Novelty van start gegaan – het ontsluiten van ruim driehonderd kronieken uit de periode 1500-1850. Als eerste stap bezochten we tientallen archieven en fotografeerden daar vele duizenden pagina’s aan kronieken. Vervolgens plaatsten we deze foto’s op VeleHanden, waar velen elke dag bezig zijn om pagina na pagina te transcriberen, of door de co...

  • In het project ‘Tag de tekst’ gaan het Nationaal Archief, het Stadsarchief Amsterdam, en het Noord-Hollands Archief op crowdsourcingsplatform VeleHanden duizenden Nederlandstalige teksten uit de 17e eeuw tot en met de 19e eeuw' taggen' (annoteren). Dat betekent dat in de teksten wordt gezocht naar persoonsnamen, locaties en tijdsaanduidingen en dit geregistreerd (getagd) wordt. Het gaat om notariële teksten uit Amsterdam, Haarlem en uit andere provincies en archieven van de VOC. Deze zijn a...

  • Beste collega, Met deze blog wil ik je ‘bijpraten’ over het project De ijsberg zichtbaar maken. Hierin ontsluiten we 2 miljoen scans van archieven met semi-automatische handschriftherkenning. Selectie en trainingsmodellen Voor het project selecteerden we scans van handschriften van het Nationaal Archief (NA) en van de Regionaal Historische Centra (RHC’s). Bij het NA kozen we voor het archief van de VOC uit de 17e en 18e eeuw. Daarnaast deden tien RHC’s mee met het aanleveren van notariële a...

  • De Innovatie in Archiefonderzoek-prijs is een nieuwe onderzoekswedstrijd van het Nationaal Archief en het Noord-Hollands Archief. De prijs wordt toegekend aan het onderzoek dat op meest overtuigende wijze de meerwaarde aantoont van de beschikbaarheid van grote hoeveelheden transcripties van de archieven van de VOC en Haarlemse notarissen. Inmiddels staat de oproep voor inzendingen open via https://www.nationaalarchief.nl/herschrijf-jij-de-geschiedenis. Helaas zijn medewerkers van het NA en ...

  • Op KIA kun je op verschillende manieren iets delen met de community. Jullie doen dat met zijn allen regelmatig: een goede manier om je collega’s in het land te betrekken bij vraagstukken, oplossingen of evenementen. Je bent vrij om zelf te kiezen hoe je dat doet, maar de verschillende manieren hebben ieder wel voor- en nadelen, met name bij de keuze tussen een Blog of een Update. Lees de blog van collega Harm Pieters in de Helpdesk van KIA: https://kia.pleio.nl/groups/view/52532002/helpdesk/...

  • Vanwege de corona-uitbraak zijn de kantoren van het Nationaal Archief gesloten. Bijna iedereen moet thuis werken, op een aantal medewerkers na. Hun werkzaamheden zijn namelijk aan het gebouw of archief verbonden. Voor hen is een klussenbank opgericht. Een van de klussen is een nieuw herkenningsmodel voor het Transkribus-platform, met als doel een publiek model maken dat geschikt is voor zowel gedrukte als getypte stukken uit de periode rond 1900. Er is geen (publiek) model voor het automati...

  • Historisch bronnenonderzoek is geweldig interessant, maar is intensief en vereist kennis van oude handschriften. Veel historici dromen er dan ook van dat ze met enkele drukken op de knop moeilijk leesbare handschriften kunnen transcriberen en doorzoeken. Inmiddels is het al een tijdje mogelijk om met behulp van speciale programma’s onderzoek doen in gedrukte teksten. Recentelijk heeft ook de zogenaamde Handwritten Text Recognition-techniek (HTR) een flinke sprong vooruit gemaakt. Dat maakt h...

  • Tijdens het werken met Transkribus las ik in een scan van de Openbare Raadsvergadering van de gemeente Heemstede, gehouden op donderdag 24 oktober 1907 over de Afwijking van de bouwverordening voor de woning van K. Hoesbergen. Het woonhuis staat op de hoek van het Schouwtjesplein en de Oranjekade. II Door K. Hoesbergen wordt bij adres van 3 october 1907 afwijking verzocht van artikel 15 der bouw- en woningverordening voor het bouwen van een woonhuis op den hoek Schouwtjesplein en de Oranjek...

  • Vincent Noppe van het Nationaal Archief heeft een OCR-test gedaan op scans van de “Gedrukte registers van de ordinaris resoluties” uit het archief van de Staten-Generaal met behulp van de Abbyy Finereader-module in Transkribus en de Transkribusmodellen “Dutch_Romantype_Print” en “IJsberg & Roman_type_print”. Het doel van deze test is om na te gaan of het OCR-en loont om modellen te trainen die zowel handgeschreven als gedrukte teksten automatisch kan herkennen. Dit laatste is vooral intere...

  • Van 18 tot en 22 januari vond in het Lorentzcentrum van Universiteit Leiden de jaarlijkse "ICT with Industry" plaats (https://ict-research.nl/ict-with-industry/). De Koninklijke Bibliotheek en het Humanities Cluster hielden zich daar onder andere bezig met een meerdaagse Hackathon om te kijken of zij OCR-technieken konden aanpassen ten einde teksten gezet in Fraktur beter konden ontsluiten. Het verslag van deze tour de force is hier te vinden: https://kia.pleio.nl/files/view/55813288/lore...

  • Beste allemaal, Bij deze een korte recapitulatie van de "workshop" van Günter Mühlberger over de juridische en financiële opzet van de READ Coop SCE. READ heeft de contruct van coop gekozen om de volgende redenen (in grote lijnen hetzelfde verhaal als op: https://read.transkribus.eu/coop/): - Het voldoet aan de richtlijnen van de Societas Cooperativa Europaea (SCE, zie: https://ec.europa.eu/growth/sectors/social-economy/cooperatives/european-cooperative-society_en); - Een coop wordt opgezet...

  • In december 2019 rondde het Stadsarchief Amsterdam het crowd sourcing project “Crowd leert computer lezen” af. Om dit te vieren organiseerde het Stadsarchief Amsterdam samen met het Nationaal Archief op woensdag 11 december 2019 een bijeenkomst waarbij een grote groep gebruikers van Transkribus, het programma voor handschriftherkenning, bijeenkwamen om hun ervaringen te delen. Centraal hierbij stonden drie vragen: Wat heb je binnen het project gedaan met Transkribus? Wat ging goed en wat g...

  • “De ijsberg zichtbaar maken”, het gezamenlijke digitaliseringsproject van het Nationaal Archief (NA) en het Noord-Hollands Archief (NHA) begint zijn vruchten af te werpen. Dit project is opgezet om de enorme berg handgeschreven archieven in het NA en NHA met behulp van transcriptiesofware Transkribus om te zetten in leesbare tekst. Dit programma is ontwikkeld als onderdeel van het door de Europese Unie gesubsidieerde project READ (Recognition and Enrichment of Archival Documents). Binnen ...