Onwetende webgebruikers helpen oude teksten te ontcijferen

  • aug 2008
  • Verwijderde gebruiker
  • ·
  • Aangepast 27 jun
  • 6
  • 79
Verwijderde gebruiker
KIA Community
  • Christian van der Ven

Zo'n subkop trekt meteen mijn aandacht. Als liefhebber van web 2.0 toepassingen én archivaris wil ik weten hoe ik zoiets kan organiseren!Een geweldig idee. De duizenden website waar je alleen een reactie of aanmelding kunt afronden door een zgn. CAPTCHA-raadsel op te lossen. Je weet wel, die vervormde letters die een al dan niet bestaand woord vormen en die je foutloos moet lezen en intypen.Slim combineren van CAPTCHA-teksten met moeilijk te lezen bestaande woorden uit gedigitaliseerde teksten et voilá! Zie daar een enorm potentieel van mensen die zonder dat ze het weten, helemaal voor niets, onleesbare woorden omzetten in leesbare tekst... Briljant.Ik citeer: In het eerste jaar heeft het systeem al 440 miljoen woorden laten kraken. Het equivalent van 17.600 normale boeken.Bron: http://noorderlicht.vpro.nl/artikelen/39886119/

Reacties

6 reacties, meest recent: 22 augustus 2008
  • ... niet kunnen vertalen. Ook altijd leuk voor vertalingen zijn spelletjes. Een eenvoudig voorbeeld hiervan hebben de NAtional Archives met The ducking stool game

    Wat een waanzinnig plan. Ik denk wel dat je ook weer niet al te oude teksten hiervoor kan gebruiken. Ik voorzie toch een aantal gebruikers die hun email account niet weten aan te maken een reactie niet weten te plaatsen omdat zij bijvoorbeeld:

    Verwijderde gebruiker
  • Ja... Van de andere kant moet je de bezoeker niet onderschatten. Ze kunnen in massa meer dan wij vaak denken. Bovendien lieten ze bij deze CAPTCHA's twee blokken tekst zien, waarvan er natuurlijk maar eentje beslissend was. Als je dan dezelfde tekst meerdere malen aan groepen mensen laat zien, dan krijg je uiteindelijk toch een behoorlijk resultaat. Overigens ging het in het bericht over gescande gedrukte bronnen... Daar heeft de OCR-software al problemen genoeg mee!

    Verwijderde gebruiker
  • @Tim: Midtsgaders is nog wel gelukt, maar die arme vrouw is verdronken. @Luud: ik gok op iets dat op Lodewijk lijkt Paleografie was duidelijk niet mijn sterkste vak op de archiefschool.

    Verwijderde gebruiker
  • @Ingmar: ik laat eerst de anderen nog wat raden voor ik de oplossing weggeef! @Tim: mijn "vrouw" zonk ook. Het zal wel een heks zijn geweest! :-)

    Verwijderde gebruiker
  • @Tim en Luud: Ik heb dezelfde lessen als Ingmar gevolgd.. haha! Die vrouw was trouwens duidelijk een heks.. want zó slecht is mijn palio.. paleochr.. paleografisg.. paleografische kennis nou ook weer niet hè! ;-) Ik vind dit mooie software hoor. Inderdaad voor hele oude teksten in combinatie met het benaderen van je e-mailaccount niet echt handig.. maar de gedrukte teksten kan iedereen lezen.. als mens dan. En zoals Luud al zegt, is dat voor OCR-software al een hele kluif. Als ik die getallen hoor, van wat ze al bereikt hebben, word ik al gelukkig. Ik moet ook meteen aan iets als SETI@home denken. Alle kleine beetjes helpen! Mooi voorbeeld voor een studiedag trouwens!

    Christian van der Ven
  • Zo, nu ik die site wat beter heb bekeken, weet ik dat ik al herhaaldelijk onwetend heb geholpen.. haha! Ik zie nogal eens een captcha voorbijkomen.. en herkende onmiddellijk de vormgeving van deze. Het moet, als ik dat zo lees, ook tamelijk eenvoudig zijn om reCAPTCHA te gebruiken voor je eigen site, dus ik zal dat ook eens voorleggen bij ons op het BHIC, als we daar over een tijdje ook gebruik van gaan maken. Erg mooi!! En het schijnt nog veiliger te zijn dan de 'normale' captcha's ook.

    Christian van der Ven

Trefwoorden