Wat betekenen LLM's als ChatGPT voor digitale preservering: blog 1

  • jul 2023
  • NDE Preservation Watch
  • ·
  • Aangepast 28 jun
  • 1
  • 82
NDE Preservation Watch
Preservation Digitaal Erfgoed
  • Lizanne Gille - van der Zweth
  • Kirsten Kouwenhoven
  • Renier van de Giessen
  • Niek Verhoeff
  • Karen Wegereef
  • Annelot Vijn
  • Reem Weda
  • Bob Coret

Samenvatting

In deze serie geven we antwoord op de vraag: Wat kunnen ChatGPT en andere Large Language Models betekenen voor het erfgoedveld en voor digitale preservering? Deze blog is de eerste verkenning.

Auteur: Heleen Wilbrink (Aincient)

Introductie

Dit is de eerste blog in een serie over ChatGPT en andere Large Language Models (LLMs), vanuit het NDE-programma Preservation Watch. In deze serie wordt onderzocht wat de kansen en risico’s zijn voor het erfgoedveld in de breedte en in het bijzonder voor digitale preservering, metadatamodellen en -standaarden. Ook komt aan bod hoe de AI-modellen zelf beschreven en gepreserveerd zouden kunnen worden.

In opdracht van de Preservation Watch mag ik mijn ervaringen en die van anderen delen en mij verder verdiepen in deze onderwerpen. Ik ben Heleen Wilbrink, Egyptologe van origine, en ik werk sinds een aantal jaar vanuit mijn bedrijf Aincient aan het ontsluiten van erfgoed met behulp van Artificial Intelligence (AI). Daarnaast ben ik als programmamanager Digitale Toegankelijkheid en teamcoördinator bij het Het Utrechts Archief bezig om samen met mijn collega’s AI-toepassingen en Linked Open Data (LOD) te implementeren. De opvattingen in deze blogserie geven mijn eigen mening weer.

Wat is het?

ChatGPT is een chatbot van het bedrijf OpenAI en is een gebruikersvriendelijke opvolger van de eerdere GPT modellen. Vijf dagen na de lancering afgelopen november telde ChatGPT al één miljoen gebruikers. Een half jaar verder is het al bijna niet meer weg te denken uit onze maatschappij en gaan de ontwikkelingen razendsnel door.

De "GPT" in ChatGPT staat in het Engels voor “generative pre-trained transformer” (generatieve vooraf getrainde transformator). Dat wil zeggen dat het een kunstmatig neuraal netwerk is, gebaseerd op “transformatorarchitectuur”. Deze architectuur helpt bij het begrijpen van de context van woorden en zinnen. Hierdoor kunnen verbanden gelegd worden tussen de verschillende zinnen in een gesprek en om hiermee een relevante en geloofwaardige reactie te genereren.(1) Het genereert tekst en wordt daarom ook wel “Generative AI” (generatieve AI) genoemd. ChatGPT is getraind op grote hoeveelheden data zoals tekst van websites, internetfora, digitale boeken en ondertiteling van video’s en op interactie met gebruikers.(2)

Er zijn inmiddels ook tal van zowel commerciële als niet- commerciële alternatieven. Deze alternatieven zullen in een volgende blog aan bod komen. In dit artikel ligt de focus op ChatGPT omdat deze chatbot koploper is en veel gebruikt wordt.

Hoe werkt het?

Er zijn meerdere manieren om vragen te stellen of opdrachten te geven. Dat kan in een 1-op-1 chat met ChatGPT door het geven van prompts. Een voorbeeld van een dergelijke prompt in Bing Chat, waarin ChatGPT geïntegreerd is, over Bing Chat is verderop in deze blog te lezen. Het schrijven van de juiste prompts is inmiddels een goed betaald beroep geworden. Wil je meer weten hoe je een goede prompt schrijft, dan kun je bijvoorbeeld de gratis cursus “Prompt Engineering for ChatGPT” volgen bij Coursera.(3)

Het gebruik van ChatGPT is gratis als je de GPT-3.5 versie gebruikt. Wil je gebruik maken van de opvolger GPT-4, dan kan dat via een betaald abonnement ($20 per maand). Ook is het mogelijk om als developer ChatGPT te bevragen middels een API (Application Programming Interface); hier zijn ook kosten aan verbonden.

Er zijn ook opties om via Microsoft gebruik te maken van ChatGPT functionaliteiten. Dit bedrijf heeft miljarden in OpenAI geïnvesteerd en integreert ChatGPT in Microsoft producten zoals Edge, Github en Microsoft 365 apps (bijvoorbeeld Word, Excel, Powerpoint en Teams).



Wat kun je ermee als erfgoedprofessional?

In februari heb ik vanuit Het Utrechts Archief samen met Marjolein Beumer (Bibliotheek UvA/HvA) en Bob Coret (NDE en KB) de themadag “ChatGPT of nie” georganiseerd, inclusief een mini-hackathon.(4) Ruim 45 erfgoedprofessionals deelden ervaringen, prompts, use cases en evalueerden de voordelen en nadelen. Voorbeelden van use cases zijn:

  • Gestructureerde data maken uit ongestructureerde tekst.(5)

  • Modernisatie van historisch Nederlands om deze teksten toegankelijker te maken.

  • Het versimpelen van tal van interne processen.

  • Eenvoudig zoeken door erfgoedwebsites.

Wat zijn de risico’s en nadelen?

Voorbeelden van risico’s en nadelen zijn:

  • Bias in de uitkomsten door bias in de data waarop getraind is.

  • Hallucinaties in de gegeven antwoorden. ChatGPT kan soms zaken verzinnen (hallucineren) en te zelfverzekerd zijn.

  • Geen reproduceerbaarheid omdat ChatGPT steeds verder wordt ontwikkeld.

  • Klimaatimpact doordat er veel energie nodig is voor het trainen van de modellen en het bevragen.

  • Afhankelijkheid van Big Tech, zoals OpenAI en Microsoft en commerciële concurrenten zoals Google en Meta.

  • En meer in het algemeen: het gevaar dat AI zou kunnen vormen voor onze maatschappij.(6)

In de volgende blogs worden verschillende use cases nader besproken, evenals een meer uitgebreide bestudering van de risico’s en nadelen.

Tips om zelf aan de slag te gaan

De belangrijkste tip is: just do it. Mocht je nog geen gratis ChatGPT (OpenAI) account hebben, dan kun je deze hier aanmaken. Belangrijk om te onthouden is dat je geen gevoelige informatie deelt in een commerciële chatbot. Naast ChatGPT kun je ook Bing Chat gebruiken binnen Microsoft Edge voor vragen, opdrachten en het maken van afbeeldingen. In het artikel How to use Bing Chat (and how it's different from ChatGPT) (mei 2023) lees je hoe je dat doet.

Trial and error

De afbeelding aan het begin van deze blog heb ik gemaakt in Bing Chat met Bing Image Creator, die weer gebruikmaakt van DALL-E (OpenAI). Ik was op zoek naar een afbeelding voor deze blog en heb een paar verschillende prompts uitgeprobeerd. Dat was voor mij ook een beetje trial and error. Ik startte met: “Ik wil graag dat je een afbeelding maakt van ChatGPT en preservation van erfgoed”. Vervolgens kreeg ik de foutmelding dat er enkele woorden in deze prompt geblokkeerd werden; voor mij een verrassing. Door “ChatGPT” (dat leek mij de enige optie) in de prompt te vervangen door “Large Language Model” kreeg ik wel resultaten, maar die waren nog niet naar mijn zin. Ik ging door in het Engels met de gedachte dat dan de hele prompt in één taal geschreven was, schakelde over op het meer algemene AI in plaats van Large Language Model en vroeg voor de verandering om een afbeelding van een schilderij. De uiteindelijke prompt werd: “Please create an image of a painting how AI helps to preserve heritage”. De resultaten waren meer in de richting van wat ik zocht. Ik ging verder met: “Can you make it in a historic style?” en was tevreden met dit resultaat.

Heb je vragen, opmerkingen of suggesties voor aandachtsgebieden in de volgende blogs? Ik zie je reactie graag tegemoet onderaan dit artikel.


Voetnoten

  1. “Generative pre-trained transformer”. Wikipedia. Voor het laatst bewerkt op 17 mei 2023.

  2. “Wat is ChatGPT?”. Jarno Duursma. 21 December, 2022.

  3. “Prompt Engineering for ChatGPT”. Coursera. 2023.

  4. De inzichten uit deze dag zijn terug te lezen in het NDE artikel “ChatGPT: nog lang niet perfect, maar wel met potentie voor het erfgoedveld”. 15 Februari, 2023.

  5. Niek Verhoeff van het Stadsarchief Amsterdam deelt in zijn blog “Spelen met ChatGPT” voorbeelden van experimenten die hij tijdens de themadag heeft uitgevoerd.

  6. In maart riepen techprominenten in een open brief op tot een pauze van een half jaar in de ontwikkeling van AI. “Techprominenten pleiten voor tijdelijke rem op 'risicovolle' ontwikkeling AI”. NOS. 29 Maart, 2023.

Leeslijst

De hele serie:

Blog 1: Verkenning

Blog 2: Toegankelijkheid

Blog 3: Data Structureren

Blog 4: Ethische Aspecten

Blog 5: GPT-NL en doorzoekbaarheid

Reacties

één reactie, 6 juli 2023
  • Voor een vervolg blog zou ik ook kijken naar de omgekeerde vraag: Wat kan het erfgoedveld (en dan met name hun bronnen, LOD, ed.) betekenen voor AI en Large Language Models?

    Bob Coret

Trefwoorden