‘Hie e gin heheuhen hie.’1   

Over vertaaltechnologie die (misschien) voorbijraast

Gys-Walt van Egdom
 

Dit artikel is in december 2023 aan het dossier toegevoegd.

 

Was ik maar geboren

met verstand tussen mijn oren,

want de meeste dingen snap ik niet

En de rest begrijp ik niks van.

‘Was ik maar geboren’, De huilende rappers

 

Op 30 november 2023 vierde ChatGPT zijn eerste verjaardag. Wie de media heeft gevolgd, zal gemerkt hebben dat het programma veel stof heeft doen opwaaien. Ik bespaar u mijn aanzetje tot een tech-eindejaarsconference. In deze bijdrage wil ik graag kort ingaan op een ‘hulpmiddel’ dat door recente ontwikkelingen flink ter discussie staat: het geheugen.

In tijden van prothetiek is het natuurlijk verleidelijk om in te gaan op het menselijke geheugen en de wijze waarop wij dat geheugen sinds mensenheugenis proberen uit te breiden met technologische hulpmiddelen. Geloof me vrij: voor mij zijn er weinig grotere geneugten in het leven dan grasduinen door postmoderne teksten, op zoek naar diepgravende reflecties op de dynamiek tussen ons geheugen en de mnemotechnische middelen die wij mensen hebben ontwikkeld.2 Toch ontbreekt de tijd en de ruimte om hierop in te gaan.

Ik vrees dat de aandacht in dit stukje beperkt blijft tot het vertaalgeheugen. In een themanummer van Filter over literair vertalen en technologie (2021) omschrijft Joke Daems vertaalgeheugens als volgt: 

[Een] databank die bestaat uit eerder gemaakte vertalingen […]. Een vertaalgeheugen kan gebruikt worden als naslagwerk (concordantie): door te zoeken naar woorden of fragmenten in het vertaalgeheugen kan een vertaler een lijst te zien krijgen van eerder vertaalde zinnen uit het geheugen waar de gezochte woorden of fragmenten in voorkomen [maar] kan ook geïntegreerd worden in een vertaalgeheugensysteem, een werkomgeving waarin de vertaler allerlei extra ondersteuning aangeboden krijgt. Tijdens het vertalen gaat het vertaalgeheugensysteem [dan] automatisch op zoek in het vertaalgeheugen.

Uit de resultaten van de enquête die Daems onder literair vertalers heeft uitgezet, blijkt dat vertalers niet altijd even vertrouwd zijn met de technologische hulpmiddelen die voor (ver)taalprofessionals zijn ontwikkeld. De meeste respondenten geven dan ook aan weinig gebruik te maken van deze technologieën. Toch is er sprake van enige vertrouwdheid met vertaalgeheugens en terminologielijsten. Dat mag geen verrassing heten: deze twee hulpmiddelen waren al geïntegreerd in de logge CAT-tools die tijdens de jaren 1990 populair zijn geworden. Het mag echter evenmin een verrassing heten dat geheugens en terminologielijsten beperkt in gebruik zijn genomen door literair vertalers – Daems meldt dat een derde van de literair vertalers gebruikmaakt van geheugens. Waar zakelijk vertalers in groten getale (maar niet zelden nolens volens) met de tools aan de slag gingen, daar lieten literair vertalers ze lange tijd links liggen. Hoe komt dit? Zoals elk geheugen heeft een vertaalgeheugen baat bij herhaling. En laat literaire teksten nu toevallig teksten zijn die, statistisch gezien, weinig herhaling bevatten (zie Youdale 2019, p. 15).

Toch zien we dat er de laatste jaren een lans is gebroken voor vertaalgeheugens in het literaire veld. In het Nederlandse taalgebied gingen Chris Bakker en Pauline de Bok de boer op met het concept ‘collectief vertaalgeheugen’ (2021). In het themanummer waar ik eerder aan refereerde, merken zij op dat de term ‘collectief vertaalgeheugen’ treffend is, omdat ‘het gaat om wat de vertalersgemeenschap gezamenlijk tot stand heeft gebracht en [daarom] een wezenlijk onderdeel vormt van het collectieve geheugen van deze gemeenschap’. In hun pleidooi voor een ‘tweede leven voor vertalingen’ lichten ze toe welke voordelen een collectief (literair) vertaalgeheugen kan hebben. In een vertaalgeheugen kan je:

  • Stilistisch kenmerkend woordgebruik met behulp van ‘keyword lists’ en ‘concordantiefuncties’ onderzoeken en zodoende bewuster vertalen;
  • Nieuwmunterijen (hapax legomena) met behulp van ‘frequentielijsten’ analyseren en doelgericht vertalen;
  • Een vergelijking treffen tussen oplossingen uit eerdere vertalingen met als doel inspiratie op te doen;
  • Oplossingen uit het verleden (deels) hergebruiken met als doel lof te betuigen aan collega-vertalers;
  • De algehele consistentie van de vertaling bevorderen;
  • Een monologue intérieur met collega-vertalers voeden.

Ook internationaal is er de laatste tijd op de grote trom geslagen voor vertaalgeheugens. Zo heeft Andrew Rothwell (2022, 2024) vooral gekeken naar de meerwaarde van vertaalgeheugens bij hervertaling.

Vooral in die context van hervertaling zijn we echter geneigd om vraagtekens bij het gebruik van die geheugens te plaatsen. In de eerste plaats is het heel moeilijk om een databank samen te stellen die rijk en tegelijkertijd specifiek genoeg is om de vertaler te dienen. Waar veel tekstsoorten in enige mate gestandaardiseerd zijn, daar kent elke literaire stroming, elk genre en zelfs elke auteur onderscheidende kenmerken. Als tekstmateriaal zich al laat digitaliseren, dan is er een goede kans dat het materiaal vrij schamel is en niet direct een grote meerwaarde heeft. Daarnaast laten de gebruikscontexten waarin de geheugens zijn gehanteerd voorzichtig doorschemeren dat geheugens plagiaat misschien wel in de hand werken. Dit is ook een argument dat door een respondent uit het onderzoek van Daems wordt aangedragen: ‘Dit soort systemen kan misschien in de handen van een echt goede vertaler een opstap zijn naar een persoonlijke vertaling, maar ik ben bang dat men niet loskomt van de aangereikte oplossingen. Daar kan in het beste geval een vlakke tekst uit voortkomen en in het slechtste geval plagiaat.’ Tijdens een VLV-workshop rond vertaaltechnologie merkte Chris Bakker op dat dit argument weinig steekhoudt: hij maakt vooral gebruik van het geheugen als hij vast komt te zitten en stelt dan vast dat ook collega-vertalers vaak op dat punt vastzitten (waardoor de aangereikte oplossingen vaak verre van ideaal zijn) (Van Egdom 2023). Allemaal goed en wel, maar Chris Bakker is een ervaren vertaler; het is maar de vraag of minder ervaren vertalers hetzelfde zouden vaststellen.

Maar goed, de voornaamste reden waarom vertaalgeheugens niet altijd even warm worden onthaald, is omdat er auteursrechten rusten op de teksten die in een geheugen worden verwerkt. Om die reden zal er van het (al dan niet collectieve) vertaalgeheugen wellicht niet veel meer overblijven dan de vage herinnering aan wat eigenzinnige experimentjes.

Toch kent dit stukje nog een verrassende wending. Kunt u zich dat vernuftige ChatGPT uit de inleiding nog heugen? Hoewel vertaalgeheugens in de zakelijke wereld al decennia gemeengoed zijn, is er de laatste tijd veel te doen rond deze traditionele toepassing. Eigenlijk tart ChatGPT alle wetten van de taaltechnologie. De laatste jaren luidde de gouden regel binnen de taaltechnologie: hoe specifieker de toepassing, des te bevredigender het resultaat.3 Large Language Models, zoals het model GPT-3.5 en GPT-4 (dat bij ChatGPT op de achtergrond ronkt), blijken hun kracht juist te ontlenen aan de schier oneindige toepassingsmogelijkheden. LLMs vatten samen, schrijven, vertalen, coderen, produceren plaatjes etc. Daar is weinig specifieks aan. Door deze ongeziene ontwikkelingen rijst de laatste maanden in de zakelijke vertaalwereld de vraag: is er een toekomst voor iets ultraspecifieks als een vertaalgeheugen? 

Het antwoord op die vraag durf ik nu niet te formuleren.4 Ik ben wel benieuwd naar het antwoord. Zodra we dat immers kennen, weten we wellicht ook of het nog de moeite waard is om onderzoek te doen naar vertaalgeheugens in een literaire context. Misschien begeef ik me met deze uitspraak op glas ijs, maar… wellicht blijken LLMs veel beter in staat om alle problemen van literair vertalers op te lossen. Eén belangrijk obstakel lijken de LLMs al uit de weg te hebben geruimd: waar onderzoekers hun stinkende best moeten doen om auteursrechtelijke kwesties op te lossen voor ze een tool de wereld in smijten, daar lijkt Big Tech zich weinig van rechten aan te trekken.

 

 

Referenties

Bakker, C. & P. de Bok (2021). Een tweede leven voor vertalingen. Over de ontwikkeling en het gebruik van literaire vertaalgeheugens. Webfilter [Dossier: Literaire vertaling en technologie].

Daems, J. (2021). Wat vinden literair vertalers echt van technologie. Webfilter [Dossier: Literaire vertaling en technologie].

Derrida, J. (1967a). De la grammatologie. Parijs: Minuit.

Derrida, J. (1967b). L'écriture et la différence. Parijs : Seuil.

Derrida, J. (1972). La dissémination. Parijs : Seuil.

Edwards, A. (2023). Large Language Models May Not Kill Translation Memories. Slator.

Rothwell, A. (2020). Retranslating Zola in Stereo with CAT Tools [lezing]. La traduction littéraire et SHS à la rencontre des technologies de la traduction : enjeux, pratiques et perspectives. Toulouse.

Rothwell, A. (2024). Retranslating Proust using CAT, MT and Other Tools. In A. Rothwell, A. Way & R. Youdale (red.), Computer-Assisted Literary Translation (pp. 106-125). Londen: Routledge.

Toral, A., Van Cranenburgh, A. & T. Nutters (2024). Literary-Adapted Machine Translation in a Well-Resourced Language Pair: Explorations with More Data and Wider Contexts. In A. Rothwell, A. Way & R. Youdale (red.), Computer-Assisted Literary Translation (pp. 27-52). Londen: Routledge.

Van Egdom, G.W. (2021). Prothetiek van de vertaling. Webfilter.

Van Egdom, G.W. (2023). Vertaaltechnologie [ Workshop]. Verenigde Literair Vertalers. Amsterdam/online.

Van Egdom, G.W., Kosters, O. & C. Declercq (te verschijnen). The Riddle of (Literary) Machine Translation Quality: Assessing Automated Quality Evaluation Metrics in a Literary Context. Revista Tradumàtica, 21.

Youdale, R. (2019). Using Computers in Literary Translation. Londen: Routledge.

 

 

Noten

1 Deze zin wordt vaak gebruikt om de eigenaardigheden van het West-Vlaams, met name van de uitspraak van de ‘g’ te onderstrepen. Letterlijk staat er: je hebt geen geheugen. Vrij vertaald: jij kan ook niets onthouden.
2 De geïnteresseerde lezer kan ik Jacques Derrida’s De la grammatologie (1967a), L'écriture et la différence (1967b) en La dissémination (1972) warm aanbevelen.
3 Binnen het onderzoek naar technologische toepassingen op het gebied van literaire vertaling wordt specificiteit bijvoorbeeld beoogd in experimenten met ‘literary-adapted’ machinevertaling. De vertaalmachine wordt in dit geval gevoed met literaire data in de hoop dat de output van hogere literaire kwaliteit is (zie Toral et al. 2024, Van Egdom et al., te verschijnen).
4
Het antwoord is vermoedelijk ‘ja (maar)’. Met zogenaamde AI-enhanced MT-toepassingen weten softwareontwikkelaars AI in te zetten om ‘fuzzy matches’ volautomatisch om te buigen tot doelgerichte oplossingen.