Bloed, zweet, tranen en... CAT?   24-01-2021

Lisa Horenberg
 

Er wordt wel eens gezegd dat een literaire vertaling de vertaler bloed, zweet en tranen heeft gekost. Een charmant gezegde om een grote inspanning te beschrijven. Er mag echter niet vergeten worden dat aan die ene inspanning vaak jarenlange opleiding en ervaring is voorafgegaan, en dat een vertaler vaak diepgravend onderzoek heeft gedaan om de brontekst te doorgronden en de vertaling daar zo goed mogelijk op aan te laten sluiten.  

Een vertaler moet dan ook een groot analytisch vermogen en een behoorlijke dosis doorzettingskracht bezitten, en raadpleegt tijdens het vertalen een scala aan naslagwerken en hulpmiddelen, waaronder (al dan niet digitale) woordenboeken, een computer met een tekstverwerkingsprogramma, en – niet te vergeten – het wereldwijde web (e.g. Pym 2011: 4). Bovendien bestaat er tegenwoordig een arsenaal aan specialistische software die vertalers kan ondersteunen. Opvallend genoeg wordt die vertaalsoftware met name in de literaire vertaalwereld relatief maar weinig ingezet, hoewel Computer-Assisted Translation (CAT) tools niet meer uit het niet-literaire vertaalveld weg te denken zijn. 

Met dank aan mijn werkervaring in die niet-literaire vertaalwereld heb ik veel verschillende vertaaltools leren kennen en heb ik de voor- en nadelen van het gebruik ervan ervaren. Naar aanleiding hiervan heb ik mij verdiept in het gebruik van vertaaltechnologie in literaire context. In het kader van mijn masterscriptie (Horenberg 2019) heb ik uiteindelijk onderzoek gedaan naar de toepassing van drie verschillende tools in het literaire vertaalproces. 

Een van mijn opvallendste bevindingen is de inzichtelijke manier waarop één van die tools bij het uitvoeren van een brontekstanalyse informatie over de betreffende brontekst weergeeft. Het gaat om Voyant Tools – kinderlijk eenvoudig te gebruiken en ook nog eens gratis toegankelijk. In dit artikel bespreek ik de achtergrond van mijn onderzoek naar Voyant Tools, de literaire toepassing van het programma en de voordelen die hieruit voortkomen. 

CAT vs. MT
De vertaalmachine is waarschijnlijk de meest algemeen bekende soort vertaaltechnologie, vermoedelijk vanwege de brede inzetbaarheid van openbare en, niet onbelangrijk, grotendeels gratis toegankelijke vertaalmachines zoals Google of DeepL. Binnen de vertaalwetenschap wordt naar machinevertaling (Machine Translation; MT) verreweg het meeste onderzoek gedaan en volgen ontwikkelingen elkaar snel op. In 2015 betoogden Antonio Toral en Andy Way bijvoorbeeld nog dat onderzoek naar zogenoemde Statistical Machine Translation (SMT) ook binnen het literaire vertaalveld relevant is (241). Inmiddels is SMT alweer uit de tijd en is Neural Machine Translation (NMT) de nieuwe norm. 

Of verregaande automatisering met behulp van NMT voor het literair vertalen een positieve of gewenste ontwikkeling is, wil ik hier niet zozeer ter discussie stellen. Wel is het relevant om, zonder een waardeoordeel te vellen over MT, kritisch te kijken naar wat er onder verschillende soorten vertaaltechnologie wordt verstaan. CAT wordt namelijk vaak gebruikt als overkoepelende term voor alle soorten vertaalgerelateerde technologie, inclusief MT, maar gezien de opmars van NMT is het tijd om deze categorisering te herzien.

De generalisatie van CAT is om twee redenen problematisch. Allereerst valt in bepaalde situaties wanneer MT wordt ingezet het ondersteunende (‘assisted’) aspect van CAT weg, waardoor vertaalmachines niet langer onder CAT kunnen worden geschaard; met MT worden steeds vaker vertalingen geproduceerd die functioneel zijn of goed genoeg worden bevonden voor de doelpublicatie, waardoor vertaalmachines zuiver genomen als een afzonderlijke categorie binnen vertaaltechnologie zouden moeten worden gezien. Ten tweede bestaan er nieuwe technologieën die op het vertaalproces kunnen worden toegepast, maar die vanwege de oververtegenwoordiging van vertaalmachines binnen de vertaalwetenschap relatief weinig aan bod komen. Deze nieuwe technologieën kunnen daadwerkelijk ondersteuning bieden tijdens het vertaalproces zonder het volledig te automatiseren.

Door CAT en MT als twee verschillende categorieën binnen vertaaltechnologie te beschouwen, ontstaat er ruimte om andere technologieën dan MT te onderzoeken en die als ‘CAT-tools’ in te zetten, naast traditionele CAT-tools die veelal op basis van segmentatie en vertaalgeheugens werken. Zo past Roy Youdale met behulp van diverse tools close and distant reading toe op literaire werken om op die manier de stijl van zowel de brontekst als de vertaling te analyseren en op basis daarvan de vertaling te evalueren (2019). Deze vernieuwende toepassingen van vertaaltools zijn een bron van inspiratie geweest voor mijn eigen onderzoek. 

Een aspect om rekening mee te houden bij het implementeren van CAT in het literair vertalen is de vaak negatieve sfeer rondom het onderwerp technologie en literair vertalen (zie de bijdrage van Daems in dit dossier). Dat vertaalmachines worden gezien als een bedreiging voor het vak, is logisch: hoe beter de machine, hoe minder werk voor (en/of: hoe minder leuk het werk van) de vertaler. Een belangrijke kanttekening hierbij is het feit dat de inzet van vertaalmachines erg invasief kan zijn. Des te meer reden om technologieën te introduceren die minder bedreigend of ingrijpend zijn en die literair vertalers toch kunnen ondersteunen bij hun werkzaamheden.

Casusonderzoek
Geïnspireerd door het werk van Youdale in het bijzonder heb ik aan de hand van een casus drie CAT-tools bestudeerd. De casus, die ook in dit artikel ter illustratie wordt gebruikt, is het korte verhaal ‘Mr Loveday’s Little Outing’ van Evelyn Waugh (1903-1966) uit 1936.

Ik heb Waughs tekst eerst zonder vertaaltechnische ondersteuning geanalyseerd en vertaald. Dit wil zeggen: met een brontekst zowel geprint als digitaal beschikbaar, MS Word als tekstverwerkingsprogramma en (online) woordenboeken en naslagwerken bij de hand. Vervolgens heb ik diezelfde brontekst digitaal geanalyseerd met behulp van Voyant Tools en Sketch Engine. Hoewel ik zelf op dit punt van het onderzoek natuurlijk al bekend was met de tekst, heb ik mij hier zo weinig mogelijk door laten beïnvloeden; ik heb mij laten leiden door de resultaten die beide tools verzamelden, op basis waarvan ik twee afzonderlijke analyses heb opgesteld. Vervolgens heb ik de tekst hervertaald met behulp van een bestaande vertaling1 in een vertaalgeheugen in de traditionele CAT-tool SDL Trados Studio. Om de processen zo objectief mogelijk te kunnen vergelijken zaten er een aantal weken tussen het opstellen van mijn eerste en tweede vertaling. 

Voyant Tools
Zoals reeds aangegeven, is met name Voyant Tools erg nuttig gebleken. Voyant Tools is een online2 gratis toegankelijk programma waarin een corpus bestaande uit een of meerdere documenten kan worden geanalyseerd. De analyse bevat vooral kwantitatieve informatie over lexicale elementen, zoals herhaalde woorden en woordcombinaties. Op basis van die informatie worden automatisch in verschillende visuele weergaven (‘views’) diagrammen, tabellen en andere figuren opgesteld, met behulp waarvan de gebruiker eventuele patronen in het corpus snel kan herkennen.

Gebruikers kunnen zelf een of meerdere teksten uploaden om een corpus te creëren, of een van de twee standaardcorpora kiezen die het programma aanbiedt: de toneelstukken van Shakespeare en de romans van Austen. Op basis van het geselecteerde corpus wordt in Voyant Tools een standaardoverzicht met vijf frames getoond (zie afbeelding 1). In elk frame kunnen verschillende views worden geselecteerd die ieder op een eigen manier informatie over de woorden en woordcombinaties in de tekst weergeven. De views in dit standaardoverzicht staan met elkaar in verband; wanneer in de ene view een woord wordt geselecteerd, worden ook in andere views resultaten met betrekking tot dat woord getoond. Hieronder worden enkele views uitgelicht. 

 

Afbeelding 1. Standaardoverzicht Voyant Tools

Op basis van de frequenties van individuele woorden bevat het standaardoverzicht onder andere de views ‘Cirrus’, ‘Terms’ en ‘Phrases’. De eerste twee geven beide inzicht in de veelvoorkomende woorden uit het corpus. ‘Terms’ is een simpele tabel, ‘Cirrus’ een kleurrijke woordwolk waarin de woorden die het vaakst voorkomen in verschillende groottes worden getoond. Hierbij geldt: hoe groter de frequentie, hoe groter het woord. Zo ziet de gebruiker in één oogopslag welke woorden kwantitatief gezien de kern van het totale corpus vormen. ‘Terms’ vormt een prettige aanvulling waarmee absolute frequenties kunnen worden vergeleken. De tabel ‘Phrases’, tot slot, geeft een overzicht van alle woordcombinaties (collocaties, bestaande uit twee of meer woorden) die in het corpus minimaal twee keer voorkomen.

Een andere view die bijzonder nuttig kan zijn bij het analyseren van de woordfrequenties is ‘Trends’. ‘Trends’ bevat een diagram waarin standaard de vijf meest frequente woorden worden weergegeven, op zo’n manier dat de gebruiker eenvoudig inzicht krijgt in de distributie van deze woorden in de tekst. De tekst wordt hierbij opgedeeld in tien even grote segmenten (weergegeven op de x-as, met de relatieve frequentie op de y-as). Eventuele patronen kunnen zo gemakkelijk herkend worden.

Verder zijn er nog enkele views die meer algemene informatie over het corpus geven of ter ondersteuning van andere views nuttig zijn. Zo geeft ‘Summary’ algemene informatie over het corpus weer, waaronder het aantal documenten, het totale aantal woorden en het aantal unieke woorden en de gemiddelde zinslengte. In ‘Reader’ worden de volledige tekst(en) uit het corpus getoond en wordt bovendien weergegeven wáár een bepaalde selectie woorden of woordcombinaties voorkomt. Verder kan in ‘Contexts’ de precieze context van een geselecteerd woord of een woordcombinatie bekeken en vergeleken worden; ‘Context’ geeft in een tabel de tekstdelen weer die aan de geselecteerde woorden voorafgaan en erop volgen.

Naast bovengenoemde views bevat het standaardoverzicht andere views en zijn er nog veel meer visualisaties aan het overzicht toe te voegen of in een ander scherm te gebruiken. Deze extra opties zijn echter ietwat verborgen in het algemene menu. Vergeleken met de zojuist geïntroduceerde views zijn ze minder eenvoudig te gebruiken en te analyseren. Omwille van de omvang van dit artikel zullen deze overige views hier verder buiten beschouwing worden gelaten.

Voor ik overga tot de resultaten van mijn onderzoek is het belangrijk om twee andere details toe te lichten. Ten eerste worden in Voyant Tools alle woorden in zekere mate gestandaardiseerd doordat kapitalen in het corpus worden genegeerd. Daarnaast wordt een zogenoemde ‘stoplist’ gebruikt. Dit is een lijst met woorden die worden uitgesloten van de resultaten. Deze lijst is per taal verschillend en kan bewerkt of volledig gedeactiveerd worden. Bij Engelstalige teksten wordt bijvoorbeeld standaard een selectie functiewoorden buiten beschouwing gelaten. Het kan soms nuttig zijn om de stoplist te deactiveren, omdat de aan- of afwezigheid van bepaalde functiewoorden juist een bepaalde stijl kan karakteriseren.

Literaire toepassing Voyant Tools
De indeling van het standaardoverzicht en de kleurrijke, interactieve diagrammen in de verschillende views nodigen de vertaler uit om bepaalde informatie te selecteren en op die manier specifieke resultaten te bestuderen. Hierdoor is Voyant Tools erg intuïtief in gebruik. Het feit dat de tool zelf geen complexe geautomatiseerde analyses uitvoert, is in het kader van literair vertalen een van de grote voordelen van Voyant Tools: het programma fungeert overduidelijk enkel en alleen als tool om de gebruiker in staat te stellen bepaalde conclusies te trekken. 

Uit het casusonderzoek zijn verrassend snel nuttige resultaten voortgekomen. Een van de voornaamste is het feit dat de plotwending in het verhaal duidelijk zichtbaar is in Voyant Tools’ ‘Trends’-view. Die plotwending vindt plaats tegen het eind van de tekst, wanneer blijkt dat de op het eerste gezicht betrouwbare bijfiguur Mr Loveday voor de tweede keer een misdrijf heeft gepleegd. De focus van het verhaal verschuift vlak voor deze plottwist van Angela, die heeft gepleit voor Lovedays vrijlating uit de inrichting waarin hij na zijn eerste misdrijf was opgenomen, naar Loveday. Door de frequentie van de namen van personages in even grote tekstdelen te analyseren (wat Voyant Tools voor dit corpus automatisch doet, maar ook handmatig zou kunnen worden gedaan), is met behulp van ‘Trends’ te zien dat ‘loveday’ aan het eind van de tekst vaker voorkomt dan ‘angela’ en ‘moping’ (zie afbeelding 2). Hiermee worden de verhoudingen tussen de frequenties van deze namen in het begin en het midden van de tekst gecontrasteerd en is de verschuiving duidelijk zichtbaar. Met deze informatie kan de vertaler tijdens het verdere vertaalproces naar eigen inzicht rekening houden.

 

Afbeelding 2. Trends (‘angela’, ‘loveday’, ‘moping’)

Hoewel zo’n verschuiving niet per definitie een plotwending aan hoeft te duiden, kunnen dergelijke uitkomsten vertalers wel bewust maken van stilistische elementen in de tekst. Op een vergelijkbare manier kan de vertaler ook bepaalde patronen ontdekken die relevant kunnen zijn voor het vertaalproces. In het geval van het casusonderzoek verwijst één van die patronen bijvoorbeeld naar een thema. Op basis van de meest frequente individuele woorden valt op dat met name ‘time’ en ‘day’, maar ook ‘little’ vaak voorkomen. Uit nader onderzoek blijkt dat de herhaling van ‘little’ een stilistisch kenmerk is dat in verschillende contexten wordt toegepast, terwijl de tijdsaanduidingen ‘time’ en ‘day’ telkens verwijzen naar de rol van tijd en het verstrijken hiervan, wat in dit verhaal een belangrijk thema is.

Net als deze frequente individuele woorden, kunnen ook herhaalde woordcombinaties kenmerkend zijn voor de tekst. De langste herhaalde woordcombinaties die in deze casus voorkomen bevatten vier woorden en komen twee keer voor. Er zijn ook woordcombinaties die uit minder woorden bestaan, maar die vaker voorkomen. Door frequent voorkomende woorden of woordcombinaties te selecteren wordt in verschillende views zichtbaar hoe de verschillende deze woordcombinaties zijn verdeeld over de tekst. In deze casus blijkt dat met name de langere gelijke woordcombinaties elkaar relatief snel opvolgen. Kortere woordcombinaties of individuele woorden die relatief veel herhaald worden, worden op uiteenlopende plaatsen in de tekst gebruikt.

In dit geval is gebleken dat herhalingen, met name bovengenoemde individuele woorden en een aantal terugkerende uitspraken van Loveday, waar mogelijk in de vertaling behouden dienen te worden en dus zo consistent mogelijk moeten worden vertaald. Die herhalingen kunnen namelijk worden gezien als voorbodes van de plotwending: Loveday herhaalt zichzelf door een misdrijf te plegen dat vergelijkbaar is met dat waarvoor hij in een inrichting zit. Hoewel in deze casus de herhalingen ook zonder digitale brontekstanalyse eenvoudig te herkennen en behouden zijn, doordat ze elkaar snel opvolgen, kan het vooral wanneer herhalingen verspreid zijn over de tekst erg nuttig zijn om die vroeg in het vertaalproces te herkennen.

Een ander stilistisch aspect dat uit de analyse naar voren is gekomen, is de manier waarop dialogen de ontwikkeling van Loveday in het verhaal spiegelen. Dit aspect komt voort uit nader onderzoek naar de distributie en context van de frequente termen ‘you’, ‘i’ en ‘said’. De plekken waar ‘said’ veel voorkomt, wijzen in dit geval de dialogen aan, die goed te herkennen zijn in de views die de distributie van de term in de tekst weergeven. Door de gegevens van ‘said’ naast die van ‘i’ en ‘you’ te leggen en een overzicht te genereren van de context van die woorden, wordt duidelijk dat Loveday in het begin van de tekst nauwelijks over zichzelf praat, wat later in de tekst meer en meer het geval is. Zijn aanwezigheid groeit naarmate het verhaal vordert, wat ook te zien is in de distributie van zijn naam, zoals besproken in het kader van de plotwending. 

Eventuele onregelmatigheden en/of patronen (zoals Lovedays herhalingen, de verwijzingen naar tijd of de plotwending) tijdig herkennen kan erg nuttig zijn wanneer teksten bijvoorbeeld onder grote tijdsdruk worden vertaald. Hoewel een vertaler natuurlijk idealiter de volledige tekst leest alvorens aan het vertalen te slaan, kan een digitale tekstanalyse uitkomst bieden wanneer dit om wat voor reden dan ook niet mogelijk is. Ook wanneer de vertaler de tekst wel in zijn volledigheid kan bestuderen en analyseren, kan een digitale tekstanalyse de vertaler ondersteunen en een meer objectieve blik op de tekst afdwingen. Zo kunnen bevindingen van de vertaler worden bevestigd en worden mogelijk nieuwe tekstuele kenmerken ontdekt. Uiteraard blijft het aan de vertaler om te bepalen of, en zo ja welk effect de resultaten van de digitale analyse op het vertaalproces en/of de vertaling hebben. 

De analyse die Voyant Tools primair op lexicaal niveau uitvoert vormt de basis voor al deze bevindingen. Hoewel voor een grondige (bron)tekstanalyse natuurlijk veel meer aspecten van de tekst meegewogen moeten worden, bieden de data die in Voyant Tools worden verzameld verrassende handvatten om een grondigere analyse uit te voeren; in het geval van deze casus is gebleken dat de resultaten in Voyant Tools telkens slechts een topje van de ijsberg laten zien en daarmee de vertaler in gelegenheid stellen om met een bepaald perspectief gedetailleerder naar een specifiek thema, patroon of andere tekstuele eigenschap te kijken. 

Hoewel dit perspectief natuurlijk niet nieuw of verrassend hoeft te zijn (omdat het goed mogelijk is dat een vertaler bepaalde aspecten van de tekst al in het vizier had), helpt Voyant Tools de vertaler objectiever naar een tekst te kijken. Op basis van de resultaten van Voyant Tools kunnen daardoor nieuwe stilistische aspecten worden geïdentificeerd of bestaande interpretaties van de tekst worden bevestigd.

Conclusie
In al zijn eenvoud is Voyant Tools een verrassend nuttig programma gebleken, zelfs bij het analyseren van een korte tekst zoals in deze casus. Het programma stelt de gebruiker in staat om met een objectieve blik kwantificeerbare stilistische elementen te identificeren, waarvan grotere en complexere corpora er naar verwachting meer bevatten. Hoewel Voyant Tools niet als vertaaltool is bedoeld, kan het vertalers zeker helpen om bewustere keuzes te maken. Het is dan ook de gebruiker die de tool vertaalrelevant maakt door de resultaten te interpreteren en te bepalen hoe die het verdere vertaalproces beïnvloeden.

Ook bij de volgende stappen in het vertaalproces is het mogelijk om Voyant Tools in te zetten, eventueel in combinatie met andere CAT-tools. Het implementeren van technologie in de rest van het proces kan echter vele malen ingrijpender zijn dan de toepassing van Voyant Tools is bij het analyseren van de tekst.

Het grote voordeel van Voyant Tools ten opzichte van andere tools, waarvan sommige complexere analyses kunnen uitvoeren of meer aan persoonlijke voorkeur kunnen worden aangepast, is de manier waarop resultaten gevisualiseerd worden en de minimale investering die de toepassing van het programma vergt. Vergeleken met andere, meer gespecialiseerde tools springt Voyant Tools eruit als het gaat om de presentatie van de resultaten. Door de verschillende grafieken en het feit dat het gros van die grafieken in één overzicht wordt (of kan worden) geanalyseerd, kan op een efficiënte manier worden bepaald welke resultaten relevant zijn voor de gebruiker.

Vooral door deze laagdrempeligheid is Voyant Tools goed geschikt voor literair vertalers, ongeacht ervaring of technische onderlegging. Ook al wordt het vak van literair vertalers vaak gezien als een ambacht waar enkel bloed, zweet en tranen mee gemoeid zijn, ben ik ervan overtuigd dat ook literair vertalers in zekere mate baat kunnen hebben bij CAT-tools.

 

Noten
1 De gebruikte bestaande vertaling is die van R. Meijer, getiteld ‘Het uitje van de heer Loveday’ (Loeb, 1982).

2 https://voyant-tools.org/

 

Bibliografie    
Horenberg, Lisa. 2019. ‘Using CAT in Literary Translation: How Tools May Support Translators in Source-Text Analysis, Translation and Retranslation: A Case Study of “Mr Loveday’s Little Outing”’. Masterscriptie, Universiteit Utrecht.

Youdale, Roy. 2019. Using Computers in the Translation of Literary Style: Challenges and Opportunities. Abingdon and New-York: Routledge.

Pym, Anthony. 2011. ‘What Technology Does to Translating’, Translation & Interpreting 3:1, p. 1-9.

Sinclair, Stéfan and Geoffrey Rockwell, 2016. Voyant Tools. Web. http://voyant-tools.org.

Toral, Antonio and Andy Way. 2015. ‘Machine-Assisted Translation of Literary Text: A Case Study’, Translation Spaces 4:2, p. 240-267. 

Waugh, Evelyn. 1951. ‘Mr Loveday’s Little Outing’, in: Work Suspended and Other Stories. London: Penguin, p. 7-14.

 

 

Lisa Horenberg (1994) studeerde Engelse taal en cultuur en is in de zomer van 2019 afgestudeerd van de master Vertalen (literaire track) aan Universiteit Utrecht. Sinds begin 2018 is zij als client manager werkzaam bij een vertaalbureau, waar zij zich tevens bezighoudt met kwaliteitsmanagement, en de inzet van tools en innovatieve technologieën. De combinatie van een literaire opleiding en niet-literaire praktijkervaring heeft ertoe geleid dat ze voor haar masterscriptie onderzoek deed naar de mogelijke voordelen van Computer-Assisted Translation (CAT) tools voor literair vertalers.

 

Reageren? info@tijdschrift-filter.nl.