Nog niet zo lang geleden kreeg ik de mogelijkheid een bijzondere opdracht aan te nemen – het maken van een hervertaling van de Zweedse roman Kallocain, geschreven door Karin Boye en uitgebracht in 1940. Deze dystopische toekomstschets, die zich afspeelt in een totalitaire staat waarin zelfs gedachten niet meer privé zijn, is een steengoed staaltje orwelliaans avant la lettre dat in Zweden stevig in de canon verankerd zit, maar in Nederland zo goed als onbekend is. Wacht eens even, hoor ik u denken, het gaat hier toch om een hervertaling? Dan moet er toch een eerdere versie bestaan? Inderdaad, er is een eerdere vertaling verschenen, maar die stamt uit 1949 en is alleen nog antiquarisch verkrijgbaar, onder de mysterieuze titel Mensen onder narcose (mysterieus omdat het begrip narcose welgeteld nul keer voorkomt in de tekst – een waarheidsserum, dat wel). Die vertaling blijkt bij lezing behoorlijk verouderd, is geschreven in stroef, archaïsch Nederlands en getuigt bovendien van het feit dat degelijke Zweeds-Nederlandse woordenboeken van latere makelij zijn. Hervertalen dus – moderniseren die handel! Of niet? Ik pakte de brontekst erbij, zag hoe Boyes Zweeds aan inhoudelijke zeggingskracht alleen maar gewonnen heeft maar stilistisch ook allang niet meer van deze tijd is en vroeg me af: wat ga ik hier eigenlijk overbrengen? Een universele toekomstwaarschuwing, verpakt in een onopvallend, gemoderniseerd jasje? Of een opvallend archaïsche maar getrouwe weergave van de leeservaring die de brontekst biedt?
Ter illustratie twee versies van de openingszin naar aanleiding van die overweging – u mag raden welke welke is:
En uiteraard zit daar ook nog van alles tussenin. Ik kwam er niet uit, dus besloot ik van de nood een deugd te maken en mijn masterscriptie te wijden aan de vraag: hoe hebben mijn voorgangers dit aangepakt? Met andere woorden, bevatten recente vertalingen van Europeestalige romans uit het tweede kwart van de twintigste eeuw overwegend archaïserende of juist moderniserende vertaalstrategieën? De voor de hand liggende aanpak voor het vinden van een antwoord op die vraag is het handmatig vergelijken van een substantiële stapel vertalingen met de bijbehorende bronteksten, waarbij er uiteraard een fragmentselectie moet worden gemaakt, omdat de scriptie anders omvattender wordt dan het materiaal zelf. Maar zo’n fragmentselectie betekent noodzakelijkerwijs dat het resultaat mogelijk gebaseerd is op halve waarheden. Ik besloot het anders aan te pakken en maakte een uitstapje naar twee relatief jonge wetenschappelijke disciplines: de kwantitatieve vertaal- en literatuurwetenschap.2 Een deelgebied daarbinnen is de computationele stilistiek, alias stylometrie, waar stijl in teksten of corpora vergelijkend wordt geanalyseerd met behulp van statistische methodiek, verpakt in verschillende soorten software en algoritmes. Daarbij wordt het onderzoeksmateriaal integraal meegenomen, waardoor er een macrobeeld van de tekst ontstaat dat met behulp van handmatige analyse nauwelijks of niet te bereiken valt. Hoewel een groot gedeelte van dit onderzoeksgebied onbegaanbaar is voor wie net als ik verwaarloosbare programmeervaardigheden bezit, bestaan er verschillende tools die het de lekenvorser mogelijk maken de merites van de kwantitatieve aanpak te onderzoeken. Een daarvan – het softwarepakket Stylo for R – bevat twee methodes (Delta en Zeta genaamd) voor het contrastief vergelijken van lexicaal-stilistische kenmerken in corpora op basis van hoogfrequente woorden respectievelijk voorkeurswoorden.3 Het basisprincipe achter beide is de ontleding van de tekst tot een losse verzameling woorden, die vervolgens elk een statistische score krijgen. Bij Delta worden de vaakst voorkomende woorden in elke tekst (veelal functiewoorden – denk aan lidwoorden, voegwoorden, bijwoorden) geteld en worden de teksten op basis daarvan met elkaar vergeleken. Deze methode wordt al jaren met succes gebruikt om identificatiekwesties rondom auteurschap op te lossen; hoogfrequente woorden vormen een adequate functioneel-stilistische ‘vingerafdruk’.4 Bij Zeta wordt juist gekeken naar middelfrequente woorden die per tekst of tekstverzameling een significant hogere spreiding vertonen dan in het vergelijkingsmateriaal. Ik ging ervan uit dat ik met behulp van Delta globaal kon onderzoeken of er in mijn corpus vergaande functioneel-lexicale veranderingen hadden plaatsgevonden, wat zou kunnen duiden op een hoge mate van modernisering in de recente vertalingen. Daarna hoopte ik door het vergelijken van voorkeurswoorden met behulp van Zeta preciezer te kunnen zien welke veranderingen hadden plaatsgevonden. Ik stuitte daarbij echter op het probleem dat het kwantitatief vergelijken van teksten in twee of meer talen complicaties met zich meebrengt; de bestaande hulpsoftware is nog niet zo ver dat woorden in verschillende talen aan elkaar gekoppeld kunnen worden. Daarom besloot ik een corpus samen te stellen uit recente Nederlandse hervertalingen en hun bijbehorende eerste vertalingen, waarbij het criterium was dat die laatste kort na de verschijning van hun brontekst waren uitgebracht, zodat ze de mate van archaïsering in die laatste konden representeren.5 Uit het beschikbare materiaal ontstond een verzameling van negen vertalingenparen uit verschillende Europese talen en van verschillende auteurs – van Virginia Woolf tot Georges Simenon en van Joseph Roth tot Antoine de Saint-Exupéry. Daarnaast heb ik een controlecorpus gebruikt van acht vertalingen van hedendaagse bronteksten, als referentiepunt voor modern vertaliaans.
Dat is allemaal leuk en aardig, denkt u misschien, dat hele verhaal over die kwantitatieve analyse, maar het geautomatiseerd tellen van losse woorden in een tekst is toch ook niet alleenzaligmakend? Het menselijk brein kan dan misschien wat minder materiaal aan, maar het heeft tenminste gevoel voor toon, connotaties, context – die kant blijft hier toch onderbelicht? Daar moet ik u gelijk geven; ook deze methode resulteert feitelijk in halve waarheden. Toch was ik benieuwd of ze een bruikbare aanvulling zou kunnen vormen op de traditionele aanpak. Hieronder volgen de resultaten, oordeelt u zelf.
Figuur 1: resultaten Delta-analyse (hoogfrequente woorden). Het voorvoegsel RC geeft aan welke teksten tot het controlecorpus horen, bij het kerncorpus geeft het achtervoegsel 1_1 aan dat het om de eerste vertaling gaat, 2_1 is steeds de hervertaling.
In figuur 1 zijn de resultaten te zien van een eerste analyse met behulp van Delta. De schaal onder aan de figuur geeft aan hoe groot de functionele verschillen tussen de verschillende teksten zijn, met 0,0 als kleinste contrastieve waarde. Voorts geeft de verticale rangschikking aan welke teksten het dichtst bij elkaar in de buurt komen. We zien hier een duidelijke tweedeling van het controlecorpus enerzijds en de vertalingenparen anderzijds, waarbij die laatste steeds keurig bij elkaar staan. Het lijkt er dus op dat er geen ingrijpende functionele veranderingen hebben plaatsgevonden. Toch vertonen ze ook zichtbare verschillen, zo is te zien aan de horizontale schaal. Uiteraard ligt dat voor de hand – parallelle vertalingen verschillen immers altijd, anders zou er sprake zijn van plagiaat – maar de vraag is of die verschillen te maken hebben met vertaalkeuzes rondom modernisering en archaïsering. Daarover kon Zeta uitsluitsel geven, in de vorm van voorkeurswoordenlijsten. Ik begon met het vergelijken van de eerste vertalingen en hervertalingen. Hieronder volgt een selectie van de resultaten. Een aantal van de voorkeurswoorden is duidelijk synoniem (links in figuur 2), een ander deel valt niet een-op-een aan elkaar te verbinden, maar is wel typerend voor het register in het desbetreffende corpusonderdeel (de twee kolommen rechts).
Figuur 2: resultaten Zeta (voorkeurswoorden eerste vertalingen versus hervertalingen, selectie)
Op basis van dit resultaat zou je kunnen concluderen dat er lexicaal gezien flink gemoderniseerd is in de hervertalingen. Maar, bedacht ik, de kans bestaat dat de hervertalingen archaïsmen bevatten die in de eerste vertalingen even vaak of vaker voorkomen en die daarom logischerwijze niet zichtbaar worden in de resultaten van de contrastieve Zeta-analyse. Een tweede analyse, ditmaal van de hervertalingen in vergelijking met het controlecorpus, gaf uitsluitsel:
Figuur 3: resultaten Zeta (voorkeurswoorden hervertalingen versus referentiecorpus, selectie).
In figuur 3 is te zien dat de voorkeurswoordenlijst van het referentiecorpus vooral hedendaagse concepten bevat (wat niet verwonderlijk is, aangezien hier een significant modernere tekstwereld te verwachten viel), maar dat die van de hervertalingen vooral archaïsche registerkeuzes bevat en dat die een stuk behoudender blijken dan figuur 2 deed vermoeden – let u bijvoorbeeld even op het uitdrukkelijk archaïsche genitief-lidwoord der, dat weliswaar vaker voorkwam in de eerste vertalingen (zie figuur 2), maar ook in de hervertalingen opduikt (zie figuur 3), en het typisch hedendaagse woordje leuk, dat in de eerste Zeta-analyse bij de hervertalingen terechtkwam, maar zich in de tweede onder het referentiecorpus schaart, in lijn met oké en sorry.
Tezamen wijzen de resultaten op een zeer gematigd moderniserende tendens in de hervertalingen. Of ik me daarachter schaar bij het vertalen van Kallocain? Daar ben ik nog niet uit, maar het onderzoek heeft me in elk geval een bruikbaar referentiekader verschaft.
Noten
1 Het eerste voorbeeld is afkomstig uit de bestaande vertaling van Zwaantje van ’t Hoff Stolk-Huisman – door mij ietwat gedramatiseerd ten behoeve van het illustratieve effect. Het tweede voorbeeld heb ik zelf naar modernste kunnen vertaald.
2 Een van de belangrijkste grondleggers van de kwantitatieve vertaalwetenschap is Mona Baker. Zie voor een overzicht van recente ontwikkelingen Michael Oakes & Meng Ji (eds.), Quantitative Methods in Corpus Based Translation Studies. A practical guide to descriptive translation research. Amsterdam/Philadelphia: John Benjamins, 2012. Een uitgebreider introductie van de computationele literatuurwetenschap en de stylometrie kunt u vinden in mijn scriptie.
3 Maciej Eder, Jan Rybicki & Mike Kestemont, 'Stylometry with R: A Package for Computational Text Analysis', The R Journal, 8:1 (2016), p. 107-121. Beide methoden zijn geesteskinderen van de computationeel-literaire pionier John Burrows.
4 Woorden die vrijwel uitsluitend in een bepaalde tekst (of tekstpaar) voorkomen, zoals personagenamen, kunnen worden weggefilterd om vertekening te voorkomen.
5 Ik heb verouderde spelling in de eerste vertalingen aangepast, omdat hetzelfde woord in twee verschillende spellingen niet als zodanig herkend wordt door de gebruikte software.
Eline Jongsma (1991) studeerde Scandinavische talen en culturen aan de Rijksuniversiteit Groningen en Literair Vertalen aan de Universiteit Utrecht. In juni 2016 ontving ze een door het Nederlands Letterenfonds gesubsidieerde Talentbeurs Literair Vertalen. Tijdens haar master vertaalde ze onder andere uit het Noors het toneelstuk De terugkomsten van Fredrik Brattberg en de detective Ik weet waar je woont van Unni Lindell. Binnenkort verschijnt Respect. Een gids in seks en liefde voor jongens van nu van de Zweedse seksuoloog Inti Chavez Perez in haar vertaling.
Reageren? info@tijdschrift-filter.nl.