Vertimo revoliucija, kurios niekas nesitikėjo
Dar prieš dešimt metų mintis, kad mašina galės versti sudėtingus žurnalistinius tekstus taip tiksliai, kad skaitytojas net neįtars, jog tai ne žmogaus darbas, atrodė kaip mokslinė fantastika. Šiandien tai – kasdienė realybė, kuri iš esmės keičia tai, kaip žinios keliauja per kalbų ir kultūrų ribas. Automatiniai internetiniai teksto vertėjai – nuo senojo „Google Translate” iki modernaus „DeepL” ar „ChatGPT” pagrindu veikiančių sistemų – tapo įrankiais, kurių žurnalistai, redaktoriai ir leidėjai tiesiog nebegali ignoruoti.
Ir čia prasideda tikrai įdomus pokalbis. Nes tai nėra tik technologijų istorija – tai istorija apie tai, kaip keičiasi žodžio galia, informacijos prieinamumas ir žurnalistinė atsakomybė. Kai mašina per kelias sekundes išverčia ukrainiečio karo reportažą į lietuvių kalbą, kas garantuoja, kad niuansai, emocijos ir faktai liko nepakitę? Kas atsako, jei kažkas išsikraipė?
Kaip šios sistemos iš tikrųjų veikia – ir kodėl tai svarbu žurnalistams
Norėdami suprasti galimybes ir grėsmes, pirmiausia turime suprasti mechaniką. Šiuolaikiniai automatiniai vertėjai naudoja vadinamuosius neuroninius tinklus – konkrečiau, transformerių architektūrą, kuri buvo revoliucingai pristatyta 2017 metais. Skirtingai nuo senesnių sistemų, kurios vertė žodį po žodžio pagal iš anksto nustatytas taisykles, modernūs vertėjai „mokosi” iš milijardų teksto pavyzdžių ir bando suprasti kontekstą.
Praktiškai tai reiškia, kad sistema nemato atskiro žodžio – ji mato visą sakinį, pastraipą, kartais net visą tekstą kaip vieną semantinį vienetą. Todėl „DeepL”, pavyzdžiui, dažnai sugeba atkurti ne tik reikšmę, bet ir toną – sausą oficialų stilių, emocinį pasakojimą ar ironiją. Tačiau čia ir slypi spąstai: sistema mokosi iš to, kas buvo parašyta anksčiau, vadinasi, ji gali atkartoti senas klaidas, stereotipus ar kultūrines prielaidas, kurios į tekstą įsirašė per dešimtmečius.
Žurnalistui tai reiškia labai konkretų dalyką: automatinis vertimas nėra neutralus įrankis. Jis turi savo „pasaulėžiūrą”, suformuotą iš duomenų, kuriais buvo maitinamas. Ir jei tie duomenys buvo šališki – vertimas gali būti šališkas, net jei jis skamba puikiai.
Galimybės, kurios tikrai keičia žaidimo taisykles
Bet pradėkime nuo gerų naujienų, nes jų tikrai yra daug. Automatiniai vertėjai žurnalistikai atvėrė galimybes, kurios dar prieš dešimtmetį buvo prieinamos tik didelėms redakcijoms su solidžiais biudžetais.
Pirma – greitis. Kai 2022 metais prasidėjo karas Ukrainoje, mažos lietuviškos redakcijos staiga turėjo poreikį sekti ukrainietiškus, rusiškus, angliškus ir lenkiškus šaltinius vienu metu. Anksčiau tai reikštų samdyti keturis skirtingų kalbų vertėjus arba tiesiog atsisakyti dalies informacijos. Dabar vienas žurnalistas su „DeepL” ar „Google Translate” gali per valandą perskaityti ir suprasti dešimtis užsienio šaltinių. Tai – tikra demokratizacija.
Antra – prieinamumas mažesnėms kalboms. Lietuvių kalba nėra itin didelė rinka, ir istoriškai tai reiškė, kad daug tarptautinės žurnalistikos tiesiog nepasiekdavo lietuvių skaitytojų. Šiandien situacija keičiasi. Nors automatinis vertimas į lietuvių kalbą vis dar nėra tobulas (apie tai – vėliau), jis jau pakankamai geras, kad padėtų redakcijoms greitai adaptuoti tarptautinį turinį.
Trečia – tyrėjų darbas. Investigaciniai žurnalistai, dirbantys su užsienio dokumentais, teismo bylomis ar vyriausybiniais raštais, gali naudoti automatinius vertėjus kaip pirmąjį žingsnį – greitai suprasti, apie ką kalbama, o tada pasitelkti profesionalų vertėją tik tiems fragmentams, kurie tikrai svarbūs. Tai taupo ir laiką, ir pinigus.
Ketvirta – ir tai galbūt labiausiai neįvertinta galimybė – daugiakalbė žurnalistika. Kai kurios redakcijos jau eksperimentuoja su modeliu, kai straipsnis rašomas viena kalba, automatiškai išverčiamas į kelias kitas, o tada redaguojamas vietinių kalbos specialistų. Tai leidžia vienai redakcijai pasiekti kelių šalių auditorijas be proporcingai didesnių kaštų.
Kur tikslumas subyra į šipulius
Dabar – sunkesnis pokalbis. Nes automatiniai vertėjai, kad ir kokie įspūdingi, turi labai specifinių silpnybių, kurios žurnalistikoje gali turėti rimtų pasekmių.
Kultūriniai niuansai ir idiomatika – tai pirmoji ir dažniausia problema. Žurnalistinis tekstas nėra techninis vadovas. Jame pilna metaforų, kultūrinių nuorodų, ironijos, dviprasmybių. Rusiškas posakis, ukrainietiškas humoras, arabiškas mandagumo formuluotės – visa tai automatiniam vertėjui yra minas laukas. Sistema dažnai išverčia žodžius teisingai, bet prasmę – ne. Ir tai yra pavojinga, nes skaitytojas nežino, kad kažkas dingo.
Tikriniai vardai ir specifinė terminija – kita opiausia vieta. Politikų pavardės, vietovardžiai, institucijų pavadinimai – visa tai automatiniai vertėjai kartais iškraipo arba pateikia neteisingomis formomis. Lietuvių kalbai tai ypač aktualu, nes mūsų linksniavimo sistema yra sudėtinga, ir mašina ne visada teisingai supranta, kokia forma reikia vartoti konkretų vardą konkrečiame kontekste.
Citatos – tai atskira katastrofa. Kai žurnalistas cituoja šaltinį, kiekvienas žodis yra svarbus. Automatinis vertimas gali pakeisti citatos toną, sutrumpinti ją arba pridėti reikšmę, kurios originale nebuvo. Ir jei ta cituota citata paskui keliauja toliau – per socialinę žiniasklaidą, per kitas redakcijas – klaida dauginasi.
Vienas praktinis pavyzdys: „Google Translate” ilgą laiką turėjo problemų su arabų kalbos vertimais, kur gramatinė giminė ir mandagumo lygiai yra labai svarbūs. Tekstas, kuriame politikas kalbėjo pagarbiai apie oponentą, galėjo būti išverstas taip, kad atrodė kaip įžeidimas – tiesiog dėl to, kaip sistema interpretavo tam tikras formas. Žurnalistikoje toks klaidingai išverstas tekstas gali sukelti diplomatinį incidentą.
Etika ir atsakomybė – kas atsako, kai mašina suklysta?
Čia prasideda tikrai nepatogus klausimas, kurį žurnalistikos pasaulis dar tik pradeda rimtai svarstyti. Kai žmogus-vertėjas suklysta, atsakomybė yra aiški. Kai suklysta mašina – kas kaltas? Redakcija, kuri naudojo įrankį? Kūrėjai, kurie sukūrė sistemą? Ar niekas?
Daugelis redakcijų šiuo metu naudoja automatinius vertėjus be jokios aiškios politikos – tiesiog kaip patogų įrankį, apie kurį niekas oficialiai nekalba. Tai yra problema. Redakcijoms reikia aiškių vidinių taisyklių, kurios apibrėžtų, kada automatinis vertimas yra priimtinas, kada jis turi būti patikrintas žmogaus, ir kada jis apskritai negali būti naudojamas.
Yra ir kitas etinis klausimas: skaidrumas skaitytojų atžvilgiu. Jei straipsnis buvo išverstas automatiškai ir tik minimaliai redaguotas, ar skaitytojas turi apie tai žinoti? Daugelis žurnalistikos etikos ekspertų teigia, kad taip – ypač jei kalbama apie svarbius politinius ar socialinius tekstus. Tačiau praktikoje tokio atskleidimo beveik niekada nematome.
Verta paminėti ir dezinformacijos riziką. Automatiniai vertėjai gali tapti įrankiu, kuriuo dezinformacija greitai ir pigiai platinama per kalbų ribas. Jei kažkas sukuria melagingą naujieną rusų kalba ir nori ją paskleisti lietuviškai, automatinis vertimas leidžia tai padaryti per minutes, be jokių specialių žinių. Žurnalistams ir redakcijoms tai reiškia, kad reikia būti ypač atsargiems su automatiškai išverstu turiniu iš nepatikimų šaltinių.
Praktinis vadovas: kaip naudoti vertėjus protingai
Gerai, teorija – teorija, bet ką konkrečiai daryti žurnalistui, kuris šiandien sėdi prie kompiuterio ir turi išversti tekstą? Štai keletas praktinių rekomendacijų, kurios tikrai veikia:
1. Pasirinkite tinkamą įrankį pagal užduotį. „DeepL” šiuo metu laikomas geriausiu europiečių kalbų vertimui – jo rezultatai lietuvių kalba yra gerokai geresni nei „Google Translate”. Tačiau „Google Translate” turi platesnį kalbų pasirinkimą, todėl retesnėms kalboms jis gali būti vienintelė galimybė. „ChatGPT” ar kiti didieji kalbos modeliai puikiai tinka tada, kai reikia ne tik išversti, bet ir adaptuoti tekstą – pakeisti toną, sutrumpinti ar paaiškinti.
2. Visada patikrinkite tikrinius vardus. Tai – absoliuti taisyklė. Jokio automatinio vertimo rezultato su politikų pavardėmis, vietovardžiais ar institucijų pavadinimais negalima publikuoti be rankinio patikrinimo. Tai užtrunka penkias minutes, bet gali išgelbėti nuo rimtų klaidų.
3. Citatas visada tikrinkite su originalu. Jei cituojate konkretų žmogų, grįžkite prie originalaus teksto ir patikrinkite, ar citata tiksliai atspindi tai, kas buvo pasakyta. Automatinis vertimas citatas traktuoja kaip eilinį tekstą – jis nesupranta, kad čia kiekvienas žodis yra svarbus.
4. Naudokite „atgalinį vertimą” kaip patikros metodą. Tai senas, bet efektyvus triukas: išverskite tekstą į kitą kalbą, tada vėl atgal į originalą ir palyginkite. Jei reikšmė stipriai pasikeitė – tai signalas, kad automatinis vertimas nebuvo tikslus ir reikia žmogaus pagalbos.
5. Būkite ypač atsargūs su emociškai įkrautais tekstais. Karo reportažai, aukų liudijimai, politinės kalbos – visa tai reikalauja ne tik tikslaus žodžių vertimo, bet ir kultūrinio konteksto supratimo. Tokiems tekstams automatinis vertimas gali būti tik pirmas žingsnis, o ne galutinis rezultatas.
6. Dokumentuokite, ką naudojote. Vidiniam redakcijos naudojimui verta fiksuoti, kurie tekstai buvo versti automatiškai ir kaip jie buvo patikrinti. Tai padeda išlaikyti atskaitomybę ir, jei iškyla klausimų, galima grįžti ir patikrinti procesą.
Ateitis: žmogus ir mašina kaip komanda
Geriausios redakcijos, kurios jau šiandien dirba su automatiniais vertėjais, suprato vieną svarbų dalyką: klausimas nėra „mašina ar žmogus” – klausimas yra „kaip mašina ir žmogus gali dirbti kartu efektyviau nei kiekvienas atskirai”.
Šis modelis – vadinamas „žmogaus kilpa” (angl. human-in-the-loop) – jau veikia daugelyje sričių. Automatinis vertimas atlieka sunkų darbą: išverčia didelį kiekį teksto greitai ir pigiai. Žmogus tada peržiūri rezultatą, patikrina kritinius elementus, koreguoja niuansus ir prideda kultūrinį kontekstą. Rezultatas – greitesnis ir pigesnis procesas nei grynai rankinis vertimas, bet daug tikslesnis nei grynai automatinis.
Technologijos taip pat nestovi vietoje. Naujausios sistemos jau sugeba „paaiškinti” savo vertimo sprendimus – parodyti, kodėl tam tikras žodis buvo pasirinktas ir kokios alternatyvos buvo svarstomos. Tai leidžia žmogui-redaktoriui daug greičiau identifikuoti problematiškas vietas ir jas pataisyti.
Yra ir dar viena įdomi tendencija: specializuoti vertėjai konkrečioms sritims. Jau dabar galima rasti sistemas, specialiai apmokytas medicinos, teisės ar finansų tekstams. Žurnalistikos vertėjas, apmokytas su žurnalistiniais tekstais iš patikimų šaltinių, galėtų būti daug tikslesnis nei bendros paskirties sistema. Tokios specializuotos sistemos – artimiausių metų klausimas.
Kai mašinos verčia žodžius, žmonės turi saugoti prasmę
Automatiniai internetiniai teksto vertėjai yra vienas iš labiausiai transformuojančių įrankių, kurie per pastaruosius kelerius metus atėjo į žurnalistiką. Jie atvėrė duris, kurios anksčiau buvo uždarytos – mažesnės redakcijos dabar gali sekti tarptautinius įvykius, mažesnės kalbos dabar gali gauti daugiau turinio, tyrėjai dabar gali dirbti su šaltiniais, kurie anksčiau buvo neprieinami.
Bet šios durys atsidaro į abipuses puses. Tos pačios technologijos, kurios padeda platinti teisingą informaciją, gali taip pat greitai platinti klaidingą. Tie patys įrankiai, kurie taupo laiką, gali sukelti klaidų, kurioms ištaisyti reikės daug daugiau laiko. Ir ta pati greičio magija, kuri atrodo kaip privalumas, gali tapti spąstais, jei žurnalistas per daug pasitiki mašina ir per mažai – savo kritišku mąstymu.
Geriausias požiūris šiandien yra toks: naudokite automatinius vertėjus drąsiai ir entuziastingai kaip įrankius, bet niekada nepamirškite, kad įrankis yra tik tiek geras, kiek žmogus, kuris jį laiko rankose. Žurnalistika – tai ne tik žodžių perkėlimas iš vienos kalbos į kitą. Tai prasmės, konteksto, tiesos saugojimas. Ir ta atsakomybė niekada nebus automatizuota.
Todėl kitas žingsnis – ne laukti, kol technologijos taps tobulos, bet aktyviai mokytis jas naudoti protingai: suprasti jų stiprybes, žinoti jų ribas ir niekada neprarasti žurnalistinio skepticizmo, net kai mašina pateikia tobulai skambantį vertimą. Ypač tada.