A Google Fordító még mindig fordítja a "sült sajt és az ég" szót, de a "javítja".
Ha az elmúlt hetekben lefordított valamit a Google Fordítón keresztül, akkor észrevehette, hogy jobb szlovákról angolra és fordítva fordítani. A fordító új és továbbfejlesztett technológiát használ.
Április 19-ig a Google úgynevezett statisztikai rendszert használt, amely előre meghatározott nyelvtani minták szerint fordította le a szöveget. Újonnan neurális hálózatokat használ, amelyek lehetővé teszik a rendszer számára, hogy megtanulja a szövegek fordítását, hogy az eredmény közelebb kerüljön a természetes emberi beszédhez. Jobban mondva, hogy az eredmény jobban hasonlítson a tanuláshoz adott szövegekre.
A szerkesztőségben különféle szövegeken teszteltük az új technológiát, és konzultáltunk az eredményekkel szakfordítókkal.
Bár a Google Fordító még mindig a "sült sajt és ég" kifejezést "sült sajt és ég" kifejezésként fordítja, ez egyébként több szempontból is javult. Az új neurális fordítás lehetővé teszi teljes mondatok egyszerre történő lefordítását, nem apránként. Szélesebb kontextust használ a szavak körül, és így megfelelőbb fordítást kínál. A minőség javulásának észrevehetőnek kell lennie, különösen hosszabb mondatok esetén. A Google szerint az új technológia 55–85 százalékkal képes kiküszöbölni a fordítási hibákat.
"Maga a mondat szintjén már szlovákul is tud ragozni, tudja, milyen elöljárószó kapcsolódik az igéhez, ebben nagy elmozdulás van. De még mindig hiányzik belőle az olvasó tudata, amely csak egy embernek van "- mondja Ana Ostrihoňová fordító és az Inaque kiadó alapítója.
Az interneten számos példa található arra, milyen hülye hibákat követett el eddig a Google Translate. Például a "ne hattyúzzon" kifejezést úgy fordította, hogy "ne ébressz fel hattyút". Ma két lehetőséget kínál - a szó szerinti fordítás "ne légy hattyú", valamint a frazeológia "ne butás" (ne butáskodj). Amikor csehül fordít, tudja a "gyere" harmadik jelentését (megteheti, halad előre, ne habozzon).
A grafikon az angol - spanyol, francia, kínai és fordított fordítások felhasználói értékelését mutatja. A francia-angol fordítás azt mutatja, hogy az idegfordítást (zöld) szinte ugyanúgy érzékelik, mint az átlag emberi kétnyelvű fordító fordítását (narancssárga). A kínai és kínai fordítás eddig rosszabb, de a neurális fordítás jelentősen javította az eredeti statisztikai fordítást (kék). Forrás: research.googleblog.com
A rendszer megtanulja önmagát
A Google naponta körülbelül egymilliárd fordítást rögzít. Naponta 140 milliárd szót fordít, több mint 500 millió ember gépelte.
A vállalat tavaly novemberben mutatta be az új technológiát, amikor idegfordításokat indított az első nyolc világnyelvre - német, francia, spanyol, portugál, kínai, japán, koreai és török -. Ma új fordítások működnek angol és több mint két tucat nyelv között. Április óta a szlovák köztük van.
Az idegfordítás nem az emberektől tanul, hanem maga elemzi a lefordított szövegeket és azokból tanul. Ugyanakkor az egyes nyelveket nem külön tanítják, hanem egyszerre többen feldolgozzák. Hasonló az emberhez, aki, ha ismer román nyelvet (francia vagy spanyol), könnyebben elsajátítja egy másik rokon idegen nyelvét (portugál vagy olasz).
"A neurális hálózatok egész mondatokat fordítanak le, és hatalmas számítási teljesítményre van szükségük. A Google 103 nyelv között fordít, és ha minden egyes kombinációhoz külön modellt kellene létrehoznunk, a hardver nem szorítaná meg. "- mondta Barak Turovsky, a Translator termékmenedzsere a kkv-nak. "Ezért egyesítjük a nyelveket csoportokba. Ideális esetben ezek nyelvileg hasonló nyelvek, például szláv vagy indiai. "
Ostrihoňová fordító szerint a Fordító ma sokkal okosabb, mint három vagy négy évig. Ugyanakkor hozzáteszi, hogy a fordítás nagyon szó szerinti, és nem szabályozza a stilisztikát. A szavak fordítása egyik nyelvről a másikra minimális. "De akkor itt van a regisztráció, a stílus, a különböző nyelvi rétegek, amelyeket az elbeszélők használnak a párbeszédablakokban - a Google Fordító ezt nem tudja."
Szavait Martin Kubuš erősíti meg, aki a Matej Bel Egyetemen tart előadásokat az angol irodalomról és a művészi szövegek fordításáról: „A Google-nak nincs stratégiai kompetenciája, nincs társadalmi-nyelvi kompetenciája. Csak nyelvi bázisa van - nyelvi anyagokat cserél. "
Szerinte a fordító nem tudja dekódolni a stílust, nincs jó szintaxisa. "Hasznos annak, akinek csúnya durva fordítást kell készítenie, de a művészi fordításhoz nem elég. Ehhez olyan személyre van szükség, aki megfelelő stratégiát tud kidolgozni, hogy fizetni tudjon a szöveg egy adott részében. "
"Valószínűleg egyetlen nyelv sem redukálható olyan szabályokra, amelyeket a szoftver használhat" - teszi hozzá Ostrihoňová. "Ezenkívül a nyelv minden nap változik és fejlődik, a szavak különböző konnotációkat kapnak."
Milyen hibákat követ el az új Google Fordító a fordításokban?
Néha nem is fordít le egyszerű szöveget
Nyilvánvalóan vannak még olyan hibák a rendszerben, amelyek lehetetlenné teszik az egyszerű szöveg fordítását is.
Google Fordító: Mexikóban nem lehet tőle kapni. Halál. Vér. Fájdalom. A kínzás mindenütt jelen van.
Helyes fordítás: Nem fogsz megmenekülni tőle Mexikóban. Halál. Vér. Fájdalom. Kínzás minden lépésnél.
Egyes mondatok nem megfelelően fordíthatók, mert nem látják összefüggéseiben
Néhány mondat téves, mert nem egy teljes bekezdés vagy oldal összefüggésében fordítják le őket. Ennek eredményeként nincs értelme.
Google Fordító: "Ennek nincs értelme."
- Nos, az.
Helyes fordítás: "Ennek nincs értelme"
"Igen ő csinálja."
Feleslegesen kisajátít
"Az angol, a német és a franciát gyakran alkalmazzák - például" elvitte a cuccait "," a szobájába ment ". Szlovákul lefordítjuk, amikor iel ment a szobájába ’, vagy„ a szobájába ment ”- magyarázza Ostrihoňová. "Nincs nyelvtudata. Nem tudja, hogy ami az egyik nyelvben elengedhetetlen, nem feltétlenül fontos a másikban, vagy csupán egy nyelvtani funkcióról van szó, amelyet nem fordítanak le egy másik nyelvre, vagy lexikailag vagy stílusosan fordítják le. "
Google Fordító: Amikor a kezelő végül becsöngetett a szobába, egy ablak ülésben ült, és szinte befejezte a bal keze körömlakkját.
Helyes fordítás: Amikor végül a szobájában megszólalt a csengő, az ablak mellett ült, és szinte az összes körmét a bal kezére festette.
Feleslegesen ismételgeti a fordítás néhány szavát
A Google megismétel néhány szót, bár fordításban erre nincs szükség. "Csak nyelvi anyagokat cserél, és egyáltalán nem veszi figyelembe a szlovák nyelv bizonyos sajátosságait" - mondja Kubuš.
Google Fordító: "Ki mondja ezt?"
- A parancsnok azt mondja.
Helyes fordítás: "Ki mondta?"
- Commodore.
A karakterekkel és nevükkel kapcsolatos problémák
A Google gyakran nem tudja kitalálni, hogy a karakter milyen karakterrel rendelkezik a történetben. Még akkor is, ha a karaktert bemutatták, a rendszer a következő mondatban már nem tudja, hogy lány vagy fiú volt-e. A karakterneveket néha nem is tudja kezelni - néha az eredeti változatban hagyja, lefordítja őket néhány sorral lejjebb. Pozitívumként megdől, tehát tudja, hogy a női vezetéknevekhez az -ová utótagot kell használnia.
Ha nem tud lefordítani valamit, akkor csehül fog használni
Olyan helyzetekben, amikor a Google nem tudja kezelni egy szó fordítását, eléri a cseh nyelvet.
Google Fordító: - Helló - mondta a lány, kinyújtott bal kezének ujjaival, és elhúzódott a fehér selyemruhától.
Helyes fordítás: - Kérem - mondta, és bal kezét a lehető legtávolabb nyújtotta a fehér selyemköntöstől.
A fordítás mesterséges és nem megfelelő szó szerinti
Néhány fordítás szó szerinti, bár szlovákul egyes dolgokat másképp fognak mondani. Így, még akkor is, ha a Translator nem követ el nyelvtani hibát, a fordítás nem megfelelő. "Ez mesterséges. Nincs fordítói értelmezés "- mondja Kubuš.
Google Fordító: Ez nem az ő természete
Helyes fordítás: Ez nem a természetben van.
Nem tudja, ki a színész
Olyan helyzetekben, amikor az irodalom nem mondja ki kifejezetten, ki mit tett, a Fordító elveszik.
Google Fordító: Hallottam, hogy Charlie felment a lépcsőn, és beugrott az ágyba, úgy tett, mintha aludna. Becsukta a fejét a szobában, és kimondta a nevemet, de nem válaszoltam.
Helyes fordítás: Hallottam, ahogy Charlie felment a lépcsőn, és bedobtam magam az ágyba, miközben mélyen aludtam. Bekukucskált a szobába és megszólított, de nem válaszoltam.
Írásjelek
A fordító néha értelmetlen írásjeleket követ el. Néha helytelenül szúr be egy szóközt egy szó és a záró idézőjel közé. Helytelenül szúr be egy szóközt a szó és a következő három pont közé, bár ez a hiba nem fordult elő a forrásszövegben. Történt az is, hogy a pontot vesszőre cserélte, bár a következő szót nagybetűvel hagyta, mintha egy mondat kezdete lenne.
Problémája van az elavult szavakkal
Néhány régebbi szó fejlődött, és jelentésük fokozatosan megváltozott. A Google Fordító azonban nem tudja dátumozni a szöveget, ezért nem tudja, melyik fordítást használja. Problémái voltak például, amikor ránk fordított egy szöveget a Kilenc novella könyvből, amelyet J. D. Salinger írt 1953-ban.
Google Fordító: Levette két frissen megjelenő haját a nyakán.
Helyes fordítás: Két kis szőrszálat húzott elő a tábláról.
Nem tudja, hogy a szlováknak már nincs hivatása
A Google gyakran nem tudja használni a megfelelő stílust. A tesztelés során előfordult velünk, hogy az 5. esetet használta, bár szlovákul szinte már nem létezik.
Google Fordító: - Anya, drágám, ne kiabálj velem, gyönyörűen halllak - mondta a lány.
Helyes fordítás: "Anya, kedves, ne kiabálj velem. Nagyon jól halllak - mondta a lány.
Egyelőre nem fogja helyettesíteni a fordítókat
Az új fordító tesztelése azt mutatja, hogy a technológiák a közeljövőben nem pótolják a hivatásos fordítókat. A rendszer továbbra is hibákat követ el, amelyeket az átlag fordító vagy tolmács nem követne el.
"Mi, fordítók, még mindig békében lehetünk. Ez a szerencsétlen gép még nem fog minket helyettesíteni "- mondja Martin Kubuš fordító. Úgy gondolja, hogy a Google Fordítónak könnyen le kell fordítania az informatív szövegeket, ahol a fordító tolmácsolása nem szükséges, például kézikönyveket és használati utasításokat.
"Különbség van az élmény-kifejező szöveg és az informatív szöveg között. A Google képes lehet lefordítani néhány sablonszerződést, talán kezelné az Európai Unió úgynevezett szürke irodalmát, de ott is valószínűleg még ki kellene igazítani "- mondja. "De amikor a szöveg értelmezéséről, valami érthetetlen hozzáadásáról, rövidítéséről van szó, a rendszer nem tudja."
A Google Translate nem csak nem helyettesíti a szépirodalom fordítóit, de egyelőre még azokon a területeken sem lehet megbízni benne, ahol a használt nyelv egyszerűbb. Szakmai, műszaki, pénzügyi vagy jogi szövegekben a nyelvtan gyakran egyszerűbb, de még az apró hibák is elfogadhatatlanok.
Ezenkívül az új Fordító szerzői elismerik, hogy az új fordítási technológia egyes pillanatokban kevésbé pontos lehet, mint a régi szófordítás-fordítás. A rendszer megpróbálja megtalálni a legjobb hangzású fordítást, és problémát okozhat például a ritkán használt szavak fordításával. Néha előfordulhat, hogy nem tudja lefordítani az összes szót.
A Translator jövője a kétnyelvű szövegek minőségétől is függ, amelyekből a rendszer tovább fog tanulni. Az ideghálózatok fordításra való felhasználása valóban jelentős és jelentős technológiai változás, de ha a szoftver rosszul lefordított szövegekből tanul, rossz módszereket is megtanulhat.