Automatinio vertimo programos: dirbtinio intelekto pritaikymas ir perspektyvos

Autorius: dr. Jacekas Antulis, METIDA partneris, patentų grupės vadovas

  • Dirbtinis intelektas (DI) šiandien: pritaikymas ir nauda
  • DI problemos susijusios su automatiniu vertimu
  • Tobulumas jau ranka pasiekiamas

Dirbtinio intelekto sąvoka naudojama jau seniai, o ir pirmieji kompleksiniai neuroninių tinklų modeliai buvo sukurti XX a. 7-ajame dešimtmetyje. Realūs pirmieji taikymai praktikoje prasidėjo tik per pastarąjį dešimtmetį, nes būtent dabar mūsų technologinė pažanga ir galimybės (informacinis tankis bei apdorojimo greitis) palaipsniui priartėja prie tinkamo lygio. Tikrajam dirbtiniam intelektui, kuris galėtų stipriai priartėti prie žmogaus smegenų veiklos, sukurti reikėtų dar ne vieno dešimtmečio, tačiau jau dabar kuriami pirmieji prototipai, nereikalaujantys tokio aukšto funkcionalumo lygio.

Labai dažnai dirbtinis intelektas suprantamas kaip programa arba algoritmas, kuris gali atlikti tą patį veiksmą skirtingai, priklausomai nuo ankstesnės arba pirminės patirties. Tačiau pati programa arba algoritmas yra tik virtualus objektas, kompiuteriuose tai gali būti operacinė sistema, reikalaujantis konkretaus įgyvendinimo. Tam reikalinga atitinkama struktūra – matrica. Žmoguje tai atitinka smegenis, kompiuteryje tai būtų kietasis diskas. Tokiu būdu dirbtinis intelektas atlieka „sielos“ funkciją, o neuroninis tinklas – operacijų inicijavimo arba „pirminio kūno“ funkciją.

screenNaudojant specialiai paruoštą neuroninį tinklą bei atitinkamų algoritmų sistemą, automatinis vertimas neatrodo didelė problema, su kuria pakankamai sėkmingai  tvarkosi automatinių vertimų algoritmų kūrėjai. Per paskutinius metus automatinio vertimo programos taip patobulėjo, kad po atitinkamų testų privertė susimąstyti, ką daryti toliau ir kaip išnaudoti jų naujas galimybes kasdieninėje praktikoje.

Pirmoji vertimo problema – žodžiai ir gramatika. Prieš dvidešimt metų tai buvo didelė problema, nes reikalavo didelės duomenų bazės, matricos ir daugelio taisyklių. Tačiau prieš dešimt metų ši problema buvo išspręsta ir atsirado pirmosios automatinio vertimo programos, kurios tuo metu buvo labai mėgėjiškos ir suformavo visuomenės  nuomonę, kad automatinis vertimas niekada nebus tobulas. Kiekvienoje kalboje žodžių kiekis yra gana tiksliai apibrėžtas, taisyklės ir išimtys aiškiai nurodytos, todėl analizuojant šią problemą matematiniu požiūriu – automatinio vertimo programose ši problema jau praktiškai išspręsta.

Antroji problema –  žodžių eiliškumas. Kiekvienoje kalboje žodžių eiliškumą tiksliai apibrėžia žodžių tvarkos taisyklės. Turint pakankamai didelį analizės lauką tai yra nesunkiai įveikiamas uždavinys. Ši problema dar egzistuoja tik todėl, kad pačių kalbų yra pakankamai daug ir nėra išsispręsti visi netikslumai tam tikrose kalbose, tačiau kalbant apie populiariausias kalbas tai jau įveiktas etapas.

Trečia problema – formulės ir cheminiai junginiai. Sunkumai kyla dėl to, kad reikia keisti išvedamo teksto formatą – keisti redaktorių (papildomai diegti kompiliatorių). Šiuo metu daugiausiai naudojamas yra paprastasis formatas, kuris neleidžia dirbti su struktūrinėmis arba daugiapakopėmis formulėmis. Šią problemą būtų galima realizuoti „html“ formatu, bet tai tiktų ne visiems, o programavimas specialiajame formate užimtų papildomo laiko. Kol kas niekas nenori tuo užsiimti, nes paprasčiausiai neturi resursų.

Ketvirta problema – specifinės srities terminologija. Šiuo metu ši problema  aktyviai sprendžiama, nes egzistuoja visose pagrindinėse kalbose. Algoritmai jau pakankamai gerai išsprendė žodžių eiliškumo problemą, kai reikia analizuoti ne visą tekstą, bet tik vieną sakinį. Tačiau terminologijos problemai išspręsti reikia analizuoti mažiausiai kelis sakinius. Kai reikia analizuoti kontekstą ir sudaryti konkretaus verčiamo teksto susietų terminų sąryšius kelių sakinių apimtyje. Analizuodami verčiamus tekstus, matome, kad ši problema yra pakankamai neblogai sprendžiama, tačiau patikrinti terminus vis tiek reikėtų. Įsigaliojus Vieningajam patentui, pagal teisinį reglamentavimą, žmogaus atlikto vertimo nereikės – pakaks automatinio. Šiuo metu, statistiškai analizuojant realius vertimus pastebėta, kad automatinėmis programomis atlikti vertimai yra geresni nei atlikti žmonių.

Penkta problema – skirtingų tekstų maišymas grožinėje literatūroje. Joje, priklausomai nuo situacijos ir konteksto, maišoma skirtingų sričių terminologija ir temos, todėl matematiniu požiūriu ji yra mažiau „stabili“.

Kadangi kalbą apibrėžia taisyklės ir jų išimtys, idealus automatinis vertimas yra įmanomas. Ateityje jis bus toks pat geras ar net geresnis už žmogaus atliktą vertimą,  nes žmogus gali klysti, o mašina – ne. Naudojant automatines vertimo bei saugojimo programas, ateityje tai padės išsaugoti originalią kalbą, taip pat lyginti ją su tuo, kas buvo prieš daug metų. Bus galima aptikti įvykusius pokyčius ir nustatyti, kada ir kodėl tai įvyko. Tautų kalbų autentiškumą ateityje galės išsaugoti tik mašinos, nes žmonės linkę savo kalbą paprastinti, keisti, pamiršti.

Po ilgo automatinio vertimo proceso tobulinimo bus lengviau pasiekti kitą tikslą – automatinį sinchroninį vertimą, kai automatinės vertimo programos realiu laiku pateiks sakomos kalbos vertimą į kitą kalbą. Jau dabar ši technologija egzistuoja ir yra tobulinama, bet kol kas ji yra mažai žinoma.

Durys į dirbtinio intelekto kambarį jau yra viliojančiai pravertos, o virtualių erdvių aibė jau sukurta. Ar mes pasiruošę įeiti į šį kambarį ir nepasiklysti jame? Tai priklauso nuo mūsų pačių.

ĮVERTINKITE BLOGĄ ⇒

Įrašas paskelbtas temoje Išradimai | Inventions, Patentai | Patents, Verslas | Business ir pažymėtas , , , .Išsisaugokite pastovią nuorodą.

Parašykite komentarą