Pirmo reizi mākslīgais intelekts sakauj pasaulē labākos krustvārdu mīklu risinātājus

Krustvārdu mīklu risināšana ir ļoti iecienīts hobijs daudziem cilvēkiem pasaulē, un aizrautīgākie fani ar to nodarbojas jau ļoti augstā līmenī, piedaloties vērienīgos mačos. Vienas no prestižākajām krustvārdu mīklu sacensībām pasaulē ir ikgadējais Amerikas Krustvārdu mīklu turnīrs. Mākslīgā intelekta algoritmi ir pārspējuši cilvēku daudzviet – gan šahā, gan "Go" spēlē un citās –, taču ne krustvārdu mīklu risināšanā. Līdz šim.

Labākais rezultāts, ko iepriekš mākslīgais intelekts bija spējis uzrādīt Amerikas Krustvārdu mīklu turnīrā, bija cienījamā 11. vieta 2017. gadā, konkurējot ar sešiem simtiem spējīgāko krustvārdu mīklu risinātāju. Toreiz turnīrā datoru godu pārstāvēja programma "Dr. Fils" (vārdu spēle, "to fill" no angļu valodas – aizpildīt, tostarp teksta lauku).

Pērn notikušajā čempionātā pirmo reizi vēsturē digitālais erudīts pārspēja pilnīgi visus 1100 dalībniekus un izcīnīja pirmo vietu. Tas izdevās Kalifornijas Universitātes Bērklijā datorzinātnieku būvētam algoritmam "Berkeley Crossword Solver".

Nu programmatūras izstrāde un darbības principi ir izklāstīti pētījumā, kas pieejams pirmsdrukas resursā "arXiv".

Šis nav vienkāršs uzdevums. Kaut arī, piemēram, šahā ir milzumdaudz iespējamo kombināciju, darbs ar atvērtu tekstu un dažādi noformētiem jautājumiem ir pavisam cita līmeņa izaicinājums mākslīgajam neironu tīklam. Cilvēki lieliski tiek galā gan ar tiešiem jautājumiem, gan anagrammām, gan jautājumiem, kur nepieciešama izpratne par aprakstītā būtību un likumsakarībām.

Datorprogrammai toties dažādi noformulētiem jautājumiem jāpiemēro dažādas pieejas risinājuma rašanai. "Savannā dzīvojošs zīdītājs ar ilkņiem" – tas būs, piemēram, vai nu zilonis, vai kārpu cūka – atkarībā no dotā teksta laukuma un jau dotajiem burtiem, ja tādi ir. Taču jautājums, kas noformulēts šādi: "Vieninieks, kam seko nekas," paģēr pavisam citu izpratni. Atbilde šajā gadījumā ir "desmit", bet datorprogrammai jāsaprot, ka ar "nekas" ir domāta nulle, nevis, piemēram, "tukšums", kā arī ka atbilde nav "viens nulle", bet "desmit". Un šie ir tikai daži piemēri no daudzām variācijām, kā krustvārdu mīklās var tikt noformulēti jautājumi, kuru nianses un atšķirības cilvēkam caurmērā uztvert un izprast ir vieglāk nekā pat pašām labākajām mākslīgā intelekta programmām.

Kalifornijas Universitātes zinātnieku izstrādātais algoritms tika cītīgi trenēts ar milzīgu datu kopu – sešiem miljoniem jautājumu un atbilžu pāru no krustvārdu mīklām pēdējo 70 gadu laikā. Vispirms šis algoritms atlasa uz katru jautājumu vairākus atbilžu kandidātus un piešķir tiem punktus, sarindojot pēc ticamības, cik atbilstoša varētu būt katra no atbildēm. Pēc tam algoritms savada vārdus dotajos teksta laukos. Šis process ir sarežģīts, jo, izvēloties atbildes pēc augstākās ticamības, tāpat gandrīz nekad nebūs uzreiz viens perfekto atbilžu komplekts, kur viss sakrīt. Procesā rodas virkne konfliktu un nesakritību, tādējādi atbildes ir jāmaina, līdz tiek sasniegta pēc iespējas labāka pārklāšanās, proti, vārdi vislabāk sader ar citiem. Pēc tam algoritms aizpildīto mīklu pārskata vēlreiz, veicot nelielus labojumus, un atkārto šo procesu, līdz vairs nekādi uzlabojumi nav iespējami.

Rezultāts ir labs, taču ne perfekts. Algoritma precizitāti komanda mērīja, liekot tam risināt "The New York Times" mīklas, kur programma uzrādīja 82 procentu precizitāti. Labs kāpums salīdzinājumā pret iepriekš labāko mākslīgā intelekta sniegumu, kas bija 57 procenti.

Taču arī šis krustvārdu mīklu risinātājs nav universāls ģēnijs – kā jau liela daļa mākslīgā intelekta algoritmu pašlaik, tas pielāgots specifiskam uzdevumam un tiek galā ar noteiktā veidā sastādītām krustvārdu mīklām, bet ne citām. Pagaidām vairumā krustvārdu mīklu cilvēki vēl "pārsit" mākslīgo intelektu, taču grūti teikt, cik ilgi vēl tā būs.

Seko "Delfi" arī Instagram vai YouTube profilā – pievienojies, lai uzzinātu svarīgāko un interesantāko pirmais!

Publikācijas saturs vai tās jebkāda apjoma daļa ir aizsargāts autortiesību objekts Autortiesību likuma izpratnē, un tā izmantošana bez izdevēja atļaujas ir aizliegta. Vairāk lasi šeit