Kopsavilkums:

Uzziniet, kā Google DeepMind jaunā meklēšanas un spriestspējas metode jeb Sistēmas 2 domāšana maina mākslīgā intelekta attīstību un pielietojumu biznesā.

Mākslīgā intelekta attīstība ir sasniegusi kritisku pagrieziena punktu. Līdz šim lielie valodas modeļi (LLM), piemēram, GPT-4 vai Gemini, ir darbojušies, paļaujoties uz tūlītēju statistisko prognozēšanu – tie paredz nākamo vārdu, balstoties uz milzīgiem datu apjomiem. Tomēr šai pieejai trūkst patiesas spriestspējas un plānošanas spēju. Google DeepMind pētnieki ir izstrādājuši fundamentāli jaunu metodi, kas ļauj mākslīgajam intelektam pirms atbildes sniegšanas mērķtiecīgi "domāt", plānot un labot savas kļūdas.

Pāreja no ātrās intuīcijas uz lēno un mērķtiecīgo domāšanu

Lai izprastu šo tehnoloģisko lēcienu, ir noderīgi vilkt paralēles ar cilvēka kognitīvajiem procesiem. Nobela prēmijas laureāts Daniels Kānemans savā darbā apraksta divas cilvēka domāšanas sistēmas:

  • Sistēma 1 (ātrā domāšana): Intuitīva, automātiska un zibenīga reakcija (piemēram, dzimtās valodas lietošana vai vienkārša saskaitīšana).
  • Sistēma 2 (lēnā domāšana): Apzināta, loģiska un strukturēta analīze (piemēram, sarežģīta uzdevuma risināšana vai šaha partijas plānošana).

Līdz šim mākslīgais intelekts ir darbojies gandrīz tikai Sistēmas 1 režīmā. Tas ģenerē tekstu sekunžu laikā, taču nespēj apturēt savu darbību, ja saprot, ka ir pieļāvis loģisku kļūdu teikuma sākumā. Kā skaidrots Google DeepMind pētījumiem veltītajā video materiālā, jaunā pieeja integrē Sistēmas 2 spriedumu pieņemšanu pašā modeļa darbības pamatā.

Sistēmas 1 un Sistēmas 2 salīdzinājums mašīnmācīšanās modeļos

Šī tabula uzskatāmi parāda, kā tradicionālā teksta ģenerēšana atšķiras no jaunās DeepMind meklēšanas un spriestspējas metodes.

Parametrs Tradicionālie LLM (Sistēma 1) Jaunā meklēšanas metode (Sistēma 2)
Darbības princips Nākamā vārda prognozēšana sekundes daļās. Alternatīvu risinājumu meklēšana un koku struktūras plānošana.
Pašlabošanās spēja Nespēj labot pieļautās kļūdas tekošās ģenerēšanas laikā. Aktīvi novērtē starprezultātus un atkāpjas, ja atrasta kļūda.
Skaitļošanas jauda Fiksēta jauda uz vienu vaicājumu. Dinamiska jauda – sarežģītākiem uzdevumiem tērē vairāk resursu.
Galvenais pielietojums Tekstu rakstīšana, tulkošana, radošais saturs. Matemātika, programmēšana, zinātniski pētījumi, loģika.

Kā darbojas meklēšanas un plānošanas algoritmi izpildes laikā

Jaunās metodes pamatā ir jēdziens "izpildes laika skaitļošana" (inference-time compute). Tā vietā, lai tērētu milzīgus resursus tikai modeļa trenēšanai pirms tā palaišanas, daļa no skaitļošanas jaudas tiek pārcelta uz brīdi, kad lietotājs uzdod jautājumu.

DeepMind izmanto līdzīgus principus, kādus tie iepriekš sekmīgi demonstrēja ar vēsturisko AlphaGo sistēmu. Kad modelim tiek uzdots sarežģīts loģisks uzdevums, tas nevis vienkārši uzraksta pirmo atbildi, kas ienāk "prātā", bet gan:

  1. Ģenerē vairākas iespējamās risinājuma trajektorijas (izveido "domu koku").
  2. Novērtē katra soļa ticamību un pareizību.
  3. Ja kāds ceļš noved pie pretrunas, modelis veic tūlītēju atkāpšanos (backtracking) un mēģina citu risinājumu.
  4. Apvieno veiksmīgākos soļus, lai sniegtu matemātiski vai loģiski pamatotu gala atbildi.
💡 Svarīgi: Skaitļošanas likumu maiņa
Šis solis iezīmē jaunu ēru mākslīgā intelekta attīstībā. Tā vietā, lai tikai palielinātu modeļu parametru skaitu trenēšanas fāzē, izstrādātāji tagad var panākt labākus rezultātus, gudrāk izmantojot skaitļošanas jaudu brīdī, kad lietotājs uzdod jautājumu.
"Lielākais izaicinājums vairs nav mākslīgā intelekta modeļa fiziskais izmērs, bet gan tas, kā mēs tam ļaujam strukturēt savu domāšanas procesu un meklēt alternatīvas pirms atbildes sniegšanas."

Ietekme uz biznesa procesiem un tehnoloģiju attīstību

Šai tehnoloģijai ir milzīga praktiska nozīme nozarēs, kurās kļūdas cena ir kritiski augsta. Piemēram, finansēs, tiesību zinātnē un medicīnas diagnostikā parastie valodas modeļi bieži saskaras ar "halucinācijām" – pārliecinoši formulētiem, bet nepatiesiem apgalvojumiem. DeepMind jaunā meklēšanas arhitektūra var radikāli samazināt šīs kļūdas, jo katrs apgalvojums tiek pārbaudīts pirms tā parādīšanas ekrānā.

Lai gan šie akadēmiskie modeļi vēl attīstās, ikdienas darbu optimizācijai jau šodien ir pieejami praktiskāki risinājumi, un šos procesus palīdz automatizēt mākslīgā intelekta asistenti uzņēmumiem, kas nodrošina tūlītēju efektivitātes pieaugumu standarta biznesa operācijās.

⚠️ Ierobežojumi un resursu patēriņš
Sistēmas 2 domāšana prasa ievērojami vairāk laika un skaitļošanas resursu. Sarežģīta uzdevuma analīze var aizņemt no vairākām sekundēm līdz pat minūtēm. Tādēļ šī metode pagaidām nav piemērota vienkāršiem ikdienas vaicājumiem, kur svarīga ir ātra reakcija.

Sistēmas ierobežojumi un nākotnes perspektīvas

Neskatoties uz milzīgo progresu, nozare vēl joprojām risina efektivitātes jautājumus. Skaitļošanas jauda izpildes laikā maksā naudu. Tomēr, optimizējot algoritmus, šīs izmaksas laika gaitā neizbēgami samazināsies. DeepMind un citu vadošo laboratoriju mērķis ir radīt hibrīdas sistēmas, kas automātiski spēj noteikt, kad vaicājums ir vienkāršs (un pietiek ar ātro Sistēmu 1), un kad nepieciešams pieslēgt jaudīgo Sistēmas 2 domāšanas mehānismu. Šāda elastība ļaus uzņēmumiem maksimāli lietderīgi izmantot AI resursus, neradot nevajadzīgus tēriņus.