Kāpēc mākslīgais intelekts cieš no bara domāšanas

Satura rādītājs

Kāpēc lielie valodas modeļi ir tik prognozējami
Kā jaunuzņēmumi cenšas pārraut bara domāšanas loku
Nākotnes perspektīva un secinājumi

⚡ Kopsavilkums:

Lielie valodas modeļi bieži sniedz pārsteidzoši vienādas atbildes. Uzziniet, kā jaunie tehnoloģiju risinājumi cenšas atgriezt radošumu mākslīgajā intelektā.

Mākslīgā intelekta rīki kā ChatGPT, Claude un Gemini ir kļuvuši par ikdienas palīgiem miljoniem speciālistu visā pasaulē. Tie lieliski raksta kodu, apkopo garus tekstus un palīdz veikt pētījumus. Tomēr radošos uzdevumos, kur nepieciešama patiesa oriģinalitāte, šie modeļi bieži vien piedāvā pārsteidzoši vienveidīgas idejas. Šo parādību nozares pētnieki dēvē par mākslīgā intelekta bara domāšanu jeb "kolektīvo prātu" (artificial hivemind).

Jaunākie pētījumi un nozares eksperimenti rāda, ka lielie valodas modeļi (LLM) ir iesprostoti paredzamības cilpā. Par laimi, inovatīvi jaunuzņēmumi jau strādā pie risinājumiem, lai atgrieztu radošumu un daudzveidību mākslīgā intelekta atbildēs.

Kāpēc lielie valodas modeļi ir tik prognozējami

Lai izprastu problēmas mērogu, pietiek veikt vienkāršu eksperimentu. Ja palūgsiet populārākajiem tērzēšanas robotiem nosaukt nejaušu skaitli no 1 līdz 10, lielākajā daļā gadījumu atbilde būs skaitlis 7. Ja jautāsiet nākamo, tas visticamāk būs 3 vai 4. Šī paredzamība nav nejaušība, bet gan pašreizējās AI apmācības metodes sekas.

Kā norāda pētnieki savā zinātniskajā darbā par mākslīgā intelekta homogenitāti, dažādi vadošie pasaules modeļi, saskaroties ar atvērtā tipa jautājumiem, tiecas uz vienādām atbildēm. Kad pētnieki lūdza 25 dažādiem modeļiem uzrakstīt metaforu par laiku, lielākā daļa no 1250 ģenerētajām atbildēm variēja ap frāzēm "Laiks ir upe" vai "Laiks is audējs". Turpretī cilvēku atbildes uz šādu pašu jautājumu bija daudzveidīgas un personiskas.

Šāda vienveidība rodas tādēļ, ka lielie modeļi tiek apmācīti uz līdzīgiem datu kopumiem un tiek optimizēti, lai sniegtu pēc iespējas ticamākas, loģiskākas un drošākas atbildes. Rezultātā sistēma izvēlas statistiski ticamāko ceļu, upurējot unikalitāti.

💡 Kāpēc tas ir svarīgi biznesam

Paredzamība ir izcila īpašība programmēšanā vai faktu pārbaudē, taču tā kļūst par nopietnu šķērsli prāta vētras (brainstorming) sesijās, mārketinga kampaņu plānošanā vai jaunu zīmolu izstrādē.

Kā jaunuzņēmumi cenšas pārraut bara domāšanas loku

Austrālijas jaunuzņēmums Springboards ir radījis alternatīvu modeli Flint, kura mērķis ir piedāvāt plašāku un neparastāku atbilžu klāstu. Tā vietā, lai cīnītos ar mākslīgā intelekta "halucinācijām", šis modelis tās uztver kā radošu resursu.

Tradicionāli modeļu radošumu mēģina palielināt, mainot tā saukto temperatūras (temperature) parametru API uzstādījumos. Tomēr pārāk augsta temperatūra bieži padara modeļa tekstu pilnīgi nesakarīgu vai pat liek tam pēkšņi mainīt valodu teikuma vidū. Piemēram, tipisks temperatūras uzstādījums izskatās šādi:

{
  "model": "gpt-4",
  "prompt": "Izdomā unikālu ideju jaunam produktam",
  "temperature": 0.9
}

Springboards inženieri saprata, ka šāda vispārēja parametru mainīšana ir pārāk raupja metode. Tā vietā viņi apmācīja savu modeli, kura pamatā ir Alibaba atvērtā koda modelis Qwen 3, identificēt konkrētus punktus teikuma struktūrā, kur ir vislielākais potenciāls variācijām, un palielināt nejaušību tikai šajās specifiskajās vietās.

"Flint ir ieprogrammēts piedāvāt negaidītus variantus. Tas ir kā uzaicinājums domāt plašāk un izkāpt no ierastajiem rāmjiem."

Praktiskajā biznesa vidē tas nozīmē pilnīgi citu pieeju. Ja parastie LLM uzdevumā par finanšu pakalpojumu pielāgošanu jauniešiem piedāvā standartizētus risinājumus par finanšu pratības spēļošanu (gamified financial literacy), tad radoši optimizēts modelis spēj piedāvāt pilnīgi jaunu konceptu, piemēram, visas bagātības uzkrāšanas idejas fundamentālu rebrendingu.

Uzņēmumiem, kas meklē unikālu pozicionējumu tirgū, šāda pieeja var sniegt būtisku konkurences priekšrocību. Piemēram, meklējot svaigas idejas jaunai preču zīmei, lielisks palīgs var būt zīmola nosaukumu ģenerators tiešsaistē, kas palīdz izkļūt no ierastajiem rāmjiem un izvairīties no tiem pašiem klišejiskajiem nosaukumiem, ko piedāvā standarta mākslīgā intelekta rīki.

Parametrs	Standarta valodas modeļi (LLM)	Radoši optimizēti modeļi (piem. Flint)
Galvenais fokuss	Faktu precizitāte, drošība, augstākā statistiskā ticamība	Atbilžu daudzveidība, neierasti savienojumi
Uzvedība radošos uzdevumos	Tieksme uz klišejām un biežāk lietotajām metaforām	Apzināta neierastu vārdu un ideju integrācija
Temperatūras kontrole	Vienmērīga visā tekstā (var radīt kļūdas)	Dinamiska un selektīva tikai noteiktos teikuma posmos

⚠️ Tehnoloģijas ierobežojumi

Šādi eksperimentālie modeļi joprojām ir prototipa stadijā. Tie var darboties nestabili, ja tiek noslogoti ar sarežģītiem loģikas uzdevumiem, tādēļ tos ieteicams izmantot tieši radošā procesa sākumposmā.

Nākotnes perspektīva un secinājumi

Kā savā rakstā ziņo MIT Technology Review ziņojumu autori, AI homogenitāte kļūst par arvien apspriestāku tēmu nozares pētnieku vidū. Lai gan standarta modeļi joprojām dominēs ikdienas darbu automatizācijā, specializēti rīki, kas spēj mākslīgi radīt radošu dzirksteli, kļūs par neaizvietojamu palīgu mārketinga, dizaina un stratēģiskās plānošanas profesionāļiem.

Biznesa vadītājiem tas nozīmē, ka nākotnē vairs nepietiks tikai ar viena standarta AI rīka ieviešanu uzņēmumā. Panākumu atslēga būs dažādu modeļu kombinēšana, izmantojot katra stiprās puses attiecīgajā darba posmā.

Kāpēc mākslīgais intelekts cieš no bara domāšanas un kā to mainīt

Kāpēc lielie valodas modeļi ir tik prognozējami

Kā jaunuzņēmumi cenšas pārraut bara domāšanas loku

Nākotnes perspektīva un secinājumi

Saņem nedēļas svarīgākos AI jaunumus

Citi lasītāji lasīja arī šos rakstus:

Anthropic Claude Fable 5 modelis atgriežas ar stingrākiem drošības filtriem

Kā jaunie mākslīgā intelekta domāšanas modeļi maina biznesa tehnoloģiju pasauli