Google DeepMind brīdina par lieliem drošības riskiem, ieviešot autonomus mākslīgā intelekta aģentus atvērtā tīmekļa vidē.
Autonomie mākslīgā intelekta (AI) aģenti, kas spēj patstāvīgi pārlūkot tīmekli, pieņemt lēmumus un veikt darījumus lietotāju vārdā, tiek uzskatīti par nākamo lielo tehnoloģiju attīstības posmu. Tomēr vadošie pētnieki brīdina, ka šo sistēmu masveida palaišana reālajā pasaulē pašlaik ir pāragra un saistīta ar nopietniem kiberdrošības riskiem.
Kā intervijā skaidro Google DeepMind vadošais pētnieks Nenads Tomaševs, par ko ziņo Search Engine Journal, ļaundari tīmeklī jau šobrīd aktīvi izvieto slazdus, kuru mērķis ir pārņemt kontroli pār autonomajiem aģentiem, izkrāpt finanšu līdzekļus un apiet modeļu drošības ierobežojumus.
Kāpēc mērogošana palielina kļūdu risku
Pētnieks norāda uz vienkāršu statistikas likumsakarību - ja atsevišķa sistēmas interakcija nav simtprocentīgi droša un uzticama, tad, palielinoties darbību apjomam tīmeklī, kļūdas vai sistēmas kompromitēšanas varbūtība strauji tuvojas neizbēgamībai. Ņemot vērā lielo skaitļošanas jaudu un enerģiju, ko patērē šie modeļi, jebkura sistēmiska kļūda rada arī milzīgus finansiālus zaudējumus uzņēmumiem.
Ja nav nodrošināta pilnīga atsevišķu interakciju uzticamība, jebkura sistēma lielā mērogā, kurā ir daudz interakciju, statistiski piedzīvos neveiksmi. Tā kā šīs sistēmas patērē daudz skaitļošanas jaudas, enerģijas un naudas, to neuzticamība padara masveida palaišanu par neiespējamu misiju.
Drošas darbības pamata problēma ir vide, kurā šie aģenti darbojas. Šī vide ir globālais tīmeklis, kas pēc savas būtības nav uzticama vai kontrolēta vide. Atšķirībā no laboratorijas testiem, reālajā internetā uzbrucēji var viegli saindēt vidi, kurā aģents meklē informāciju.
Trīs bīstamākie aģentu slazdi tīmeklī
Tomaševs aprakstīja vairākas metodes, kā ļaundari spēj manipulēt ar mākslīgā intelekta sistēmām, pašam lietotājam to pat neapzinoties. Šīs metodes vizuāli nav redzamas parastam tīmekļa vietnes apmeklētājam, taču tās tieši ietekmē AI modeļu darbību.
- Slēptie marķieri (Hidden tokens): Tīmekļa lapas saturā tiek iestrādāti vizuāli neredzami teksta elementi. Tā kā AI aģents lasa lapas izejas kodu (raw format), nevis vizuālo attēlu kā cilvēks, tas patērē šos slēptos norādījumus un var mainīt savu uzvedību vai izpildīt komandas, kas ir pretrunā ar lietotāja interesēm.
- Dinamiskā maskēšana (Dynamic cloaking): Vietne spēj identificēt, vai tās apmeklētājs ir cilvēks vai AI aģents. Ja vietnei piekļūst aģents, saturs tiek dinamiski mainīts, lai provocētu kļūdu vai piespiestu aģentu veikt nevēlamas darbības.
- Drošības sistēmu apiešana (Jailbreaking): Lapās tiek integrēts saturs, kura vienīgais mērķis ir pārliecināt aģentu ignorēt tā drošības protokolus un nodot sensitīvu informāciju vai veikt neatļautus darījumus.
| Uzbrukuma veids | Mērķis tīmeklī | Kā tas darbojas |
|---|---|---|
| Slēptie marķieri (Hidden tokens) | Mākslīgā intelekta aģenti | Neredzams teksts lapas kodā, ko nolasa tikai AI aģents, mainot savu mērķi. |
| Dinamiskā maskēšana (Dynamic cloaking) | AI aģenti un cilvēki | Lapas saturs tiek parādīts atšķirīgi cilvēkiem un robotiem, lai apmānītu sistēmas. |
| Drošības apiešana (Jailbreaking) | LLM sistēmas un aģenti | Manipulatīvas instrukcijas tīmekļa lapā, kas liek aģentam ignorēt tā ierobežojumus. |
Reālie finanšu riski uzņēmumiem
DeepMind pārstāvis apstiprina, ka šādi uzbrukumi vairs nav tikai teorētisks apdraudējums. Jau šobrīd ir fiksēti gadījumi, kad eksperimentālie AI aģenti, kuriem dota piekļuve digitālajiem makiem vai norēķinu kartēm, ir tikuši apmānīti un ir zaudējuši lietotāju naudu.
Kamēr tiek izstrādāti drošāki standarti, uzņēmumiem ir kritiski svarīgi apzināties, kā šīs tehnoloģijas tiek integrētas. Šobrīd mākslīgā intelekta asistenti uzņēmumiem spēj efektīvi veikt slēgtus un kontrolētus uzdevumus, taču pilnīga autonomija atvērtā tīmeklī rada pārmērīgus drošības riskus.
Līdzko mākslīgā intelekta aģentam tiek dota piekļuve finanšu makiem vai uzņēmuma iekšējām datubāzēm, jebkurš sekmīgs uzbrukums ārējā tīmekļa vietnē var izraisīt neatgriezeniskus finanšu un datu zaudējumus.
Šobrīd drošākais veids, kā izmantot autonomas AI sistēmas, ir to darbība stingri ierobežotā un kontrolētā vidē (tā sauktajā smilškastē vai sandbox), kur tām nav tiešas un nekontrolētas piekļuves ārējam tīmeklim.
Secinājums
Tehnoloģiju uzņēmumiem strauji attīstot AI aģentu risinājumus, pieaug arī hakeru un krāpnieku motivācija radīt jaunus uzbrukumu veidus. Līdzīgi kā operētājsistēmas vai satura vadības platformas, arī mākslīgā intelekta sistēmas kļūst par galveno mērķi uzreiz pēc tam, kad tās sasniedz plašu lietotāju loku. Drošības arhitektūras pilnveidošana būs noteicošais faktors tam, kad un kā mēs pieredzēsim pilnībā autonomu AI aģentu ikdienas izmantošanu.