OpenAI sadarbībā ar Broadcom ir prezentējis savu pirmo specializēto secināšanas mikroshēmu Jalapeno, lai samazinātu izmaksas un optimizētu veiktspēju.
Mākslīgā intelekta nozarē norisinās būtiskas pārmaiņas, kas saistītas ar pāreju no universāliem tehnoloģiju risinājumiem uz specializētu aparatūru. OpenAI ir spēris nozīmīgu soli savas infrastruktūras neatkarības virzienā, iepazīstinot ar savu pirmo pašu izstrādāto mikroshēmu Jalapeno (Jalapeño). Šis procesors ir tapis ciešā sadarbībā ar pusvadītāju gigantu Broadcom un ir īpaši pielāgots mākslīgā intelekta secināšanas (inference) procesiem.
Kā ziņo TechCrunch, jaunā mikroshēma ir solis pretim tam, lai mazinātu atkarību no Nvidia ražotajiem grafiskajiem procesoriem (GPU), kas pašlaik dominē tirgū un rada ievērojamas izmaksas lielajiem AI uzņēmumiem.
Interesanti, ka Jalapeno mikroshēmas izstrādes procesā tika izmantoti paša OpenAI radītie mākslīgā intelekta modeļi. Tas iezīmē jaunu ēru tehnoloģiju attīstībā, kur programmatūra aktīvi palīdz projektēt un optimizēt nākamo paaudžu fizisko aparatūru.
Kāpēc tieši Jalapeno un secināšanas optimizācija?
Mākslīgā intelekta darbība pamatā sastāv no divām fāzēm - apmācības (training) un secināšanas (inference). Kamēr apmācībai nepieciešama milzīga skaitļošanas jauda, ko joprojām nodrošinās tradicionālie GPU, secināšana ir process, kurā jau apmācīts modelis atbild uz lietotāju ikdienas vaicājumiem reāllaikā. Optimizējot tieši secināšanas fāzi, uzņēmums var būtiski samazināt ekspluatācijas izmaksas.
Kamēr tehnoloģiju giganti koncentrējas uz milzīgu datu centru būvniecību, praktiskajā biznesa līmenī ikdienas procesus jau tagad palīdz optimizēt mākslīgā intelekta asistenti uzņēmumiem, padarot sarežģītu uzdevumu veikšanu daudz pieejamāku un lētāku bez nepieciešamības investēt miljoniem eiro savā aparatūrā.
OpenAI prezidents Gregs Brokmens uzņēmuma podkāstā skaidroja uzņēmuma pieeju - Mēs ļoti labi izprotam mūsu darba slodzi. Mēs esam meklējuši specifiskas darba slodzes, kuras pašlaik netiek pietiekami labi apkalpotas, un domājuši, kā mēs varam uzbūvēt kaut ko tādu, kas paātrinātu iespējamo.
| Parametrs | OpenAI Jalapeno | Tradicionālie AI GPU (piemēram, Nvidia) |
|---|---|---|
| Galvenais uzdevums | Secināšana (Inference) un reāllaika vaicājumi | Universāls pielietojums (apmācība un secināšana) |
| Energoefektivitāte | Ļoti augsta, optimizēta konkrētiem algoritmiem | Vidēja līdz augsta, pielāgota plašam uzdevumu lokam |
| Izmantošanas joma | Koda ģenerēšana, ātras teksta atbildes | Lielo valodas modeļu sākotnējā apmācība |
| Finansiālais efekts | Samazina tekošās lietošanas izmaksas lietotājiem | Augstas uzturēšanas un iegādes izmaksas |
Ietekme uz biznesa vidi un nākotnes ekonomiku
Pāreja uz pašu izstrādātām mikroshēmām ļauj OpenAI optimizēt visu tehnoloģiju infrastruktūru - no mikroshēmu arhitektūras un atmiņas sistēmām līdz pat gala lietotāja pieredzei. Šāda vertikālā integrācija nozīmē, ka modeļi kļūs ne tikai ātrāki un uzticamāki, bet arī finansiāli pieejamāki gala patērētājiem un uzņēmumiem, kas tos integrē savos produktos.
Lai gan pirmie testu rezultāti rāda izcilu veiktspēju uz vienu vatu, Jalapeno joprojām atrodas testēšanas stadijā. Pāreja uz pilnībā neatkarīgu ražošanas un piegādes ķēdi prasīs gadus, tāpēc tuvākajā nākotnē uzņēmums joprojām būs daļēji atkarīgs no ārējiem partneriem.
Kopumā OpenAI solis norāda uz skaidru virzienu nozarē - nākotnē uzvarēs tie uzņēmumi, kuri spēs nodrošināt visaugstāko energoefektivitāti un viszemākās izmaksas par vienu vaicājumu. Uzņēmējiem šis ir signāls, ka AI risinājumu integrācija kļūs arvien izdevīgāka un ekonomiski pamatotāka.