Tehniskā analīze atklāj, kā ChatGPT izmanto slēptus parametrus un ārējos datu skrāpjus informācijas ieguvei. Uzziniet, ko tas nozīmē jūsu uzņēmuma SEO un GEO.
Daudzi mārketinga speciālisti un uzņēmumu vadītāji uzdod vienu un to pašu jautājumu, kā panākt, lai viņu saturs parādītos ChatGPT atbildēs. Līdz šim lielākā daļa padomu balstījās uz minējumiem un vispārīgiem ieteikumiem, piemēram, veidot sarakstus, rakstīt kvalitatīvu saturu vai aktīvāk piedalīties diskusijās platformā Reddit. Tomēr tagad mums ir pieejami precīzi dati par to, kā šis mākslīgā intelekta dzinējs atlasa tīmekļa resursus.
Jaunā pētījumā, par kuru ziņo Search Engine Journal, tika analizēta ChatGPT tīkla datu plūsma, kas paliek aizkulisēs un netiek parādīta lietotājam parastajā saskarnē. Šī tehniskā analīze atklāj, ka ChatGPT izmanto specifiskus klasifikatorus un ārējos pakalpojumus, lai iegūtu informāciju no atklātā tīmekļa.
Aizkulises, kuras neatspoguļo parastā lietotāja saskarne
Atšķirībā no lielajiem pētījumiem, kas analizē tikai gala atbildes un mēģina uzminēt algoritma darbību, šī analīze tika veikta, izmantojot pārlūkprogrammas izstrādātāju rīkus. Tīkla pieprasījumu datu JSON failos tika atklāts slēpts lauks ar nosaukumu result_source. Šis parametrs tiek piešķirts katram tīmekļa avotam, ko ChatGPT izmanto atbildes sagatavošanai.
Lauks result_source tieši norāda, no kurienes un ar kādu metodi dati ir iegūti. ChatGPT nevis vienkārši meklē internetā kā parasts lietotājs, kā to dara klasiskie meklētāji, bet gan izmanto strukturētu un kategorizētu sistēmu, kurā liela loma ir licencētiem partneriem un specializētiem datu skrāpjiem.
Četri galvenie informācijas avotu tipi
Pētījuma laikā tika identificēti četri atšķirīgi avotu tipi, ko izmanto ChatGPT. Tie skaidri parāda, ka OpenAI paļaujas uz dažādu līmeņu sadarbību un tehniskajiem risinājumiem datu ieguvei.
| Avota tips (result_source) | Darbības princips un raksturojums | Pielietojuma piemēri |
|---|---|---|
| serp | Atklātā tīmekļa bāzes meklēšana, ko bieži izmanto aktuālām ziņām un vispārīgiem jaunumiem. | Ziņu portāli, aktuālie notikumi pasaulē. |
| labrador | Licencēts un uzticams izdevēju saraksts. Saturs tiek ņemts no autoritatīviem avotiem. | Reuters, The Guardian, Wikipedia, zinātniskie raksti arXiv. |
| bright | Komerciālais datu ieguves rīks Bright Data. Izmanto dinamiskai un strukturētai informācijai. | E-komercija, preču cenas, finanšu dati, vietējie uzņēmumi. |
| oxylabs | Komerciālais datu ieguves rīks Oxylabs. Izmanto reģionālo un vietējo vietņu skenēšanai. | Vietējā prese, specifiskas reģionālās lapas, atklātais tīmeklis. |
Šo avotu sadalījums parāda, ka OpenAI tiecas pēc maksimālas datu precizitātes un stabilitātes. Piemēram, labrador kategorijas avoti nodrošina ļoti garus teksta fragmentus, kas sasniedz aptuveni 1080 rakstzīmju, kas praktiski nozīmē pilnu rakstu fragmentu nodošanu modelim apstrādei.
Kā izskatās ChatGPT tīkla JSON dati
Tehniskiem speciālistiem var būt interesanti aplūkot, kā tieši izskatās viens datu ieraksts, ko pārlūks saņem no ChatGPT serveriem. Zemāk ir redzams vienkāršots JSON piemērs, kurā skaidri redzams avota marķējums.
{
"attribution": "TechRadar",
"url": "https://www.techradar.com/best/...",
"snippet": "Vērtīgais satura fragments šeit...",
"pub_date": "2026-05-09",
"result_source": "labrador"
}
Ko tas nozīmē uzņēmumiem un SEO speciālistiem
Līdz ar mākslīgā intelekta meklētāju attīstību tradicionālā meklētājprogrammu optimizācija piedzīvo būtiskas pārmaiņas, pāraugot par GEO (Generative Engine Optimization). Ja vēlaties, lai jūsu uzņēmums un pakalpojumi tiktu minēti ChatGPT atbildēs, vairs nepietiek tikai ar parastu atslēgvārdu izmantošanu.
Pirmkārt, autoritatīva satura licencēšana, izmantojot labrador, nozīmē, ka lielie izdevēji un enciklopēdijas joprojām būs galvenais informācijas pamats. Otrkārt, datu skrāpēšanas rīku bright un oxylabs dominance e-komercijā un vietējā meklēšanā norāda uz to, ka jūsu mājaslapai jābūt tehniski viegli nolasāmai un strukturētai. Ja roboti nespēs efektīvi skenēt jūsu vietni, jūs vienkārši netiksiet iekļauti šajos datos.
"Svarīgi ir saprast, ka ChatGPT neizmanto vienu vienotu meklēšanas algoritmu. Tas kombinē licencētus datus ar reāllaika komerciālajiem skrāpjiem, lai nodrošinātu pēc iespējas precīzāku un svaigāku informāciju."
Lai nodrošināti, ka jūsu vietne atbilst visiem šiem jaunajiem tehniskiem un strukturālajiem kritērijiem, tāpēc uzņēmumiem ir svarīgi laikus veikt mājaslapas SEO un GEO analīzi. Tas palīdzēs identificēt un novērst tehniskos šķēršļus, kas traucē AI aģentiem un skrāpjiem nolasīt jūsu saturu.
Jāņem vērā, ka šie secinājumi ir balstīti uz viena lietotāja un viena Pro konta tīkla plūsmas analīzi dažu dienu garumā, galvenokārt tehnoloģiju un programmatūras (SaaS) nišā. Citās nozarēs, piemēram, medicīnā, tiesībās vai modē, avotu un pakalpojumu sniedzēju proporcijas var atšķirties.
Secinājumi un ieteikumi nākotnei
Mākslīgā intelekta meklēšanas vide kļūst arvien strukturētāka un komerciālāka. Lai jūsu uzņēmums paliktu pamanāms, ir jāseko līdzi ne tikai tam, ko rakstāt, bet arī tam, kā jūsu vietne ir tehniski sagatavota datu nolasīšanai. Strukturētie dati, skaidra vietnes shēma un tehniski optimizēts kods ir pamatnosacījumi, lai iekļūtu to komerciālo skrāpju redzeslokā, uz kuriem paļaujas OpenAI savā ikdienas darbībā.