Google Lighthouse 13.3.0 versijā ieviestais "Agentic Browsing" rīks pārbauda llms.txt failu esamību, taču uzrāda kļūdu, ja saitēm netiek izmantota precīza Markdown sintakse. Pat pilnībā strādājošas parastā teksta saites tiks uzskatītas par kļūdu, ja vien tās netiks noformētas ar kvadrātiekavām un apaļajām iekavām.
Google rīka Lighthouse jaunākajā 13.3.0 versijā ir iekļauta jauna audita kategorija "Agentic Browsing", kas pārbauda tīmekļa vietnes gatavību autonomo aģentu pārlūkošanai. Šis atjauninājums rada negaidītas problēmas tīmekļa izstrādātājiem. Rīks uzrāda kļūdu llms.txt failu pārbaudē, ja tajos esošās saites nav noformētas striktā Markdown sintaksē.
Jaunās prasības tīmekļa vietņu failu struktūrai
Kas ir llms.txt fails? Tas ir tīmekļa vietnes saknes direktorijā izvietots teksta fails, kas sniedz standartizētu informāciju mākslīgā intelekta valodas modeļiem un aģentiem par lapas saturu un svarīgākajām saitēm. Šāds fails palīdz sistēmām ātrāk saprast vietnes struktūru un atrast vajadzīgos datus.
Kā novērojis tīmekļa optimizācijas eksperts Slobodans Maničs (Slobodan Manic), kura pieredze aprakstīta nozares izdevumā Search Engine Journal, pat pilnībā strādājošas un precīzas saites parastā teksta formātā Lighthouse testā tiek noraidītas. Analizators uzskata, ka failā nav nevienas saites, un piešķir negatīvu vērtējumu.
Tas notiek tādēļ, ka llms.txt specifikācija paredz satura marķēšanu ar Markdown. Lighthouse rīks šo nosacījumu interpretē ļoti burtiski. Ja fails satur tīra teksta saites bez speciālā marķējuma, tests būs negatīvs.
Atšķirība starp teksta formātu un Markdown sintaksi
Tehniski kļūda rodas no tā, kā rīks analizē failu. Vienkāršs saraksts ar saitēm vairs nav pietiekams. Aplūkosim abas faila versijas.
Sākotnējais fails, kas izraisīja negatīvu audita rezultātu:
- Homepage: / - Sākumlapa un jaunākie raksti
- Articles: /blog - Visi bloga raksti
- Episode: /episode/[slug] - Audio ierakstiLai atrisinātu šo problēmu, katra saite ir jāiekļauj Markdown formātā, un domuzīme pirms apraksta jāaizstāj ar kolu:
- [Homepage](/): Sākumlapa un jaunākie raksti
- [Articles](/blog): Visi bloga raksti
- [Episode](/episode/[slug]): Audio ierakstiŠo divu formātu salīdzinājums palīdz saprast, cik niansēta ir jaunā pārbaude.
| Parametrs | Vienkāršs teksts (Plain Text) | Markdown formāts (Lighthouse prasība) |
|---|---|---|
| Saites pieraksts | /blog | [Raksti](/blog) |
| Atdalītājsimbols | Defise vai domuzīme (-) | Kols (:) |
| Lighthouse tests | Neiziet (0 saites atrasts) | Iziet (100% rezultāts) |
| Faila tips serverī | text/plain | text/plain |
Lai gan faila paplašinājums joprojām ir .txt un serveris to nodod kā parastu tekstu, Lighthouse analizators to vērtē kā Markdown dokumentu. Tāpēc formātam ir pilnībā jāatbilst standartam.
Pirms uzsākt tehniskos uzlabojumus un pielāgot vietni jauno aģentu prasībām, ir vērts izvērtēt kopējo vietnes tehnisko stāvokli un redzamību meklētājos. Lai noskaidrotu vietnes pašreizējo statusu, ieteicams veikt pilnu mājaslapas SEO auditu, kas palīdzēs identificēt gan klasiskās SEO kļūdas, gan jaunos GEO izaicinājumus.
Mehāniskā atbilstība pret satura kvalitāti
Eksperti norāda uz interesantu paradoksu. Daudzi populāri spraudņi automātiski ģenerē šos failus ar Markdown sintaksi. Šādas automātiski veidotas lapas testu izies bez problēmām. Savukārt rūpīgi un manuāli veidoti faili, kurus vietnes īpašnieki ir pielāgojuši labākai vizuālai lasāmībai, bieži vien izgāžas tikai tādēļ, ka tajos nav izmantots Markdown saišu pieraksts. Tas parāda, ka rīks šobrīd mēra tikai mehānisko atbilstību sintaksei, nevis paša faila satura lietderību.
Faila formāta atbilstība nav tas pats, kas faila satura kvalitāte. Labs un detalizēts fails, kas uzrakstīts vienkāršā tekstā, testā izgāzīsies, turpretim automātiski ģenerēts, virspusējs fails ar pareizo sintaksi saņems maksimālo vērtējumu.
Latvijas uzņēmumiem, kas vēlas, lai viņu saturu precīzi nolasa un citē jaunie mākslīgā intelekta meklētāji, ieteicams jau tagad izveidot un publicēt llms.txt failu vietnes saknes mapē. Pārliecinieties, ka visas saites ir noformētas kā Markdown saraksts ar kolu kā atdalītāju. Tas neprasa daudz resursu, bet nodrošina, ka jūsu mājaslapa būs tehniski saprotama un gatava jaunās paaudzes pārlūkiem un meklēšanas aģentiem.
Biežāk uzdotie jautājumi (FAQ)
Kas ir llms.txt fails un kāpēc tas ir vajadzīgs?
Tas ir teksta fails tīmekļa vietnes galvenajā direktorijā, kas palīdz lielajiem valodas modeļiem un mākslīgā intelekta aģentiem ātri saprast vietnes saturu un struktūru. Tas kalpo kā ceļvedis meklēšanas robotiem.
Kāpēc mana vietne neiziet Lighthouse llms.txt pārbaudi, lai gan fails eksistē?
Lighthouse parsētājs pieprasa, lai visas saites failā būtu noformētas striktā Markdown sintaksē [Saites nosaukums](url). Ja saites ir norādītas kā vienkāršs teksts, tests uzskatīs, ka failā saišu nav.
Kādas vēl pārbaudes ir iekļautas Lighthouse Agentic Browsing kategorijā?
Papildus llms.txt pārbaudei tur ir iekļauti testi par vietnes pieejamības koka pareizību (agent-accessibility-tree), izkārtojuma stabilitāti (cumulative-layout-shift) un vairākas WebMCP standartu pārbaudes.