Google का नया लाइटहाउस “एजेंट ब्राउजिंग” ऑडिट अब llms.txt फ़ाइल की उपस्थिति की जाँच करता है। नया प्रयोगात्मक लाइटहाउस दस्तावेज़ीकरण llms.txt को एआई एजेंटों के लिए खोज योग्यता और दक्षता संकेत के रूप में फ्रेम करता है, न कि पारंपरिक क्रॉलिंग निर्देश के रूप में।
- ऑडिट क्रोम की उभरती हुई “एजेंट ब्राउजिंग” श्रेणी का हिस्सा है, जो मूल्यांकन करता है कि साइटें मशीन इंटरैक्शन के लिए संरचित हैं या नहीं।
- यह दस्तावेज़ Google द्वारा AI अवलोकन और AI मोड जैसी AI खोज सुविधाओं के अनुकूलन पर नए मार्गदर्शन प्रकाशित करने के एक सप्ताह से भी कम समय बाद आया है, जिसमें उसने कहा था कि आपको इसके नए मिथक खंड में llms.txt फ़ाइलों की आवश्यकता नहीं है।.
लाइटहाउस अब क्या जाँचता है।Google के दस्तावेज़ के अनुसार, लाइटहाउस की एजेंट ब्राउजिंग श्रेणी नियतात्मक ऑडिट का उपयोग करके “मशीन इंटरैक्शन के लिए आपकी साइट कितनी अच्छी तरह बनाई गई है” का मूल्यांकन करती है। जाँचों के बीच:
- वेबएमसीपी एकीकरण.
- अभिगम्यता वृक्ष अखंडता.
- सीएलएस के माध्यम से लेआउट स्थिरता।
- llms.txt फ़ाइल की उपस्थिति.
लाइटहाउस “डोमेन रूट पर मशीन-पठनीय सारांश की उपस्थिति” की जाँच करता है। Google ने यह भी बताया कि एजेंटों के लिए फ़ाइल क्यों मायने रखती है:
“llms.txt के बिना, एजेंट साइट की उच्च-स्तरीय संरचना और प्राथमिक सामग्री को समझने के लिए साइट को क्रॉल करने में अधिक समय व्यतीत कर सकते हैं।”
ऑडिट श्रेणी पारंपरिक लाइटहाउस स्कोर (0-100) उत्पन्न नहीं करती है। इसके बजाय, Google एजेंटिक तत्परता संकेतों से जुड़े पास/असफल जांच के साथ एक आंशिक पास अनुपात पेश करता है।
तनाव.नया लाइटहाउस दस्तावेज़ आपकी वेबसाइट को जेनेरिक एआई सुविधाओं के लिए अनुकूलित करने की Google की सलाह से सीधे तौर पर टकराता नहीं है क्योंकि ये ऑडिट एआई एजेंटों और ब्राउज़र टूल पर ध्यान केंद्रित करते हैं, न कि Google खोज रैंकिंग पर। फिर भी, क्रोम की स्वयं की तैयारी जांच में उल्लिखित llms.txt को देखने से कुछ एसईओ फ़ाइल के बारे में पहले के संदेह पर पुनर्विचार कर सकते हैं।
एजेंटिक इंजन अनुकूलन.लाइटहाउस ऑडिट भी Google क्लाउड AI इंजीनियरिंग निदेशक एडी उस्मानी द्वारा अप्रैल में बताए गए विचारों के अनुरूप हैउस्मानी ने कहा कि सीमित संदर्भ विंडो वाले एआई एजेंट लंबे पृष्ठों को काट सकते हैं या सामग्री में बहुत गहराई में दबी हुई महत्वपूर्ण जानकारी को मिस कर सकते हैं। उनकी सिफ़ारिशों में:
- स्वच्छ अर्थपूर्ण संरचना.
- टोकन-कुशल सामग्री.
- मार्कडाउन डिलीवरी।
- llms.txt खोज परतें।
- AGENTS.md जैसी क्षमता सिग्नलिंग फ़ाइलें।
SEO बनाम llms.txt.यहां बिल्कुल वही है जो Google सुझाता है:
- LLMS.txt फ़ाइलें और अन्य “विशेष” मार्कअप: आपको जेनरेटिव एआई खोज में प्रदर्शित होने के लिए नई मशीन पठनीय फ़ाइलें, एआई टेक्स्ट फ़ाइलें, मार्कअप या मार्कडाउन बनाने की आवश्यकता नहीं है। ध्यान दें कि Google किसी वेबसाइट पर HTML के अलावा कई प्रकार की फ़ाइलों को खोज, क्रॉल और अनुक्रमित कर सकता है: इसका मतलब यह नहीं है कि फ़ाइल को एक विशेष तरीके से व्यवहार किया जाता है।
यहां Google के जॉन म्यूएलर ने Google द्वारा llms.txt का उपयोग करने के बारे में क्या कहा हैब्लूस्काई पर उनसे पूछते हुए “अरे @johnmu.com – यदि आप उत्तर दे सकते हैं, तो बहुत से लोग इस विडंबना की ओर इशारा कर रहे हैं कि Google LLMs.txt फ़ाइलों, साथ ही मार्कडाउन पेजों का उपयोग करता है, जबकि यह भी कहा जाता है कि खोज में प्रदर्शन के लिए इन चीजों की आवश्यकता नहीं है। क्या आप बता सकते हैं कि Google इन फ़ाइलों को क्यों प्रकाशित कर सकता है, यदि एजेंटों के लिए उन पृष्ठों/साइटों को क्रॉल करना आसान नहीं है? (मुझे यकीन है कि मुझे जल्द ही यह प्रश्न मिलेगा!)”:
संक्षिप्त उत्तर यह है कि यह खोज के लिए नहीं किया गया है। वेबसाइटों में सिर्फ SEO के अलावा और भी बहुत कुछ है :-)।
लंबा और सूक्ष्म संस्करण यह है कि “खोज” (वैश्विक खोज इंजन के साथ वेबसाइट या पेज ढूंढना) बनाम “कार्यक्षमता” को अलग करना उचित है (इसके लिए संभवतः एक अधिक सटीक शब्द है, लेकिन मूल रूप से: एक बार जब किसी को पृष्ठ मिल जाता है, तो उन्हें उस कार्य को सर्वोत्तम तरीके से करने में मदद मिलती है जो वे करना चाहते हैं)।
शायद यह पारंपरिक पृष्ठों पर CTA के समान है? आप एसईओ (पाए जाने के लिए) के लिए उन्हें “नहीं” करते हैं, लेकिन यदि आप समग्र रूप से वेबसाइट के लिए ज़िम्मेदार हैं, तो उच्च रूपांतरण दर के साथ उच्च “खोज दर” (एसईओ) सुनिश्चित करना आपके काम को उचित ठहराने के लिए उपयोगी है।
Developers.google.com साइट पर वापस जाने के लिए, AI कोडिंग बहुत लोकप्रिय हो गई है, और ये कोडिंग सिस्टम उनके द्वारा उत्पादित कोड के साथ कुशल और सटीक हो सकते हैं (मुझे लगता है) यदि वे डेवलपर दस्तावेज़ीकरण जैसी संदर्भ सामग्री को आसानी से पढ़/पार्स कर सकते हैं।
उन मामलों में, यह उन्हें उस दस्तावेज़ के संदर्भ को समझने का एक तरीका देने में मदद कर सकता है जिसे वे देख रहे हैं, साथ ही संदर्भ पृष्ठ का एक सरलीकृत संस्करण (उदाहरण के लिए, मार्कडाउन में)। बेशक वे HTML को ठीक से पढ़ सकते हैं, इसलिए यह एक अस्थायी सहारा है, शायद कुछ टोकन बचाने के लिए।
गैर-डेवलपर साइटों के लिए, मुझे नहीं लगता कि भविष्य में अधिक एजेंटिक ट्रैफ़िक के साथ भी इसका कोई मतलब नहीं है (और यदि आप अपने लॉग की जांच करते हैं, तो आपको इस समय बहुत कुछ नहीं मिल रहा है)। किसी जूते की विशिष्टताओं का मार्कडाउन संस्करण बनाने से आपको अधिक बिक्री नहीं मिलेगी (हालांकि प्रतिस्पर्धी इसकी सराहना करते हैं)।
और (मुझे पता है, इसे अब तक किसी ने नहीं पढ़ा है), अगर आपको लगता है कि जब एजेंट हर जगह हों तो इसके लिए तैयारी करना महत्वपूर्ण है: आपकी साइट (सभी साइटों) में एसईओ के लिए करने के लिए संभावित भविष्य की स्थिति के लिए तैयारी करने से कहीं अधिक महत्वपूर्ण चीजें हैं जो आ भी सकती हैं और नहीं भी। सपनों से पहले जरूरतों को प्राथमिकता दें।
Google एजेंट जो कहता है उस पर भरोसा करते हैं।llms.txt से परे, Google की नई लाइटहाउस श्रेणी पहुंच और इंटरफ़ेस स्थिरता पर दृढ़ता से जोर देती है। दस्तावेज़ कहता है कि एजेंट अपने “प्राथमिक डेटा मॉडल” के रूप में एक्सेसिबिलिटी ट्री पर भरोसा करते हैं। लाइटहाउस विशेष रूप से मूल्यांकन करता है:
- इंटरैक्टिव तत्वों के लिए प्रोग्रामेटिक लेबल।
- वैध अभिगम्यता वृक्ष संरचना.
- क्या इंटरैक्टिव सामग्री सहायक प्रणालियों से छिपी हुई है।
- सीएलएस के माध्यम से लेआउट स्थिरता।
Google यह भी चेतावनी देता है कि गतिशील रूप से पंजीकृत WebMCP उपकरण और बड़े DOM परिवर्तन ऑडिट परिणामों को प्रभावित कर सकते हैं।
हमें परवाह क्यों है?Google का कहना है कि आपको खोज के लिए llms.txt की आवश्यकता नहीं है, लेकिन Chrome अब जाँच कर रहा है कि फ़ाइल मौजूद है या नहीं। साथ ही, Google के एजेंटिक टूल उन साइटों का समर्थन करते प्रतीत होते हैं जो मशीनों के लिए पढ़ने और उपयोग करने में आसान होती हैं, विशेष रूप से मजबूत पहुंच, स्थिर लेआउट और स्पष्ट एजेंट पहुंच वाली साइटें।
