- AI crawlers और agent-केंद्रित ट्रैफ़िक में बढ़ोतरी के साथ, वेब कंटेंट अब केवल इंसानों ही नहीं बल्कि मशीनों द्वारा सीधे उपभोग किए जाने वाले ढांचे की ओर बदल रहा है
- HTML को markdown में बदलने पर token उपयोग लगभग 80% कम हो जाता है, जिससे लागत और processing efficiency बेहतर होती है
Accept: text/markdown header के आधार पर real-time HTML→Markdown conversion को network level पर support किया गया है
x-markdown-tokens, Content-Signal headers के जरिए token count estimate और AI usage policy साथ में दी जाती है
- AI bots की content consumption पद्धति को Radar में track किया जा सकता है, और Pro या उससे ऊपर के plans में beta के रूप में मुफ्त उपलब्ध है
पृष्ठभूमि: AI agent-केंद्रित वेब ट्रैफ़िक संरचना की ओर बदलाव
- ऑनलाइन कंटेंट खोजने का तरीका पारंपरिक search engine-केंद्रित मॉडल से तेजी से AI crawler और agent-केंद्रित संरचना की ओर बढ़ रहा है
- पहले SEO ट्रैफ़िक को नियंत्रित करता था, लेकिन अब structured data की मांग करने वाले AI systems मुख्य उपभोक्ता के रूप में उभर रहे हैं
- कंपनियों को अब मानव visitors के साथ-साथ agents को first-class citizen के रूप में भी ध्यान में रखना होगा
- मौजूदा वेब इंसानों के लिए डिज़ाइन की गई HTML-आधारित संरचना पर बना है, जिसमें AI processing के लिए अनावश्यक तत्व बहुत अधिक हैं
Markdown क्यों
- HTML में semantic अर्थ से असंबंधित
<div>, <script>, navigation elements आदि होने के कारण यह tokens बर्बाद करने वाली संरचना बन जाती है
- उदाहरण:
## About Us लगभग 3 tokens लेता है, जबकि वही HTML <h2 class="section-title"...> 12~15 tokens खर्च करता है
- इस ब्लॉग पोस्ट के आधार पर HTML 16,180 tokens → Markdown 3,150 tokens, यानी लगभग 80% token reduction
- Markdown स्पष्ट संरचना देता है, जिससे AI processing efficiency और output quality बेहतर होती है
- अभी अधिकांश AI pipelines में HTML→Markdown conversion चरण शामिल होता है, लेकिन
- compute cost बढ़ती है
- processing complexity बढ़ती है
- लेखक की मूल मंशा से अलग होने की संभावना रहती है
Markdown for Agents: network level automatic conversion
- Cloudflare network में real-time HTML→Markdown conversion support किया गया है
- Enabled zone में यह content negotiation के आधार पर काम करता है
- जब client
Accept: text/markdown header के साथ request भेजता है
- तो origin से मूल HTML लाया जाता है
- फिर network में उसे Markdown में बदलकर return किया जाता है
- response उदाहरण
content-type: text/markdown
vary: accept
x-markdown-tokens: 725 header शामिल
x-markdown-tokens Markdown document के estimated token count देता है
- context window calculation
- chunking strategy तय करने जैसे कामों में उपयोगी
Content Signals Policy के साथ एकीकरण
- Content Signals framework के साथ integrated
- Markdown response में डिफ़ॉल्ट रूप से
Content-Signal: ai-train=yes, search=yes, ai-input=yes header शामिल होता है
- इससे यह स्पष्ट किया जा सकता है कि AI training, search, और agent input उपयोग की अनुमति है या नहीं
- आगे चलकर custom policy options भी दिए जाएंगे
उपयोग के उदाहरण: Cloudflare Blog और Developer Docs
- Developer Documentation और Blog में यह फीचर enabled है
curl -H "Accept: text/markdown" request पर Markdown return होता है
- response के शीर्ष पर YAML metadata शामिल होती है
- title
- description
- image जैसी structured जानकारी उपलब्ध कराई जाती है
Cloudflare के बाहर के documents को convert करने के तरीके
- Workers AI
AI.toMarkdown()
- HTML सहित विभिन्न document formats का conversion और summary support
- Browser Rendering
/markdown REST API
- actual browser rendering के बाद Markdown conversion support
- dynamic pages को process किया जा सकता है
Markdown उपयोग tracking: Cloudflare Radar
- Radar AI Insights में content_type dimension जोड़ा गया
- AI bots और crawlers को लौटाए गए content के MIME type distribution को देखा जा सकता है
- अलग-अलग agents के अनुसार Markdown requests को filter किया जा सकता है
- उदाहरण: OAI-Searchbot(GPTBot)
- public API और Data Explorer के माध्यम से data access संभव है
शुरुआत कैसे करें और उपलब्धता
- Cloudflare Dashboard → Zone चुनें → Quick Actions में फीचर enable करें
- Pro, Business, Enterprise plans और SSL for SaaS ग्राहकों के लिए उपलब्ध
- फिलहाल beta चरण में, मुफ्त उपलब्ध
- विस्तृत जानकारी Developer Docs में देखी जा सकती है
अभी कोई टिप्पणी नहीं है.