- Ollama ने नवीनतम वेब जानकारी खोजने की सुविधा API के रूप में जारी की है, जिससे मॉडल की hallucination कम करने और सटीकता बढ़ाने में मदद मिलती है
- मुफ्त अकाउंट में भी काफी उदार free search quota शामिल है, और अधिक उपयोग करने वाले यूज़र Ollama Cloud के जरिए ऊंची limits का उपयोग कर सकते हैं
- REST API आधारित यह सुविधा Python, JavaScript लाइब्रेरी के साथ integrate होती है, जिससे
gpt-oss जैसे मॉडल लंबे समय तक चलने वाले research tasks कर सकते हैं
web_search और web_fetch फीचर हजारों tokens के स्तर तक परिणाम लौटाते हैं, और MCP server के जरिए Cline, Codex, Goose जैसे कई tools के साथ integration support देते हैं
- इसका उपयोग करके search agent सीधे बनाया जा सकता है, जिससे AI मॉडल की नवीनतम डेटा के साथ इंटरैक्ट करने की क्षमता काफी बढ़ जाती है
Ollama Web Search फीचर परिचय
- Ollama ने Web Search API जारी किया है, जिससे AI मॉडल को तुरंत नवीनतम वेब जानकारी देने वाला वातावरण उपलब्ध होता है
- इससे hallucination में कमी और सटीकता में सुधार की उम्मीद की जा सकती है
- व्यक्तिगत उपयोगकर्ताओं को उदार free search quota दिया जाता है, और अधिक उपयोग की जरूरत होने पर Ollama Cloud subscription के जरिए quota बढ़ाया जा सकता है
- यह REST API के रूप में उपलब्ध है, और Python तथा JavaScript लाइब्रेरी के जरिए उन्नत tool integration को सपोर्ट करता है
- इसी संरचना की वजह से gpt-oss सहित विभिन्न मॉडल लंबी अवधि के research और search tasks कर सकते हैं
API उपयोग के उदाहरण
- Ollama अकाउंट से जारी API key का उपयोग करके
cURL, Python में ollama.web_search(), और JavaScript में client.webSearch() कॉल किया जा सकता है
- परिणाम title, URL, और body summary शामिल करने वाली JSON संरचना में लौटते हैं
web_fetch API का उपयोग करने पर URL स्तर पर पेज की सामग्री body text और link list सहित लाई जा सकती है
Web Search आधारित search agent implementation
- Ollama API को Qwen3, gpt-oss जैसे मॉडलों के साथ जोड़कर automated multi-turn search agent विकसित किया जा सकता है
- उदाहरण कोड में Qwen3:4B मॉडल का उपयोग करके search → reasoning → result summary प्रक्रिया को automate किया गया है
- search results के आधार पर "Thinking" प्रक्रिया से गुजरते हुए, search/fetch tool call के परिणामों का बार-बार उपयोग कर जटिल research या exploration scenarios पूरे किए जाते हैं
- Ollama engine के नए upgrade में सटीक memory management, GPU/multi-GPU optimization, performance improvements, और vision (multimodal) मॉडल के लिए मजबूत समर्थन शामिल है
अनुशंसित मॉडल और performance guidance
- मजबूत tool-use क्षमता वाले cloud models (जैसे
qwen3:480b-cloud, gpt-oss:120b-cloud, deepseek-v3.1-cloud) की सिफारिश की गई है
- क्योंकि search और fetch tools हजारों tokens का डेटा लौटा सकते हैं, इसलिए मॉडल की context length को लगभग 32000 tokens तक बढ़ाने की सिफारिश की जाती है
व्यक्तिगत web page fetch फीचर
- Web Search के अलावा, किसी निर्दिष्ट web page के text और link संरचना को सीधे fetch करने के लिए API और functions भी उपलब्ध हैं
- Python, JavaScript, या cURL से url को argument के रूप में देकर पेज का
title, content, और जुड़े हुए links निकाले जा सकते हैं
- अधिक विस्तृत example code आधिकारिक GitHub repository में देखा जा सकता है
Tool और agent integration
web_search, web_fetch हजारों tokens का डेटा लौटाते हैं, इसलिए मॉडल context को 32K या उससे अधिक तक बढ़ाने की सिफारिश की जाती है
- MCP server support की मदद से Cline, Codex, Goose जैसे AI development environments के साथ सीधा integration संभव है
- Python और JavaScript example code आधिकारिक GitHub repository में उपलब्ध हैं
शुरुआत करें
- Web Search मुफ्त Ollama अकाउंट के साथ डिफ़ॉल्ट रूप से उपलब्ध है, और अधिक उपयोग paid subscription के जरिए किया जा सकता है
- Ollama वेबसाइट पर अकाउंट बनाकर API key जारी करें और तुरंत सेवा का उपयोग शुरू करें
3 टिप्पणियां
मुफ्त ollama के साथ शायद इसे वास्तविक उपयोग के स्तर तक इस्तेमाल करना संभव नहीं लगेगा..
प्राइसिंग पेज पर भी quota के बारे में कोई जानकारी नहीं है, इसलिए यह कितनी value देगा, इसका अंदाज़ा लगाना मुश्किल है।
Hacker News की राय