Microsoft Research द्वारा विकसित Fara-7B 7 अरब पैरामीटर वाला एक छोटा AI एजेंट है, जो वेब ब्राउज़िंग, फ़ॉर्म भरना, बुकिंग जैसी कंप्यूटर-आधारित गतिविधियाँ सीधे कर सकता है। WebVoyager बेंचमार्क में इसने 73.5% सफलता दर हासिल की, जिससे यह GPT-4o (65.1%) और UI-TARS (66.4%) से आगे निकल गया। यह मॉडल cloud के बिना उपयोगकर्ता के PC पर चलता है, जिससे डेटा privacy सुरक्षित रहती है, और केवल screenshots के आधार पर mouse click, keyboard input, scroll आदि संभालने वाले 'pixel sovereignty' तरीके को अपनाता है, जो काफ़ी efficient है (औसतन 16 चरणों में कार्य पूरा)।
इसकी कार्यप्रणाली का आधार यह है कि Magentic-One सिस्टम के माध्यम से बनाए और compress किए गए 1 लाख 45 हज़ार synthetic task paths के डेटा पर इसे train किया गया है, और यह Copilot+ PC के NPU पर तेज़ी से चलता है। सुरक्षा सुविधाओं में 'Critical Point' पर उपयोगकर्ता की स्वीकृति माँगना शामिल है, और Magentic-UI के ज़रिए इसके actions को track और intervene किया जा सकता है। इसे MIT लाइसेंस के तहत Hugging Face और Microsoft Foundry पर जारी किया गया है।
अन्य बेंचमार्क्स (Online-Mind2Web 34.1%, DeepShop 26.2% आदि) में भी इसने अच्छा प्रदर्शन दिखाया, लेकिन जटिल कार्यों में accuracy कम होना या hallucination जैसी समस्याएँ इसकी सीमाएँ मानी गईं। Microsoft इसे 'concept proof' स्तर का मानता है, और open source किए जाने से developer ecosystem के विस्तार की संभावना है।
निष्कर्ष: Fara-7B छोटे मॉडलों की क्षमता दिखाता है और cloud पर निर्भरता घटाने वाले व्यक्तिगत AI assistant के दौर की शुरुआत का एक महत्वपूर्ण उदाहरण है। आगे reinforcement learning के ज़रिए इसके और अधिक सुरक्षित और बुद्धिमान बनने की उम्मीद है।
1 टिप्पणियां
छोटे models prompts के प्रति बहुत ज़्यादा sensitive होते हैं, इसलिए उन्हें आसानी से इस्तेमाल करना मुश्किल होता है.. क्या बार-बार testing ही एकमात्र जवाब है?