LangChain ने coding agents के प्रदर्शन को नाटकीय रूप से बेहतर बनाने वाले "Skills" सेट जारी किए हैं.

खास तौर पर, जब Claude Code जैसे मॉडल LangChain/LangGraph/LangSmith से जुड़े tasks करते हैं, तो बिना Skills के जहाँ सफलता दर लगभग 25% थी, वहीं Skills जोड़ने के बाद यह 95% तक पहुँच गई. LangSmith से जुड़े tasks में भी यह 17% → 92% तक बड़े सुधार के साथ बढ़ी.

जारी किए गए Skills के प्रकार

  • LangChain Skills के 11 प्रकार: agent का basic loop, LangGraph का Human-in-the-Loop, Deep Agents आदि
  • LangSmith Skills के 3 प्रकार: tracing, dataset बनाना, agent evaluation
    → LangSmith CLI भी साथ में जारी किया गया है (terminal में trace देखना, dataset manage करना, experiment चलाना संभव)

मूल्यांकन परिणाम और सीख

  • Skills इस्तेमाल करने पर Claude Code completion rate 82% बनाम बिना इस्तेमाल 9%
  • Skill invocation accuracy: बहुत ज़्यादा होने पर (20) malfunction ↑ → लगभग 12 तक घटाने पर accuracy ↑
  • AGENTS.md या CLAUDE.md में “कब कौन-सा Skill इस्तेमाल करना है” यह स्पष्ट रूप से बताना चाहिए ताकि प्रभाव अधिकतम हो

भविष्य की दिशा

  • LangSmith Skills का उपयोग करने पर agent अपने execution logs का विश्लेषण → समस्या का सारांश → test dataset + evaluator का स्वचालित निर्माण वाला self-improvement loop चला सकता है.
  • आगे चलकर “agents द्वारा agents को बेहतर बनाना” वाला terminal-आधारित cycle मुख्यधारा बन सकता है.

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.