Claude की memory architecture, ChatGPT के बिल्कुल उलट है
(shloked.com)- Claude का memory system केवल तब सक्रिय होता है जब user उसे सीधे invoke करता है, और यह वास्तविक conversation history को real time में खोजकर जानकारी लौटाता है
- इसके विपरीत ChatGPT हर conversation में user profile और history को अपने-आप लोड करता है, जिससे तुरंत personalized experience मिलता है
- ये दोनों approaches target user base और product development philosophy के अंतर को दर्शाती हैं
- Claude के users developers और professionals केंद्रित हैं, और transparency, direct control, तथा privacy को महत्व देते हैं
- हाल में Claude में भी team और enterprise accounts के लिए ChatGPT जैसी automatic memory feature लाई गई है, जिससे AI memory design का दायरा तेज़ी से बढ़ रहा है
Claude का memory system कैसे काम करता है
Claude के memory system की दो मुख्य विशेषताएँ हैं
- यह हर conversation की शुरुआत empty state से करता है, और user profile या previous conversation history को पहले से लोड नहीं करता
- memory feature केवल तभी सक्रिय होती है जब user स्पष्ट invocation phrases का उपयोग करे, जैसे "पहले हमने क्या बात की थी बताओ" या "पिछली जगह से आगे बढ़ाओ"
Claude, AI द्वारा बनाए गए summaries या compressed profile का उपयोग नहीं करता, बल्कि केवल वास्तविक पुरानी conversation history को real time में search करके उसी जानकारी का इस्तेमाल करता है
search पूरा होने के बाद Claude, search results को integrate करके user के request का जवाब देता है या चर्चा को आगे बढ़ाता है
Conversation Search tool
- conversation_search tool पूरी conversation history को keyword या topic के आधार पर search करता है
- उदाहरण के लिए, अगर पूछा जाए "क्या तुम्हें याद है हमने Chandni Chowk के बारे में क्या बात की थी?", तो Claude उस topic से जुड़ी कई conversations ढूँढकर उनका integrated summary देता है
- अगर कई topics (जैसे Michelangelo, Chainflip, Solana) एक साथ पूछे जाएँ, तो यह हर एक को अलग-अलग क्रम से search करके संबंधित सामग्री links के साथ लौटाता है
- conversation_search parameters में search results की अधिकतम संख्या, search query आदि शामिल होते हैं
- उदाहरण: max_results(1~10), query(search keyword)
Temporal Chat Retrieval tool
- recent_chats tool समय के आधार पर conversation history तक पहुँचता है
- अगर request हो "हाल की 10 conversations की जानकारी दो", तो यह सबसे नई conversations को क्रम से ढूँढकर summary देता है
- किसी निश्चित अवधि को निर्दिष्ट करके समय-आधारित search भी की जा सकती है, जैसे "नवंबर 2024 के आख़िरी हफ्ते में हमने क्या बात की थी?"
- recent_chats parameters में after/before(शुरुआती·समाप्ति समय), n(conversations की संख्या, 1~20), sort_order(ascending/descending) शामिल हैं
ChatGPT और Claude की तुलना
पिछले साल तक ChatGPT और Claude की मुख्य capabilities काफ़ी मिलती-जुलती थीं, लेकिन अब दोनों की product direction काफ़ी अलग हो चुकी है
- ChatGPT एक mass-market consumer product के रूप में विकसित हुआ है, और इसे students, parents, hobby users जैसे अलग-अलग background के लोग इस्तेमाल करते हैं
- हर conversation में memory component अपने-आप लोड हो जाता है, जिससे तुरंत और आसान personalization मिलती है
- detailed user profile के आधार पर future feature recommendations, customized features, और monetization में मदद मिल सकती है
- Claude को developers, engineers, और professionals केंद्रित user base को ध्यान में रखकर बनाया गया है
- users algorithm के behavior को समझते हैं और साफ़ तौर पर चुनते हैं कि memory कब invoke करनी है
- profiling या automation की तुलना में, tool के रूप में functionality, predictability, और privacy को अधिक महत्व दिया जाता है
इस तरह दोनों services के memory systems user base और development philosophy के अंतर को सीधे तौर पर दिखाते हैं
AI memory design की विविधता
ChatGPT और Claude के बिल्कुल उलट memory systems यह दिखाते हैं कि AI memory design का क्षेत्र बहुत विविध है
- memory approach के लिए कोई एक सही या universal solution नहीं है, और वास्तविक user needs व objectives के आधार पर design को reverse-engineer करना ज़रूरी है
- AI tools के उपयोग का इतिहास अभी 3 साल से भी कम है, इसलिए लंबे समय तक एक ही AI assistant इस्तेमाल करने पर accumulated data handling या privacy management जैसी चीज़ों के लिए स्थापित best practices अभी मौजूद नहीं हैं
- फिलहाल अलग-अलग AI apps अपनी-अपनी अनोखी memory approaches के साथ experiment कर रही हैं, और base models भी हर हफ्ते और ताकतवर होते जा रहे हैं
- इस प्रक्रिया में किसी एक optimal method का तय जवाब नहीं है, और विभिन्न प्रयास और प्रयोग लगातार जारी हैं
हालिया अपडेट: Claude में automatic memory feature की शुरुआत
इस लेख के प्रकाशित होने वाले दिन, Anthropic ने Claude के team/enterprise accounts के लिए automatic memory feature की घोषणा की
- यह feature ChatGPT के तरीके की तरह, task context/work patterns/project-specific information के आधार पर अपने-आप memory summary तैयार करता है
- Claude के हर project के लिए अलग memory बनाई जाती है, और user सीधे देख और edit कर सकता है कि Claude क्या याद रख रहा है
- लेखक के व्यक्तिगत Pro Max subscription में यह feature अभी तक नहीं आई है, इसलिए अभी इसका मूल्यांकन नहीं किया गया है
- आगे चलकर मौजूदा search-based memory के साथ इसकी तुलना, और ChatGPT से अंतर आदि पर अतिरिक्त review की योजना है
2 टिप्पणियां
Hacker News राय
इम्प्लीमेंटेशन का अंतर आखिरकार business goals से आता है
ChatGPT का लक्ष्य साफ तौर पर ads और affiliate links के ज़रिए monetization करना है, और उसकी memory implementation भी user profile बनाने पर केंद्रित दिखती है
वहीं Claude की memory implementation, पिछले interactions और abstraction तक पहुँच जैसे दीर्घकालिक लक्ष्यों के ज़्यादा करीब लगती है
इसे इस तरह डिज़ाइन किया गया है कि इंसानी memory access की तरह बातचीतों को खोजा जा सके, और आगे reinforcement learning के ज़रिए यह user द्वारा बताई गई गलतियों को याद रख सके या पुरानी बातचीतों से abstractions निकालकर proactively काम भी संभाल सके, ऐसा लगता है
आखिरकार ChatGPT user को खुद याद रखने की कोशिश करता है, जबकि Claude individual interaction history पर ध्यान देता है
लगता है कि बातों और असली व्यवहार में कुछ मेल नहीं है
तब b, c, f जैसे कुछ topics पर OpenAI interruptive ads (full-screen, 30 सेकंड से ज़्यादा) से revenue कमा सकता है
यह सिर्फ topics का analysis करके ही संभव है
अगर OpenAI लगभग 1000 chat और coding sessions का analysis करके revenue maximization के लिए user को किसी खास कंपनी में नौकरी लेने या दूसरी कंपनी से कार खरीदने की दिशा में धकेल सकता है, तो उस प्रक्रिया में वह सिर्फ interruptive ads ही नहीं, जवाबों की quality या content भी adjust कर सकता है
यह काफी realistic और dystopian स्थिति लगती है
दूसरी ओर, अगर DeepSeek बिना ads के चलता है, तो closed-source LLMs के लिए market share लेने की कसौटी कहीं अधिक ऊँची हो जाएगी
आखिरकार LLM भी बाकी सभी products की तरह होंगे, जहाँ users quality के हिसाब से पैसे देंगे, और अलग-अलग स्तर की quality चाहेंगे
क्योंकि ads AI के जवाबों की reliability को नुकसान पहुँचा सकते हैं, इसलिए full-screen ads सबसे realistic नतीजा लगते हैं
ChatGPT कोई SNS नहीं है, इसलिए उसे उसी तरह monetize करने की ज़रूरत नहीं है
subscriptions, enterprise, business, API आदि से वह पहले ही पर्याप्त revenue कमा रहा है
यह बताया गया कि ChatGPT memory implementation पर analysis post का link गलत था, और सही link साझा किया गया
मुझे ChatGPT की memory implementation को लेकर जिज्ञासा थी, और Claude से इसका पूरी तरह अलग approach देखना काफी दिलचस्प है
Claude का तरीका technical tasks सुलझाने के लिए अधिक उपयुक्त लगता है, जबकि ChatGPT रोज़मर्रा की बातचीत और ad integration के लिए बेहतर दिखता है
कभी न कभी language-based memory का यह तरीका पुराना पड़ जाएगा, और कोई न कोई भाषाई अभिव्यक्ति से आगे बढ़कर encoded memory storage/retrieval का तरीका ढूँढ लेगा
शायद वही AGI की आखिरी breakthrough साबित हो
मौजूदा LLMs concepts को समझते नहीं हैं; वास्तव में उनमें ‘समझ’ जैसा कोई फ़ंक्शन नहीं है, और वे मूलतः highly sophisticated Markov chains हैं
मुझे लगता है कि सच्ची intelligence, AGI की पूर्वशर्त है
लगता है ChatGPT की memory में सिर्फ entity-by-entity summary वाली असली Memory ही context में डाली जा सकती है
और यह राय भी दी गई कि past conversation summaries या Embedding-based तरीका भी encoded memory storage का ही एक रूप माना जा सकता है
फिर यह चिंता पैदा होती है कि AGI को आदेश मानने वाला कैसे बनाया जाए
Claude की memory implementation से संतुष्टि जताई गई, लेकिन ChatGPT की memory बंद कर रखी है
क्योंकि ChatGPT को बहुत तरह के कामों में इस्तेमाल किया जाता है, इसलिए उसका असंबंधित बातों को बेवजह जोड़ने की कोशिश करना अटपटा लगा
मुझे personalization और ज़रूरी जानकारी का reference चाहिए
उदाहरण के लिए, अगर उसे किसी project की जानकारी याद रहे, तो बाद में हर बार context समझाने की ज़रूरत नहीं पड़ती, जिससे life quality काफ़ी बेहतर हो जाती है
लेकिन जिस तरह background conversations से memory बनती है और उस पर मेरा सीधा control नहीं होता, वह मुझे पसंद नहीं
ChatGPT अक्सर ऐसी पुरानी बातें अनावश्यक रूप से मिला देता है जिन्हें मैं नहीं चाहता, इसलिए वह बेकार लगता है
मैंने language learning के लिए कई AI tutors आज़माए, और ChatGPT सबसे अच्छा था
लेकिन मुझे बार-बार ‘धीरे बोलो’ कहना पड़ता था, और यह कहने पर भी कि इस नियम को पूरी बातचीत पर लागू करो, वह नहीं कर पाता था
इसके अलावा भी memory के ठीक से काम न करने की बातें हैं
जल्द ही ChatGPT की memory का तरीका बदल जाएगा
संदर्भ links: X.com - memory change update, Anthropic official announcement
ChatGPT memory और chat history पर खुद लिखे गए एक लेख का अनुभव साझा किया गया
इसमें direct information dump prompt भी शामिल है
संबंधित link
मैं हमेशा precise input control चाहता हूँ, इसलिए memory को पूरी तरह बंद रखता हूँ
मैं सभी system prompts, training वगैरह हटाकर सिर्फ वही prompts इस्तेमाल करना चाहता हूँ जो मैंने खुद लिखे हों
यह सवाल उठाया गया कि ChatGPT से सीधे पूछकर मिली जानकारी भरोसेमंद है या सिर्फ generative hallucination
मुझे नहीं लगता कि LLM के पास यह जानने का कोई कारण है कि वह खुद कैसे काम करता है, और न ही संभवतः उसे ऐसी training material दी गई होगी
क्योंकि ऐसी tool information system prompt में बहुत विस्तार से लिखी होती है
कहा गया कि Claude memory को बुलाने के लिए केवल original conversation history को refer करता है
AI-generated summaries या compressed profiles के बिना, वह सिर्फ वास्तविक पुरानी बातचीतों को real time में search करता है
summary, profile, knowledge graph जैसी चीज़ों का न होना कोई expert feature नहीं, बल्कि यह संकेत है कि वह ठीक से काम नहीं कर रहा
उदाहरण के लिए, वह शायद "Chandni Chowk" जैसी specific चीज़ याद रख ले, लेकिन "मेरा वह सहकर्मी जिसके साथ समस्या थी" जैसे अस्पष्ट expressions को ठीक से नहीं ढूँढ पाएगा
यह पूछा गया कि tool calling या MCP के ज़रिए external memory store इस्तेमाल करने में असली बाधाएँ क्या हैं
यह भी जिज्ञासा जताई गई कि क्या RL के ज़रिए memory usage patterns को reinforce किया जा रहा है
data privacy के नज़रिए से, inference के समय LLM वैसे भी जानकारी जान लेता है, लेकिन मैं उसे सीधे input के रूप में नहीं देना चाहता
उदाहरण: "रुचियाँ: MacOS, bondage, discipline, Baseball"
उस समय Claude, prompt से बार-बार उकसाने पर भी memory का स्वेच्छा से इस्तेमाल नहीं करना चाहता था
हर बार उसे साफ़ तौर पर memory check या save करने को कहना पड़ता था, इसलिए उसकी उपयोगिता कम थी
संबंधित repository
इस लेख को देखकर मैं उलझन में पड़ गया
यह स्पष्ट नहीं था कि लेखक का मानना है कि memory बंद होने पर भी prompts insert होते हैं
मेरे मामले में, memory बंद होने पर हाल की बातचीत या preference information जोड़ने वाला कोई metadata बिल्कुल नहीं आता, और बातचीत पूरी तरह स्वतंत्र रहती है
समझ नहीं आता कि testing के दौरान memory को on/off करते रहने से भ्रम पैदा हुआ था, या फिर मैंने लेख को सही से नहीं पढ़ा
अचानक सारे full stop गायब हो गए