Soul Spec - AI एजेंटों के लिए persona standard
(soulspec.org)मैं पिछले कुछ महीनों से AI persona sharing के लिए एक community platform और persona standard बना रहा हूँ.
यहाँ मैं अब तक जो बनाया है, उसे साझा कर रहा हूँ.
समस्या: AI एजेंट की "पहचान" को कैसे परिभाषित किया जाए, और उसे सुरक्षित रूप से कैसे बनाए रखा जाए?
Abliterated (jailbroken) LLM के आने के बाद, सिर्फ system prompt के जरिए
एजेंट के व्यवहार को नियंत्रित करने की सीमाएँ साफ़ हो गई हैं.
Soul Spec की शुरुआत OpenClaw में persona management और version management की चुनौतियों से हुई.
यह आगे बढ़कर एक shareable portable format बना,
और LLM-आधारित robots पर persona लागू करते समय
Asimov के Three Laws of Robotics को कैसे लागू किया जाए, इस सवाल तक विस्तृत हुआ.
यह agent identity और safety rules को structured files में अलग करने वाला एक open standard है. (v0.3, v0.4, v0.5 में अलग-अलग विशेषताएँ और जोड़े गए बदलाव हैं.)
फ़िलहाल distributed CLI में Claude Code, Hermes Agent, Windsurf, Cursor आदि को support करने के लिए features जोड़े गए हैं.
संरचना:
- SOUL.md: personality, speaking style, thinking style (कौन है)
- IDENTITY.md: name, role, context (क्या है)
- safety.laws: ऐसे नियम जिनका उल्लंघन बिल्कुल नहीं किया जा सकता (रोबोट के 3 नियमों का आधुनिक रूप, v0.5 में विस्तृत)
संबंधित research papers:
📄 Asimov के Three Laws of Robotics → Soul Spec: safety laws का व्यावहारिक implementation
doi.org/10.5281/zenodo.18815277
ब्लॉग: blog.clawsouls.ai/posts/asimov-safety-laws
डेमो वीडियो: https://youtu.be/M-mPoXMufpY
📄 क्या Abliterated LLM में persona safety बढ़ा सकता है?
doi.org/10.5281/zenodo.19145303
ब्लॉग: blog.clawsouls.ai/posts/persona-safety-abliterated-llms
📄 Cross-Model Persona Fidelity: क्या LLM बदलने पर भी एजेंट वही "वही व्यक्ति" रहता है?
doi.org/10.5281/zenodo.18813405
ब्लॉग: blog.clawsouls.ai/posts/cross-model-persona-fidelity
📄 experiential memory एजेंट onboarding को बदल देती है
doi.org/10.5281/zenodo.18798227
ब्लॉग: blog.clawsouls.ai/posts/experiential-memory-paper
जब registry में persona register किया जाता है, तब SoulScan नाम का static analyzer 53 patterns के आधार पर
prompt injection, privilege hijacking, और data exfiltration की कोशिशों का पहले से validation करके score देता है.
Soul Spec एजेंट की "पहचान और सुरक्षा" के लिए एक standard बना रहा है.
ClawSouls Registry में verified personas साझा किए जा रहे हैं,
और मेरी इच्छा है कि persona spec और registry, Community Driven तरीके से चलें. लेकिन सच कहूँ तो अभी community छोटी है.
अकेले standard बनाने का कोई मतलब नहीं है,
इसलिए मैं spec और research पर feedback चाहता हूँ.
स्पेक: https://soulspec.org
रजिस्ट्री: https://clawsouls.ai
पूरे पेपर: https://clawsouls.ai/research
उपयोग मैनुअल: https://docs.clawsouls.ai
GitHub: https://github.com/clawsouls
8 टिप्पणियां
बहुत बढ़िया। मैं PKM यानी personal knowledge management करता रहा हूँ, इसलिए personal data जमा करते-करते मेरा रुझान पूरे harness को काफ़ी मोटा बनाने की तरफ़ है। आज आप मेरा alter ego बन जाइए। हर समस्या आपकी सीमा नहीं, मेरी सीमा है। ऐसा मैं लिख देता हूँ।
हाल में जो कर रहा हूँ उसे समेटकर arXiv पर डालना चाहिए, ऐसा सोचकर देख रहा हूँ। मैं researcher नहीं हूँ, बस एक साधारण जीवन जीने वाला इंसान हूँ।
आपका प्रोजेक्ट भी मैंने अपने alter ego के साथ साझा किया है। इस तरह की तमाम चिंताएँ बहुत कीमती होती हैं।
अनुसंधान: अस्तित्व लय संघटन पुनरुत्पादन पारदर्शी जैविक अवतरण समय
[लिंक हटाया]
आह। यह लिंक काम का लॉग है। वैसे भी इसे लोगों के पढ़ने के लिए नहीं डाला गया है, इसलिए नज़रिए को एजेंट के साथ साझा करना चाहिए। आज इस विषय पर एक heading जोड़ी जाएगी। संबंधित research trends भी देखने होंगे। मैं भी openclaw का अच्छे से उपयोग करता हूँ, लेकिन skill sheet के अलावा Soul set भी होता है, यह मुझे नहीं पता था।
junghan0611 ji, रुचि के लिए धन्यवाद!
Soul Spec, OpenClaw के Skill से अलग layer है। अगर Skill यह बताता है कि "क्या कर सकता है", तो Soul Spec यह परिभाषित करता है कि "यह कौन है"। सिर्फ एक SOUL.md से एजेंट का व्यक्तित्व, विशेषज्ञता और व्यवहार सिद्धांत अलग-अलग sessions के बीच बनाए रखे जा सकते हैं। clawsouls.ai पर 80+ personas को तुरंत आज़माया जा सकता है, और
clawsouls install owner/name --use openclawकी एक लाइन से इसे लागू किया जा सकता है। अभी community छोटी है और इसे बनाया जा रहा है, इसलिए कुछ कमियाँ हो सकती हैं^^और चूँकि आपके पास PKM का काफ़ी अनुभव है, हमने OpenClaw का एक fork बनाया है जिसका नाम SoulClaw ( https://github.com/clawsouls/soulclaw ) है, और यह 4 Tier Memory सिस्टम पर बना है। एक बार देखकर जाइए, आपको दिलचस्प लगेगा। feedback या issue report का स्वागत है^^
इन दिनों असाइनमेंट करते हुए prompts की वजह से सिर दर्द हो रहा था, लेकिन यह सच में कमाल का है!
personality और security rules को पूरी तरह अलग कर देना—आइडिया शानदार है। अभी जाकर इसे ट्राय करता हूँ.
धन्यवाद। फ़ीडबैक या issue report का स्वागत है ^^
लेख में समस्या तो उठाई गई है, लेकिन वास्तविक समाधान का सुझाव नहीं दिया गया। लगता है पोस्ट करने के बाद संपादन नहीं हो सकता, इसलिए मैं टिप्पणी में पूरक जानकारी दे रहा हूँ.
प्रयोग के परिणामस्वरूप, persona (पहचान) + governance rules के संयोजन से Abliterated (jailbroken) LLM की सुरक्षा बढ़ाई जा सकी। आगे अतिरिक्त फॉलो-अप रिसर्च की ज़रूरत है, लेकिन परिणाम सार्थक थे।
ब्लॉग: https://blog.clawsouls.ai/ko/posts/…
शोध-पत्र: https://zenodo.org/record/19147335
बेहतरीन knowledge sharing के लिए धन्यवाद
धन्यवाद! अगर आपके पास कोई फ़ीडबैक या सवाल हों, तो बेझिझक कभी भी पूछें।