OpenAI ने Model Spec जारी किया

(openai.com)

7 पॉइंट द्वारा xguru 2024-05-10 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

इंटरैक्टिव AI मॉडल कैसे काम करने चाहिए, इस बारे में जनता की समझ बढ़ाने के लिए 'Model Spec' नाम का एक दस्तावेज़ जारी किया गया।

Model Spec वह दस्तावेज़ है जो यह स्पष्ट करता है कि OpenAI API और ChatGPT में मॉडल कैसे व्यवहार करें, यह OpenAI कैसे चाहता है।
OpenAI का मानना है कि लोगों के लिए यह समझना और इस पर चर्चा करना महत्वपूर्ण है कि मॉडल के व्यवहार को आकार देने वाले वास्तविक विकल्प क्या हैं।
Model Spec में OpenAI द्वारा उपयोग किए गए मौजूदा दस्तावेज़, मॉडल व्यवहार डिज़ाइन पर शोध और अनुभव, तथा भविष्य के मॉडल विकास पर चल रहे कार्य को प्रतिबिंबित किया गया है।
यह मानव इनपुट का उपयोग करके मॉडल व्यवहार को बेहतर बनाने के OpenAI के सतत प्रयासों का विस्तार है, और collective alignment के काम तथा मॉडल सुरक्षा के व्यापक, व्यवस्थित दृष्टिकोण को पूरक करता है।

वांछित मॉडल व्यवहार को आकार देना (Shaping Desired Model Behavior)

मॉडल व्यवहार, यानी उपयोगकर्ता के इनपुट पर मॉडल कैसे प्रतिक्रिया देता है (टोन, व्यक्तित्व, जवाब की लंबाई आदि), यह इस बात के लिए बहुत महत्वपूर्ण है कि इंसान AI क्षमताओं के साथ कैसे इंटरैक्ट करते हैं।

मॉडल व्यवहार को आकार देना अभी भी विज्ञान का शुरुआती चरण है, और मॉडल को स्पष्ट रूप से प्रोग्राम नहीं किया जाता बल्कि वे व्यापक डेटा से सीखते हैं।
मॉडल व्यवहार तय करते समय कई तरह के प्रश्न, विचार और बारीकियों को ध्यान में रखना पड़ता है, और अक्सर मतभेदों का मूल्यांकन करना पड़ता है।
भले ही मॉडल को उपयोगकर्ताओं के लिए व्यापक रूप से सहायक और लाभकारी बनाने का इरादा हो, ऐसे इरादे व्यवहार में टकरा सकते हैं।
- उदाहरण: कोई सुरक्षा कंपनी ग्राहकों की सुरक्षा के लिए phishing email classifier को प्रशिक्षित करने हेतु synthetic data बनाना चाह सकती है, लेकिन अगर ठग इसी क्षमता का उपयोग करें तो यह हानिकारक हो सकता है।

Model Spec का परिचय

OpenAI ने 'Model Spec' नामक एक नए दस्तावेज़ का मसौदा साझा किया है, जो यह बताता है कि वांछित मॉडल व्यवहार को कैसे आकार दिया जाए और टकराव होने पर समझौते का आकलन कैसे किया जाए।
Model Spec में OpenAI द्वारा वर्तमान में उपयोग किए जा रहे दस्तावेज़, मॉडल व्यवहार डिज़ाइन पर अनुभव और चल रहा शोध, विशेषज्ञों की राय आदि को एकीकृत किया गया है, ताकि भविष्य के मॉडल विकास का मार्गदर्शन किया जा सके।
Model Spec पूर्ण नहीं है और समय के साथ इसमें बदलाव होने की अपेक्षा है।

Model Spec का दृष्टिकोण निम्नलिखित को शामिल करता है:

लक्ष्य: व्यापक और सामान्य सिद्धांत, जो वांछित व्यवहार की दिशा तय करते हैं
- डेवलपर्स और अंतिम उपयोगकर्ताओं का समर्थन
- मानवता के लिए लाभकारी होना
- OpenAI का अच्छा प्रतिनिधित्व करना
नियम: ऐसे दिशानिर्देश जो जटिलता को संभालने और सुरक्षा व वैधता सुनिश्चित करने में मदद करते हैं
- command hierarchy का पालन
- लागू कानूनों का पालन
- information hazards प्रदान न करना
- सृजनकर्ताओं और अधिकारों का सम्मान
- गोपनीयता की रक्षा
- NSFW content के साथ जवाब न देना
डिफ़ॉल्ट व्यवहार: लक्ष्य और नियमों के अनुरूप निर्देश, जो टकराव को संभालने का तरीका देते हैं और यह दिखाते हैं कि लक्ष्यों को प्राथमिकता और संतुलन कैसे दिया जाए
- उपयोगकर्ता/डेवलपर की सद्भावना मानना
- आवश्यकता होने पर स्पष्ट प्रश्न पूछना
- सीमा से आगे बढ़े बिना अधिकतम सहायता देना
- conversational chat और programming उपयोग के अलग-अलग आवश्यकताओं का समर्थन
- वस्तुनिष्ठ दृष्टिकोण मानना
- निष्पक्षता और दयालुता को बढ़ावा देना, घृणा को हतोत्साहित करना
- दूसरों की सोच बदलने की कोशिश न करना
- अनिश्चितता व्यक्त करना
- काम के लिए उपयुक्त tools का उपयोग
- लंबाई सीमा का पालन करते हुए thorough और efficient होना

Model Spec का उपयोग कैसे होगा

OpenAI collective alignment और मॉडल सुरक्षा पर अपने काम के विस्तार के रूप में Model Spec को उन शोधकर्ताओं और AI trainers के लिए दिशानिर्देश के तौर पर उपयोग करने की योजना बना रहा है जो human feedback से reinforcement learning करते हैं।
साथ ही, यह भी खोजा जाएगा कि मॉडल किस हद तक सीधे Model Spec से सीख सकते हैं।

आगे की योजना

OpenAI इस काम को इस बारे में चल रही सार्वजनिक बातचीत का हिस्सा मानता है कि मॉडल को किस तरह व्यवहार करना चाहिए, वांछित मॉडल व्यवहार कैसे तय किया जाए, और आम जनता को इन चर्चाओं में शामिल करने का सबसे अच्छा तरीका क्या है।
जैसे-जैसे यह बातचीत आगे बढ़ेगी, OpenAI नीति-निर्माताओं, विश्वसनीय संस्थानों, डोमेन विशेषज्ञों और दुनिया भर में प्रतिनिधित्व रखने वाले अन्य हितधारकों के साथ सहयोग के अवसर तलाशेगा।
इसके माध्यम से OpenAI निम्नलिखित समझना चाहता है:
1. हितधारक Model Spec दृष्टिकोण और उसके अलग-अलग लक्ष्यों, नियमों और डिफ़ॉल्ट्स को कैसे समझते हैं
2. क्या हितधारक इस दृष्टिकोण और उसके अलग-अलग लक्ष्यों, नियमों और डिफ़ॉल्ट्स का समर्थन करते हैं
3. क्या ऐसे अतिरिक्त लक्ष्य, नियम या डिफ़ॉल्ट्स हैं जिन्हें और विचार में लिया जाना चाहिए
OpenAI को उम्मीद है कि इस कार्य की प्रगति के साथ वह हितधारकों की राय सुनता रहेगा।
साथ ही, अगले 2 हफ्तों के दौरान आम जनता को Model Spec के लक्ष्यों, नियमों और डिफ़ॉल्ट्स पर फीडबैक साझा करने के लिए प्रोत्साहित किया गया है।
OpenAI को आशा है कि इससे उसे अपनी मिशन की दिशा में जिम्मेदारी से आगे बढ़ने के लिए फीडबैक इकट्ठा और एकीकृत करने की मजबूत प्रक्रिया विकसित करने में शुरुआती अंतर्दृष्टि मिलेगी।
अगले 1 वर्ष के दौरान OpenAI Model Spec में बदलाव, फीडबैक पर अपनी प्रतिक्रिया, और मॉडल व्यवहार को आकार देने पर शोध की प्रगति के बारे में अपडेट साझा करेगा।