1 पॉइंट द्वारा GN⁺ 2023-11-16 | 1 टिप्पणियां | WhatsApp पर शेयर करें

GPT को कॉन्फ़िगर करने का तरीका

  • GPT, ChatGPT की नामित सेटिंग्स हैं, जिनमें नाम, लोगो और एक छोटा विवरण शामिल होता है।
  • इसमें GPT के व्यवहार को निर्देशित करने वाले custom instructions शामिल होते हैं, जो "system prompt" के समकक्ष हैं।
  • बातचीत शुरू करने के लिए वैकल्पिक रूप से अधिकतम 4 example prompts दिए जा सकते हैं।
  • अतिरिक्त context देने और उत्तर बनाने में मदद के लिए कई फाइलें अपलोड की जा सकती हैं।
  • Code Interpreter, Browse मोड और DALL-E 3 को सक्षम या अक्षम किया जा सकता है।
  • वैकल्पिक "Actions" सेट किए जा सकते हैं, जो ऐसे API endpoints हैं जिन्हें GPT कॉल कर सकता है।

GPT Builder कैसे काम करता है

  • GPT Builder एक chatbot है जो उपयोगकर्ता के साथ बातचीत के माध्यम से अपने आप GPT बनाता है।
  • "Create" टैब उपयोगकर्ता को बातचीत के जरिए GPT बनाने देता है, लेकिन वास्तव में यह "Configure" फ़ॉर्म को अपने आप भरता है।
  • कई लोग सलाह देते हैं कि पहला GPT बनाने के बाद "Create" टैब से बचना चाहिए।

GPT के दिलचस्प उदाहरण

  • Dejargonizer: यह एक GPT है जो technical jargon की व्याख्या करता है और टेक्स्ट का विश्लेषण करके विशेषज्ञ शब्दों को परिभाषित करता है।
  • JavaScript Code Interpreter: यह ऐसा GPT है जो JavaScript code चला सकता है, और इसके लिए Deno runtime जोड़ा जाता है।
  • Dependency Chat: यह GitHub प्रोजेक्ट की dependency documentation का विश्लेषण करके संबंधित सवालों के जवाब देता है।
  • Add a walrus: यह GPT images में walrus जोड़ता है और GPT-Vision तथा DALL-E का उपयोग करता है।
  • Animal Chefs: यह ऐसा GPT है जिसमें animal chefs व्यक्तिगत कहानियों के साथ recipes देते हैं।
  • Talk to the datasette.io database: यह SQL queries चलाकर सवालों के जवाब देने वाला GPT है।
  • Just GPT-4: यह सभी अतिरिक्त फीचर्स को बंद करके शुद्ध GPT-4 अनुभव देता है।

GPT का knowledge फीचर

  • जब फाइलों को GPT से जोड़ा जाता है, तो वह उन फाइलों का उपयोग करके सवालों के जवाब देने की कोशिश करता है।
  • यह Retrieval Augmented Generation(RAG) के एक implementation जैसा दिखता है।
  • OpenAI ने इस फीचर के बारे में विस्तृत जानकारी साझा नहीं की है, इसलिए उपयोगकर्ताओं को इसे प्रभावी ढंग से इस्तेमाल करने में कठिनाई होती है।

GPT का payment model

  • GPT केवल $20/माह वाले ChatGPT Plus subscribers के लिए उपलब्ध है, इसलिए इसकी deployment सीमित है।
  • उपयोगकर्ता अपनी API key दिए बिना भी OpenAI platform पर आधारित प्रोजेक्ट deploy कर सकते हैं।

prompt security और openness का महत्व

  • यदि उपयोगकर्ता पर्याप्त प्रयास करे, तो GPT में जोड़े गए दस्तावेज़ और prompts लीक हो सकते हैं।
  • यह मानकर चलना बेहतर है कि prompts लीक होंगे, और उन्हें छिपाने के बजाय सार्वजनिक करना अधिक उचित है।

भविष्य में GPT से अपेक्षाएँ

  • इसमें knowledge फीचर के लिए बेहतर documentation, API access, non-subscribers को GPT उपलब्ध कराने के तरीके, और budget limits सेट करने जैसी सुधारों की उम्मीद की गई है।

GN⁺ की राय

इस लेख का सबसे महत्वपूर्ण पहलू GPTs की नई सुविधाओं और संभावनाओं की पड़ताल है, जो software engineering और artificial intelligence के क्षेत्र में काम करने वालों के लिए एक दिलचस्प विषय है। उपयोगकर्ता अपने खुद के GPT बना सकें और अन्य उपयोगकर्ताओं के साथ इंटरैक्ट कर सकें, यह क्षमता customized conversational interfaces बनाने का एक नया तरीका प्रस्तुत करती है। साथ ही, code execution, document retrieval, image generation जैसी विभिन्न क्षमताओं को एकीकृत करके उपयोगकर्ता अनुभव को बेहतर बनाने की इसकी संभावनाएँ भी स्पष्ट होती हैं।

1 टिप्पणियां

 
GN⁺ 2023-11-16
Hacker News की राय
  • एक GPT उपयोगकर्ता के रूप में मुझे एहसास हुआ कि अगर मैं प्रॉम्प्ट नहीं देख सकता, तो मैं GPT इस्तेमाल नहीं करना चाहता। मैं ऐसा ChatGPT इस्तेमाल नहीं करना चाहता जिसमें कोई अजनबी मेरी जानकारी के बिना अजीब व्यवहार इंजेक्ट कर सके।
    • मैं चाहता हूँ कि OpenAI GPT में "View Source" विकल्प जोड़े। मेरा मानना है कि यह डिफ़ॉल्ट रूप से "on" होना चाहिए, हालांकि मैं कल्पना कर सकता हूँ कि यह अलोकप्रिय फैसला हो सकता है।
  • मैं GPT-आधारित चैटबॉट्स से बचने की प्रवृत्ति रखता हूँ। मैं नहीं चाहता कि मुझे उन कस्टम निर्देशों के आधार पर सूक्ष्म रूप से प्रभावित किया जाए जिनके बारे में मुझे पता ही नहीं है।
    • "View Source" विकल्प जोड़ने से यह सुविधा "खास नहीं" से बदलकर "पैसे देकर लेने लायक" हो जाएगी।
    • मैं अपना ज़्यादातर समय Kagi इस्तेमाल करने में बिता रहा हूँ और GPT Plus रद्द करने पर विचार कर रहा हूँ, लेकिन ऐसा बदलाव मुझे सदस्यता जारी रखने के लिए प्रेरित करेगा।
  • मुझे नए OpenAI फीचर्स के बारे में कैसे पता चलता है:
    1. Twitter पर किसी नई चीज़ की बढ़ा-चढ़ाकर घोषणा करने वाली हेडलाइंस सरसरी तौर पर देखता हूँ
    2. Twitter इन्फ्लुएंसर्स से उस विषय पर बेहिसाब ट्वीट्स मिलते हैं
    3. उसे नज़रअंदाज़ करता हूँ और simonw के समझाने का इंतज़ार करता हूँ
    4. simonw की वह ब्लॉग पोस्ट पढ़ता हूँ जिसमें उसने पहले ही कई तरीकों से फीचर आज़माकर साफ़ व्याख्या और आलोचना लिख दी होती है। सब कुछ तुरंत समझ में आ जाता है।
  • यह सच है कि यह "बस ChatGPT में एक प्री-प्रॉम्प्ट होना" है।
    • यह भी सच है कि यह "अच्छे UI के साथ Custom Instructions" है।
    • लेकिन "अच्छे UI" के दुनिया बदल देने वाले असर को कभी कम मत आँकिए। GPT-3 कई वर्षों से उपलब्ध था, लेकिन जब तक उसका अच्छा UI नहीं बना, लगभग किसी को उसके बारे में पता नहीं था या परवाह नहीं थी।
    • यह usability में "छोटे बदलाव" जैसा दिखता है, लेकिन इसका प्रभाव उसी तरह का है जिसे "quantum leap" स्तर का कहा जा सकता है।
  • कुछ लोग अक्सर मुझसे GPT/AI के बारे में राय पूछते हैं। मैं उनसे पूछता हूँ कि क्या उन्होंने इसे इस्तेमाल किया है। "नहीं।" "क्या आपको पता है कि यह मुफ़्त है?" "हाँ।" यह रवैया समझना कठिन है। क्या यह अनजान चीज़ का डर है? आलस है? या कुछ आज़माने से पहले social proof की ज़रूरत है?
  • मैं OpenAI के प्रॉम्प्ट नहीं देख सकता, और शायद लेखक भी नहीं देख सकता, फिर भी मैं OpenAI के GPT इस्तेमाल करना चाहता हूँ।
    • इसमें भरोसे की एक बड़ी छलांग शामिल है। मुझे हैरानी है कि क्या OpenAI के पास reliability या consistency की दिशा में कोई ठोस roadmap है।
  • मेरे पास Custom GPT Builder का पूरा प्रॉम्प्ट है: [GitHub लिंक प्रदान किया गया]
  • simonw को धन्यवाद, जो यह सब रीयल टाइम में दस्तावेज़ कर रहे हैं और समझने में आसान, सुलभ टूल्स (llm command line आदि) बना रहे हैं।
    • मुझे लग रहा था कि search API सही citations नहीं दे पा रहा और कुछ गड़बड़ कर रहा है, इसलिए यह जानकर अच्छा लगा कि ऐसा सिर्फ मेरे साथ नहीं हो रहा।
  • मैं इस बारे में और जानना चाहता हूँ कि openAI ने RAG "knowledge base" फीचर को कैसे implement किया है। लेकिन विवरण की कमी है।
    • मैं grugbrain.dev का पूरा टेक्स्ट अपलोड कर सका और एक काफ़ी तर्कसंगत grug brain से बातचीत कर सका: [OpenAI chat लिंक प्रदान किया गया]
  • मैं हाल ही में "synbiogpt" बना रहा हूँ, और यहीं मुझे custom GPT की सीमाओं का एहसास हुआ।
    • biological sequence data आमतौर पर बहुत लंबा होता है। फ़ाइल में मौजूद data तो ठीक है, लेकिन अगर advanced functionality (जैसे codon optimization) के लिए API के साथ interact करना पड़े, तो यह data नेटवर्क के ज़रिए भेजना पड़ता है। फिर API call का context window sequence data से भर जाता है और विफल हो जाता है।
    • dependencies inject नहीं की जा सकतीं। कभी-कभी GPT अपना खुद का implementation करने की कोशिश करता है, लेकिन वह अक्सर गलत होता है।
    • अगर GPT-4 को लगता है कि उसे पता है कि वह किस बारे में बात कर रहा है, तो search API अक्सर फ़ाइल खोलने में विफल रहता है। जब मैं gene part के बारे में बात करता हूँ, तो मैं GPT-4 के दिमाग में मौजूद part नहीं, बल्कि अपनी library के किसी बहुत specific part के बारे में बात करना चाहता हूँ।
    • मैंने अपना खुद का lua scripting environment बनाकर ज़्यादातर समस्याएँ हल कर लीं (biological functionality golang में है, और lua environment चलाने के लिए gopher-lua इस्तेमाल करता हूँ)। मैं scripting feature इस्तेमाल करने के तरीके के example lua और अपनी मौजूदा छोटी gene part library inject करता हूँ, फिर उससे कहता हूँ कि दिए गए फ़ाइल पर कोई खास काम करने वाला lua generate करे। GPT-4 फ़ाइल को बिल्कुल नहीं देखता और मेरा अंदरूनी golang app scripted lua चलाता है। यह तरीका शानदार काम करता है और custom GPT से काफ़ी तेज़ है।
    • इस समय सबसे बड़ी समस्या frontend हिस्सा है। मैं ऐसा open source ChatGPT clone चाहता हूँ जो attached files को बाहर खींच सके और शुरुआती user input को संशोधित कर सके। अभी तक मुझे कोई अच्छा विकल्प नहीं मिला है।
  • RAG का उपयोग करके बेहतर परिणाम कैसे पाए जाएँ।
    • मुझे इससे कुछ सफलता मिली है।
    • मैं Assistant API इस्तेमाल करता हूँ, जो मेरे हिसाब से GPT जैसा नहीं है। मैंने इसे web interface के ज़रिए आज़माया।
    • मेरे पास Tesseract से OCR-प्रोसेस की गई 100 से अधिक PDF फ़ाइलें हैं। फिर मैंने ChatGPT से ऐसी script लिखवाई जो सभी फ़ाइलों को layout बनाए रखते हुए एक single txt फ़ाइल में जोड़ दे।
    • मैंने फ़ाइलें upload कीं और सवाल पूछना शुरू किया। फ़ाइलों में अंग्रेज़ी के अलावा किसी दूसरी भाषा में लिखे बहुत technical architectural regulations का data है, इसलिए मॉडल शायद उस तरह की भाषा का आदी नहीं होगा।
    • इसके बावजूद परिणाम हैरान करने वाले रूप से अच्छे थे। सवालों के जवाब मिल सके और जवाब अच्छे थे। जवाब कहाँ से आया, इस पर annotations होने चाहिए, लेकिन वह ठीक से काम नहीं कर रहा था।
    • मैंने PDF, JSON files, CSV आदि upload करके देखे। अब तक raw text सबसे अच्छा काम कर रहा है।
  • "knowledge" RAG फीचर के बारे में नोट दिलचस्प है।
    • बातचीत और अनुभव से लोगों ने पाया है कि RAG retrieval business और data model के हिसाब से बहुत specific होता है। यहाँ one-size-fits-all solution नहीं है। CMS में ग्राहक का अगला कदम schema के आधार पर SQL generate करने जैसा नहीं होता। यह e-commerce catalog में shopping करने जैसा भी नहीं है।
    • मूल रूप से यह search से जुड़ी समस्या है। असल में यह उससे भी कठिन है। ऐसी समस्याएँ बदनाम रूप से कठिन होती हैं.