GPT इस्तेमाल में संक्षिप्त प्रॉम्प्ट बेहतर नतीजे देते हैं
- GPT उन बातों को प्रॉम्प्ट में जरूरत से ज्यादा स्पष्ट लिख देने पर, जिन्हें वह पहले से सामान्य ज्ञान के रूप में जानता है, उलझ सकता है
- उदाहरण के लिए, टेक्स्ट में उल्लेखित state को वर्गीकृत करने के काम में 50 states की सूची देने की बजाय केवल state name माँगना अधिक सटीक परिणाम देता है
केवल OpenAI की chat API से भी काफी विविध और शक्तिशाली फीचर बनाए जा सकते हैं
- Langchain जैसे अतिरिक्त टूल के बिना, सिर्फ chat API का उपयोग करके JSON extraction जैसी जरूरी क्षमताएँ सरलता से लागू की जा सकती हैं
- GPT मॉडल अपग्रेड होने पर भी codebase में सिर्फ एक string बदलनी होती है
- OpenAI API की error handling और input length limit जैसी चीजों के लिए बस कुछ सरल logic जोड़ना पर्याप्त है
जब GPT को कुछ भी नहीं मिलता, उस स्थिति को संभालना कठिन है
- "अगर कुछ न मिले तो empty value return करो" जैसे प्रॉम्प्ट में GPT अक्सर मनगढ़ंत चीजें बना देता है या आत्मविश्वास खो देता है
- इसका समाधान यह है कि input खाली होने पर GPT को प्रॉम्प्ट ही न भेजा जाए
GPT सीमित लंबाई का ही output बना सकता है
- GPT-4 की input limit 128k tokens है, लेकिन output limit केवल 4k tokens है
- JSON objects की सूची माँगने पर GPT के लिए 10 से अधिक items को स्थिर रूप से बनाना कठिन होता है
vector database और RAG/embedding सामान्य उपयोग में बहुत मददगार नहीं हैं
- search के अलावा दूसरे उपयोगों में RAG अच्छा काम नहीं करता
- relevance तय करने की कठिनाई, data isolation की समस्या, और user satisfaction में गिरावट जैसी वजहों से इसकी व्यावहारिक उपयोगिता कम हो जाती है
- सामान्य search के लिए GPT का उपयोग करने वाला faceted search या complex query generation अधिक उपयुक्त है
GPT वास्तव में hallucination नहीं बनाता
- दिए गए टेक्स्ट से जानकारी extract करने वाले कामों में GPT बहुत भरोसेमंद परिणाम देता है
- लेकिन जब टेक्स्ट में जानकारी मौजूद न हो, तब यह मनगढ़ंत चीजें बना सकता है
- इसलिए पर्याप्त context देना और GPT के जवाबों को सही तरह से संभालना महत्वपूर्ण है
GN⁺ की राय
- ऐसा लगता है कि केवल transformer models, web data, और large-scale infrastructure से AGI तक पहुँचना कठिन होगा
- GPT-4 निश्चित रूप से उपयोगी है, लेकिन उससे आगे बढ़ने के लिए model architecture में ही नवाचार जरूरी लगता है
- OpenAI के अलावा विकल्प अभी GPT के स्तर तक पहुँचते नहीं दिखते, इसलिए अंततः GPT के अगले version upgrades पर ध्यान देना होगा
- अनुमान है कि GPT-5 का प्रदर्शन GPT-4 की तुलना में क्रांतिकारी स्तर का नहीं होगा। लगता है कि cost-benefit की सीमा करीब आ गई है
- इसलिए फिलहाल GPT-4 का उपयोग करके optimal prompt design और applications पर ध्यान देना अधिक व्यावहारिक विकल्प लगता है
1 टिप्पणियां
Hacker News राय