प्रोडक्शन-ग्रेड LLM एप्लिकेशन के लिए डेवलपर गाइड (अनुवादित लेख)
(discuss.pytorch.kr)-
Zapier के AI प्रोडक्ट डेवलपर Tal Peretz द्वारा लिखे गए लेख का अनुमति लेकर अनुवाद किया गया है.
-
मूल लेख यहाँ देखा जा सकता है, और इसके मुख्य बिंदु नीचे दिए गए हैं.
-
प्रॉम्प्ट इंजीनियरिंग - शुरुआती चरण
-
मूल्यांकन की भूमिका: (नेविगेशन का मानक) ध्रुवतारा
- AI मूल्यांकन के लिए व्यवस्थित दृष्टिकोण / Systematic Approach to AI Evaluations
- गहन परीक्षण के लिए dataset का उपयोग / Dataset Utilization for In-depth Testing
- AI आकलन के साथ मूल्यांकन को परिष्कृत करना / Refining Evaluations with AI Assessments
- मूल्यांकन के लिए metrics / Metrics to evaluate
- स्वर्ण मानक के रूप में मानवीय मूल्यांकन / Human Evaluation as the Gold Standard
-
RAG: ज़रूरत पड़ने पर संदर्भानुसार गहन जानकारी
- आज़माने योग्य तकनीकें / Techniques to Experiment With
-
फाइन-ट्यूनिंग: विशेषज्ञता की कला
- ट्रेनिंग डेटा की कमी: मात्रा और गुणवत्ता के संतुलन की समस्या / Insufficient Training Data: The Quantity-Quality Equilibrium
- असंतुलित ट्रेनिंग डेटा: पक्षपात की दुविधा / Unbalanced Training Sets: The Bias Dilemma
- सार्वजनिक डेटा का पुनः उपयोग: नए signal की अनिवार्यता / Reusing Public Data: The New Signal Imperative
- कमजोर प्रॉम्प्ट इंजीनियरिंग: स्पष्ट निर्देश / Poor Prompt Engineering: The Clarity Commandment
- क्रमिक रूप से मूल्यांकन न करना: लगातार होने वाली चूक / Not Evaluating Incrementally: The Continuous Oversight
-
जब सब कुछ ज़रूरी हो
-
समापन
3 टिप्पणियां
साझा करने के लिए धन्यवाद।
लगता है यह OpenAI द्वारा प्रकाशित A Survey of Techniques for Maximizing LLM Performance से लगभग वही सामग्री है, है न?
मैं OpenAI DevDay वीडियो नहीं देख पाया था, और अब पता चला कि उसमें वह session भी है जिसके बारे में आपने बताया था. :)
बताने के लिए धन्यवाद!
(+ दूसरों के लिए, मैं वह YouTube लिंक साझा कर रहा हूँ जो मुझे मिला!)
https://www.youtube.com/watch?v=ahnGLM-RC1Y