प्रोडक्शन-ग्रेड LLM एप्लिकेशन के लिए डेवलपर गाइड (अनुवादित लेख)

ninebow · 2023-11-24T13:10:09+09:00

Zapier के AI प्रोडक्ट डेवलपर Tal Peretz द्वारा लिखे गए लेख का अनुमति लेकर अनुवाद किया गया है. मूल लेख यहाँ देखा जा सकता है, और इसके मुख्य बिंदु नीचे दिए गए हैं. प्रॉम्प्ट इंजीनियरिंग - शुरुआती चरण मूल्यांकन की भूमिका: (नेविगेशन का मानक) ध्रुवतारा AI मूल्यांकन के लिए व्यवस्थित दृष्टिकोण / Systematic Approach to AI Evaluations गहन परीक्षण के लिए dataset का उपयोग / Dataset Utilization for In-depth Testing AI आकलन के साथ मूल्यांकन को परिष्कृत करना / Refining Evaluations with AI Assessments मूल्यांकन के लिए metrics / Metrics to evaluate स्वर्ण मानक के रूप में मानवीय मूल्यांकन / Human Evaluation as the Gold Standard RAG: ज़रूरत पड़ने पर संदर्भानुसार गहन जानकारी आज़माने योग्य तकनीकें / Techniques to Experiment With फाइन-ट्यूनिंग: विशेषज्ञता की कला ट्रेनिंग डेटा की कमी: मात्रा और गुणवत्ता के संतुलन की समस्या / Insufficient Training Data: The Quantity-Quality Equilibrium असंतुलित ट्रेनिंग डेटा: पक्षपात की दुविधा / Unbalanced Training Sets: The Bias Dilemma सार्वजनिक डेटा का पुनः उपयोग: नए signal की अनिवार्यता / Reusing Public Data: The New Signal Imperative कमजोर प्रॉम्प्ट इंजीनियरिंग: स्पष्ट निर्देश / Poor Prompt Engineering: The Clarity Commandment क्रमिक रूप से मूल्यांकन न करना: लगातार होने वाली चूक / Not Evaluating Incrementally: The Continuous Oversight जब सब कुछ ज़रूरी हो समापन

(discuss.pytorch.kr)

32 पॉइंट द्वारा ninebow 2023-11-24 | 3 टिप्पणियां | WhatsApp पर शेयर करें

Zapier के AI प्रोडक्ट डेवलपर Tal Peretz द्वारा लिखे गए लेख का अनुमति लेकर अनुवाद किया गया है.
मूल लेख यहाँ देखा जा सकता है, और इसके मुख्य बिंदु नीचे दिए गए हैं.

प्रॉम्प्ट इंजीनियरिंग - शुरुआती चरण
मूल्यांकन की भूमिका: (नेविगेशन का मानक) ध्रुवतारा
- AI मूल्यांकन के लिए व्यवस्थित दृष्टिकोण / Systematic Approach to AI Evaluations
- गहन परीक्षण के लिए dataset का उपयोग / Dataset Utilization for In-depth Testing
- AI आकलन के साथ मूल्यांकन को परिष्कृत करना / Refining Evaluations with AI Assessments
- मूल्यांकन के लिए metrics / Metrics to evaluate
- स्वर्ण मानक के रूप में मानवीय मूल्यांकन / Human Evaluation as the Gold Standard
RAG: ज़रूरत पड़ने पर संदर्भानुसार गहन जानकारी
- आज़माने योग्य तकनीकें / Techniques to Experiment With
फाइन-ट्यूनिंग: विशेषज्ञता की कला
- ट्रेनिंग डेटा की कमी: मात्रा और गुणवत्ता के संतुलन की समस्या / Insufficient Training Data: The Quantity-Quality Equilibrium
- असंतुलित ट्रेनिंग डेटा: पक्षपात की दुविधा / Unbalanced Training Sets: The Bias Dilemma
- सार्वजनिक डेटा का पुनः उपयोग: नए signal की अनिवार्यता / Reusing Public Data: The New Signal Imperative
- कमजोर प्रॉम्प्ट इंजीनियरिंग: स्पष्ट निर्देश / Poor Prompt Engineering: The Clarity Commandment
- क्रमिक रूप से मूल्यांकन न करना: लगातार होने वाली चूक / Not Evaluating Incrementally: The Continuous Oversight
जब सब कुछ ज़रूरी हो
समापन

3 टिप्पणियां

cosine20 2023-11-27

साझा करने के लिए धन्यवाद।

apkas 2023-11-24

लगता है यह OpenAI द्वारा प्रकाशित A Survey of Techniques for Maximizing LLM Performance से लगभग वही सामग्री है, है न?

ninebow 2023-11-25

मैं OpenAI DevDay वीडियो नहीं देख पाया था, और अब पता चला कि उसमें वह session भी है जिसके बारे में आपने बताया था. :)
बताने के लिए धन्यवाद!

(+ दूसरों के लिए, मैं वह YouTube लिंक साझा कर रहा हूँ जो मुझे मिला!)
https://www.youtube.com/watch?v=ahnGLM-RC1Y

प्रोडक्शन-ग्रेड LLM एप्लिकेशन के लिए डेवलपर गाइड (अनुवादित लेख)

संबंधित पढ़ाई

3 टिप्पणियां