34 पॉइंट द्वारा xguru 2023-06-01 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • Andrej Karpathy ने Build 2023 में यह प्रस्तुति दी
  • यह 2 भागों में विभाजित है
    • (Chat)GPT सहायक को ट्रेन करने का तरीका
    • इस सहायक को अपनी application में लागू करने का तरीका
  • Tokenization, Pretraining, Supervised Finetuning, Reinforcement Learning from Human Feedback आदि के बारे में व्यापक रूप से समझाया गया है,
    साथ ही prompt strategies, विभिन्न ecosystem tools, और भविष्य के विस्तारों का भी परिचय दिया गया है

2 टिप्पणियां

 
kuroneko 2023-06-01

इसे संक्षेप में देखें तो बात कुछ इस तरह निकलती है।

  • GPT जैसे बड़े language models को बड़े पैमाने के text data पर pre-training चरण और खास tasks के लिए fine-tuning के जरिए train किया जाता है।
  • Pre-training में सामान्य language representations सीखने के लिए sequence में अगले शब्द की भविष्यवाणी करना शामिल होता है। Fine-tuning मॉडल को किसी खास task के लिए अनुकूलित करती है।
  • Prompting का उपयोग fine-tuning के बिना भी language model को tasks पर लागू करने के लिए किया जा सकता है, जिसमें मॉडल को response generate करने के लिए prompt दिया जाता है।
  • Supervised fine-tuning में prompt और ideal response वाले labeled data का उपयोग करके assistant model को train किया जाता है।
  • Human feedback से reinforcement learning करके assistant model को ऐसे responses बनाने के लिए train किया जा सकता है जिन्हें इंसान अधिक रेटिंग दें, और इससे performance को और बेहतर किया जा सकता है।
  • Prompting engineering techniques, जैसे मॉडल की कार्य-प्रक्रिया को step-by-step दिखाना या examples देना, language model की performance को बेहतर बना सकती हैं।
  • Language models में इंसानों जैसी internal monologue और reasoning क्षमता की कमी होती है, इसलिए prompting को इसकी भरपाई करनी पड़ती है।
  • Language model को external tools, calculator और knowledge base तक access देने से performance बेहतर हो सकती है।
  • किसी खास task के लिए language model के कुछ हिस्सों को fine-tune करना performance बढ़ा सकता है, लेकिन यह अधिक जटिल होता है।
  • Bias, reasoning errors और attacks के प्रति vulnerability जैसी language models की कई सीमाएँ अब भी मौजूद हैं।
 
xguru 2023-06-01

https://www.youtube.com/watch?v=bZQun8Y4L2A
वही वीडियो YouTube पर भी उपलब्ध है, लेकिन Microsoft साइट पर AI द्वारा अनूदित हिंदी सबटाइटल्स समर्थित हैं, इसलिए मैं वही लिंक साझा कर रहा हूँ.