2 पॉइंट द्वारा GN⁺ 2024-09-17 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • g1 एक शुरुआती प्रोटोटाइप है जो LLM की reasoning क्षमता को बेहतर बनाने के लिए prompt strategy का उपयोग करता है
  • यह LLM को logical problems हल करने में सक्षम बनाता है और ऐसे प्रश्न सुलझाने में मदद करता है जिनमें मौजूदा models को कठिनाई होती है
  • g1 को open source के रूप में जारी किया गया है ताकि open source community नई strategies विकसित करने के लिए प्रेरित हो

यह कैसे काम करता है

  • g1, Llama3.1-70b का उपयोग करके dynamic Chain of Thought बनाता है।
  • हर चरण में LLM या तो अगले reasoning step पर जा सकता है या अंतिम उत्तर दे सकता है।
  • system prompt में LLM के लिए tips शामिल हैं।
  • उदाहरण के लिए, "वैकल्पिक उत्तरों की खोज शामिल करें" और "उत्तर निकालने के लिए कम से कम 3 तरीकों का उपयोग करें" जैसे निर्देश शामिल हैं।
  • इन तरीकों से LLM की reasoning क्षमता बेहतर होती है।

उदाहरण

  • g1 साधारण logical problems को 60-80% accuracy के साथ हल कर सकता है।
  • उदाहरण: "strawberry में कितने R हैं?" इस प्रश्न पर g1 ने 70% accuracy दिखाई।

त्वरित शुरुआत

  • Streamlit UI का उपयोग करने का तरीका:

    python3 -m venv venv  
    source venv/bin/activate  
    pip3 install -r requirements.txt  
    export GROQ_API_KEY=gsk...  
    streamlit run app.py  
    
  • Gradio UI का उपयोग करने का तरीका:

    cd gradio  
    pip3 install -r requirements.txt  
    python3 app.py  
    

Prompt strategy

  • Prompt उदाहरण:

    {  
      "title": "Identifying Key Information",  
      "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...",  
      "next_action": "continue"  
    }  
    
  • Prompt संरचना:

    • expert AI assistant की भूमिका देना
    • हर चरण के लिए title और content देना
    • JSON format में उत्तर देना
    • कम से कम 3 या अधिक reasoning steps का उपयोग करना
    • LLM की सीमाओं को पहचानना और वैकल्पिक उत्तरों की खोज शामिल करना
    • review करते समय वास्तव में अलग approach का उपयोग करना

प्रमुख fork

  • Mult1: कई AI providers का उपयोग करके o1-जैसी reasoning chain बनाना (GitHub Repository)

Credits

  • यह app Benjamin Klieger द्वारा विकसित किया गया है

GN⁺ का सार

  • g1, LLM की reasoning क्षमता को बेहतर बनाने के लिए prompt strategy का उपयोग करने वाला एक शुरुआती प्रोटोटाइप है।
  • इसे open source के रूप में जारी किया गया है ताकि open source community नई strategies विकसित करने के लिए प्रेरित हो।
  • साधारण logical problems हल करने में g1 ने मौजूदा models की तुलना में अधिक accuracy दिखाई है।
  • यह लेख LLM की reasoning क्षमता को बेहतर बनाने के लिए विभिन्न तरीकों का अन्वेषण करने में उपयोगी है।
  • समान functionality वाले अन्य projects में OpenAI का o1 शामिल है।

1 टिप्पणियां

 
GN⁺ 2024-09-17
Hacker News राय
  • ChainOfThought तरीका सरल है, जबकि TreeOfThoughts अधिक परिष्कृत तरीका है
    • OpenAI से जुड़ा संकेत tree search से संबंधित है
    • CoT को tree के रूप में बनाना और सर्वोत्तम समाधान खोजना महत्वपूर्ण है
  • निर्देशों को बड़े अक्षरों में ज़ोर देकर लिखना मज़ेदार है
    • AGI को सफल बनाने वाला पहला व्यक्ति वह होगा जो LLM की विश्वसनीयता बढ़ाने का तरीका खोज लेगा
  • o1 की असली नवोन्मेष Chain-of-Thought नहीं, बल्कि मॉडल को CoT अच्छी तरह करने के लिए सिखाना है
    • सिर्फ prompt engineering से o1 जैसा प्रदर्शन नहीं मिल सकता
  • LLM इनपुट को अलग तरह से 'ज़ूम' करके समस्या हल कर सकता है
    • टेक्स्ट को अक्षर-अक्षर देकर या उसे image फ़ॉर्म में बदलकर बारीकियां देखी जा सकती हैं
  • यह optillm प्रोजेक्ट जैसा काम करता है
    • कई optimization techniques का उपयोग करके LLM को बेहतर बनाया जा सकता है
  • ollama:8b का उपयोग करके इसे 100% local पर चलने लायक बदला गया है
    • Readme अभी तक अपडेट नहीं किया गया है
  • "reasoning" की परिभाषा खोजना महत्वपूर्ण है
    • LLM की reasoning समस्या को classical algorithms के साथ जोड़कर हल किया जा सकता है
    • सोचने की प्रक्रिया को दो हिस्सों में बांटकर उपयुक्त मॉडल पर चलाना चाहिए
  • .9 और .11 में कौन बड़ा है, यह पूछने वाले prompt पर इसने जवाब दिया कि .9 बड़ा है
    • यह सिर्फ एक साधारण system prompt है
  • मज़े के लिए प्रोजेक्ट को fork करके Llama-3.1 7B मॉडल को local पर चलाया गया
    • यह strawberry problem हल नहीं कर पाता, लेकिन यह समझ लेता है कि 0.9 बड़ा है