4 पॉइंट द्वारा GN⁺ 2025-03-21 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • इनपुट टोकन $150, आउटपुट टोकन $600 (प्रति 10 लाख)
    • o1-mini से 150 गुना महंगा
  • o1 सीरीज़ के मॉडल को Reinforcement Learning के जरिए इस तरह प्रशिक्षित किया गया है कि वे जवाब देने से पहले सोचें और जटिल reasoning कर सकें
    • o1-pro मॉडल अधिक computational resources का उपयोग करके और गहराई से सोचता है और लगातार उच्च-गुणवत्ता वाले जवाब देता है
  • Responses API में ही इस्तेमाल किया जा सकता है, और निम्न फीचर्स को सपोर्ट करता है
    • कई tools call को सपोर्ट
    • API request का जवाब देने से पहले कई turns तक model interaction को सपोर्ट
  • 200,000 context window, अधिकतम output token संख्या 100,000
  • cutoff 1 अक्टूबर 2023 है

1 टिप्पणियां

 
GN⁺ 2025-03-21
Hacker News राय
  • यह मॉडल केवल नए Responses API के जरिए इस्तेमाल किया जा सकता है। अगर आपके पास Chat Completions इस्तेमाल करने वाला कोड है, तो इसे सपोर्ट करने के लिए Responses पर upgrade करना होगा
    • मेरे LLM टूल में support जोड़ने में समय लग सकता है
  • कीमत: 10 लाख input tokens पर $150, 10 लाख output tokens पर $600
    • बहुत महंगा है, लेकिन ChatGPT Pro subscription के साथ इस्तेमाल करने पर यह हैरान करने वाली क्षमता दिखाता है
    • अगर इसे 100,000 tokens का codebase दिया जाए, तो यह ऐसे सूक्ष्म bugs ढूँढ लेता है जिन्हें मैंने पूरी तरह नजरअंदाज कर दिया था
    • API की कीमत और मैं जो subscription price चुका रहा हूँ, उनकी तुलना करूँ तो थोड़ा अपराधबोध होता है
  • पेलिकन के साइकिल चलाने वाला SVG render करने में 94 सेंट लगे
  • अगर मान लें कि $160k सालाना वेतन वाला एक प्रेरित office worker दिन में 6 घंटे सुनता या बोलता है, तो 10 लाख tokens की लागत लगभग $10k बैठती है
    • OpenAI अब अपने frontier model pricing के साथ अत्यधिक कुशल इंसानों के करीब पहुँच गया है
    • o3 pro इस स्थिति को बदल सकता है, लेकिन अगर o3 सच में जल्द आने वाला होता, तो मेरा नहीं मानना कि वे यह मॉडल जारी करते
  • इसमें 2023 knowledge cutoff और 200k context window है
    • यह कुछ निराशाजनक है
  • o1-pro, Grok 3 think और Claude 3.7 think सहित बाकी सभी releases की तुलना में अब भी बेहतर है
    • मैं Pro subscription cancel करने वाला था, लेकिन 4.5 non-coding/Math tasks के लिए बहुत अच्छा है
    • o3 pro का इंतजार नहीं हो रहा
  • कुछ लोगों ने इसे test करके पसंद किया
    • उन्हें Sonnet 3.7 पर काफी भरोसा है
    • वे चाहते हैं कि यह और तेज हो
    • ज्यादातर समस्याएँ execution की हैं, और वे चाहते हैं कि AI यह काम उनके खुद coding करने से तेज करे
  • लगता है o1-pro का इस्तेमाल switch जैसा tool या codebase को दोबारा verify करने के लिए होगा
    • भले ही कीमत कम हो, मेरा मानना है कि Sonnet से 10 गुना speed पाने के लिए काफी काम और domain knowledge चाहिए होगा
  • o1-pro streaming support नहीं करता
    • अनुमान है कि यह कई जवाब खोजने के लिए best-of-n जैसी तकनीक इस्तेमाल करता है
    • मेरा मानना है कि llm-consortium से बहुत कम कीमत पर मिलते-जुलते नतीजे मिल सकते हैं
    • आप कई models को prompt कर सकते हैं, और उनमें से सबसे अच्छा जवाब चुन या synthesize कर सकते हैं
    • इसे तब तक दोहराया जा सकता है जब तक confidence threshold तक न पहुँचा जाए
  • पहले लगा था कि इसे platform में जोड़ा जा सकता है, लेकिन कीमत देखकर अधिकांश users के लिए इस मॉडल को enable करने में हिचकिचाहट होती है
    • समृद्ध enterprises को छोड़ दें, तो ज्यादातर users खुद अपने पैर पर कुल्हाड़ी मारेंगे
  • मुझे हमेशा शक रहा है कि o1-Pro शायद o1 model का ही workflow है
    • संभव है कि यह 8 o1 instances में distribute करके नतीजों को aggregate करता हो