1 पॉइंट द्वारा GN⁺ 2025-06-11 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • OpenAI ने o3 मॉडल की कीमत 80% घटा दी है
  • इस कीमत कटौती से startup और IT उद्योग में o3 के उपयोग की लागत का बोझ काफी कम हो गया है
  • AI services डेवलपर्स को अब एक अधिक किफायती विकल्प मिलेगा
  • बाज़ार प्रतिस्पर्धा के और तेज़ होने और AI अपनाने के लिए अधिक तेज़ माहौल बनने की उम्मीद है
  • मॉडल का उपयोग बढ़ने के साथ ecosystem expansion में तेज़ी आने का अनुमान है

OpenAI o3 की कीमत में 80% कटौती

  • OpenAI ने o3 मॉडल की कीमत पहले की तुलना में 80% कम करने की नीति की घोषणा की है
  • इसके चलते startup, छोटे और मझोले व्यवसाय, और व्यक्तिगत डेवलपर्स अब काफी कम लागत पर o3 मॉडल की API का उपयोग कर सकेंगे
  • AI के उपयोग में प्रवेश बाधा कम होने से विभिन्न AI applications और services के विकास की संभावना बढ़ेगी
  • यह नई मूल्य नीति AI बाज़ार में प्रतिस्पर्धा को बढ़ावा देगी और तकनीक के तेज़ प्रसार के लिए अनुकूल माहौल बनाएगी
  • आगे चलकर deep learning algorithm की दक्षता बढ़ाने और बड़े पैमाने की AI services के विकास में लागत बचत के ज़रिए अतिरिक्त innovation को बढ़ावा मिलने की संभावना दिखती है

1 टिप्पणियां

 
GN⁺ 2025-06-11
Hacker News राय
  • अपने अनुभव के आधार पर एक सावधानी साझा करना चाहता हूँ। OpenRouter में पहले से क्रेडिट था, इसलिए o3 को सक्रिय करने की कोशिश की, लेकिन संदेश आया कि "OpenAI में o3 API इस्तेमाल करने के लिए सीधे API key देनी होगी"। इसलिए मैंने OpenAI अकाउंट में $20 का API क्रेडिट खरीदा और नई API key और o3 मॉडल के साथ Aider शुरू किया। रिक्वेस्ट भेजते ही एरर आया कि "o3 इस्तेमाल करने के लिए organization verified होना चाहिए, organization verify करने के लिए लिंक में Verify Organization पर क्लिक करें"। इससे झुंझलाहट बढ़ती गई, और OpenAI पर वापस जाकर Verify Organization पर क्लिक किया तो पता चला कि असल में अपनी पहचान किसी third party, Persona, के जरिए verify करनी होगी। "Start ID Check" पर क्लिक करने पर बताया गया कि Persona मेरी personal information और biometric information इकट्ठा और इस्तेमाल करेगी, और यह डेटा 1 साल तक रखा जाएगा। सिर्फ API access पर कुछ डॉलर खर्च करने की कोशिश कर रहा था, और अचानक मुझसे कहा जाने लगा कि अपनी biometric जानकारी दुनिया की सबसे बड़ी AI company और उसकी partner company को दे दूँ। रिफंड कैसे मिलेगा, यह भी समझ नहीं आ रहा
    • मेरे साथ भी पहले एक दूसरी AI company में रिफंड न मिलने का मामला हुआ था, और मैंने California state attorney general से संपर्क करके रिफंड दिलवाया था। मेरा मानना है कि पेमेंट के बाद इस तरह की अतिरिक्त शर्तें थोपने से उन्हें रोका जाना चाहिए। और जब वे personal data के रूप में नाम, पता, और card information पहले ही ले रहे हैं, तो phone number क्यों माँगते हैं, यह भी समझ नहीं आता। क्या किसी को पता है कि सब से phone number लेने की वजह क्या है
    • यह सवाल भी आता है कि क्या Sam Altman वही crypto company (Worldcoin) नहीं चला रहे जो identity verification के लिए biometric data इकट्ठा करती है। कुछ जाना-पहचाना सा लग रहा है Worldcoin जानकारी
    • लगता है पिछले एक महीने में लगभग यही कहानी देखी थी, इसलिए या तो déjà vu हो रहा है, या फिर इसमें कुछ और बात है
    • सच कहूँ तो कम से कम identity verification की कोशिश कर पाना भी आपकी किस्मत है। मुझे तो महीनों से सिर्फ "session expired" एरर ही मिल रहा है और support team जवाब भी नहीं दे रही
    • ऐसा लग रहा है कि इसी समय KYC (Know Your Customer) की माँग और OpenAI द्वारा सारे logs स्टोर करने की बात साथ-साथ सामने आ रही है
  • आजकल लगता है OpenAI "आलसी" हो गया है। सवाल पूछो तो पूरी file या actual changes देने के बजाय सिर्फ कहता है "ऐसा करना चाहिए", और सच में करने के लिए 2-3 बार और कहना पड़ता है। DeepSeek में मैंने ऐसा नहीं देखा। सोच रहा हूँ क्या resources बचाने के लिए ऐसा जवाब दिया जा रहा है
    • मैं OpenAI में काम करता हूँ। हमारे models कभी-कभी आलसी हो सकते हैं। यह जानबूझकर नहीं है, और आगे हम बेहतर models देने वाले हैं। Netflix में काम करते समय भी ऐसा ही शक जताया जाता था कि क्या हम जानबूझकर low-quality recommendations देते हैं, जबकि असल वजह यह थी कि product quality को बेहतर बनाना उतना आसान नहीं होता। आखिरकार, perfect product बनाना सच में बहुत मुश्किल है
    • हाल में chemistry calculations के लिए मैंने कहा "X बनाम Y का graph बना दो", तो जवाब सिर्फ लंबी-चौड़ी explanation था और आखिर में लिखा था "अगर graph चाहिए तो बताइए!"। थोड़ी हास्यास्पद बात है
  • यह सवाल है कि हमें कैसे पता चले कि o3 मॉडल quantized (कम precision वाला) version नहीं है। कंपनियाँ benchmark results अच्छे दिखाकर बाद में धीरे-धीरे quantize (Q8 से Q6, Q4 वगैरह) करके performance गिरा सकती हैं, ऐसा शक होता है। gpt-4-turbo भी क्या इसी वजह से जल्दी आया था? असल इस्तेमाल में वह original GPT-4 से कमज़ोर लगा, और शायद turbo और 4o में benchmark पर ज़्यादा फोकस किया गया। यूज़र्स को लगता है कि यह बेहतर है, जबकि असल में उतना नहीं है
    • यही शायद कंपनियाँ करती हैं, और मेरा मानना है कि original o3 को o3-pro के रूप में rebrand किया गया है
    • हमेशा लगता है कि नया मॉडल शुरू में अच्छा निकलता है, फिर धीरे-धीरे output खराब होने लगता है। पहले मुझे लगता था कि वे खराब outputs को fine-tuning से हटाने की कोशिश में overall performance भी घटा देते हैं, लेकिन अब quantizing को लेकर ज़्यादा शक होता है
    • मैं OpenAI में काम करता हूँ, मॉडल वही है और हमने quantizing या कोई चाल नहीं चली है। API में developers को बताए बिना मॉडल बदलना कभी नहीं होता। ChatGPT में users को हर समय version numbers दिखाना असुविधाजनक होता है, इसलिए updates थोड़े कम स्पष्ट लग सकते हैं, लेकिन पूरी तरह चुपचाप बदलाव नहीं होते। ChatGPT Release Notes में सारे model updates सार्वजनिक हैं। बस chatgpt-4o-latest pointer एक अपवाद है, जिसे पहले से बताए बिना बदला जाता है
    • आधिकारिक announcement mail में कहा गया था कि "OpenAI ने o3 की कीमत 80% घटाकर input के लिए $2 प्रति 10 लाख tokens और output के लिए $8 प्रति 10 लाख tokens कर दी है, और सिर्फ inference stack optimize किया गया है, इसलिए मॉडल वही है लेकिन सस्ता हो गया है"
    • announcement के तुरंत बाद o3 में 700 से ज़्यादा tokens प्रति सेकंड की speed दिख रही थी, इसलिए सच में शक होता है कि यह quantized version तो नहीं संबंधित लिंक
  • क्या ChatGPT Plus users के लिए o3 से जुड़ी साप्ताहिक message quota भी बढ़ाई गई है, यह जानना चाहता हूँ। मेरे अनुभव में o4-mini और o4-mini-high, usefulness के मामले में o3 से काफी पीछे हैं, लेकिन o3 rate-limited होने की वजह से ज़्यादातर o4-mini series ही इस्तेमाल करनी पड़ती है। यह ढाँचा खुद ही इस धारणा को मज़बूत करता है कि "OpenAI के think models प्रतिस्पर्धियों से पीछे हैं"
    • मैंने भी o3 पर काफी सख्त rate limits महसूस किए हैं, और o4-mini-high मुझे काफ़ी अच्छा लगा, लेकिन फिर भी मैं o3 को कहीं ज़्यादा इस्तेमाल करना चाहूँगा। उम्मीद है इस announcement के साथ quota भी बढ़ा हो
  • Google भी AI में तेज़ी से पकड़ बना रहा है। कुछ ही महीने पहले तक DeepSeek चर्चा में था, लेकिन यह क्षेत्र सच में बहुत तेज़ी से बदल रहा है
    • बहुत से लोगों की नज़र में Google Gemini models अब SOTA (State Of The Art, सर्वोच्च प्रदर्शन) माने जाते हैं, और coding tasks में Claude भी काफ़ी अच्छा माना जाता है
    • पिछले कुछ महीनों से मैं सिर्फ Google के models इस्तेमाल कर रहा हूँ, क्योंकि अब ChatGPT बहुत ज़्यादा मीठा-मीठा और हल्का लगने लगा है। जवाब की शुरुआत या अंत ही नहीं, बीच में भी बहुत filler होता है और ठोस जानकारी कम। अगर style बदलने को कहो तो वह technical jargon ज़्यादा उछालने लगता है
    • DeepSeek को लेकर लोगों का उत्साह इसलिए था क्योंकि उसका मॉडल सीधे download किया जा सकता था। लेकिन Gemini 2.5 के बाद से वह तीसरे स्थान से ऊपर खास नहीं बढ़ पाया लगता है
  • समझ नहीं आता कि OpenAI o3 इस्तेमाल करने के लिए "organization" verification में state-issued ID क्यों माँग रहा है
    • मेरी सलाह होगी कि कोशिश भी मत कीजिए। बहुत से लोग verification प्रक्रिया में fail हुए हैं, और दूसरी chance भी नहीं मिलती, ऐसा feedback है मामला1 मामला2 मामला3 मामला4 मामला5 मामला6 मामला7
    • क्या यह DeepSeek R2 को OpenAI models पर train होने से रोकने के लिए भी हो सकता है, ऐसा भी लगता है
  • अक्सर कहा जाता है कि LLMs के पास कोई मजबूत competitive moat नहीं है और वे सिर्फ cash जला रहे हैं, लेकिन OpenAI की स्थिति मुझे काफ़ी उत्साहजनक लगती है। उसने annualized revenue $10 billion होने की घोषणा की है, और पिछले मार्च की funding में valuation $300 billion तक पहुँच गई। $5 billion का घाटा होने के बावजूद revenue 30 गुना बढ़ा है और 50 करोड़ से ज़्यादा active users हैं। यह growth मुझे शुरुआती Uber की याद दिलाती है, जहाँ तेज़ growth, भारी investment, और profitability की दिशा में प्रगति साथ दिखी थी
    • समस्या यह है कि revenue बढ़ने पर costs भी साथ बढ़ती हैं। आमतौर पर scale बढ़ने पर unit cost घटती है, लेकिन OpenAI में usage बढ़ने के साथ computing cost भी लगभग उसी अनुपात में बढ़ती है। जब तक अतिरिक्त revenue streams न बढ़ें, economies of scale कमज़ोर रहेंगी। Netflix भी कुछ हद तक ऐसा ही उदाहरण है। मुझे नहीं लगता कि sustainable profitability पाना आसान होगा
    • मेरे अनुभव में OpenAI के first-mover advantage की वजह से मैं अभी भी monthly payment जारी रखता हूँ, और अलग-अलग options बदलने की खास इच्छा नहीं होती। बाद में अगर market स्थिर हुआ और price competition बढ़ी, तो मैं खुशी से switch करूँगा। अंततः यह इस पर निर्भर करेगा कि मुख्य revenue app users से आता है या API plans से; उसी हिसाब से first-mover advantage टिकेगा। भरोसे और brand name के अलावा, मेरे आसपास लोग अलग-अलग alternatives को स्थिति के मुताबिक चुनते दिखते हैं
    • आखिरकार LLM की कीमतें लगातार गिरती जाएँगी और सिर्फ free models ही बचेंगे, इस नज़रिए से OpenAI का moat कमज़ोर है। "सोचने वाले models" भी जटिल समस्याएँ हमेशा हल नहीं कर पाते, इसलिए उन्हें कुछ ज़्यादा ही बढ़ा-चढ़ाकर आंका गया है
    • मैं 'कोई moat नहीं' वाली बात से सहमत नहीं हूँ। chat data जैसी user interaction data अपने आप में बहुत मूल्यवान है
    • अगर सिर्फ OpenAI की growth देखें तो वह उत्साहजनक है, लेकिन ChatGPT जैसी AI कंपनियों के सामाजिक प्रभाव को साथ में देखें तो तस्वीर इतनी उजली नहीं लगती। उदाहरण के लिए online shops में अर्थहीन AI-generated content की बाढ़ आने से खरीदारी का अनुभव खराब हुआ है। ChatGPT में ज़रूरत से ज़्यादा डूबे कुछ समूहों में असली दोस्तों और परिवार से संवाद बिगड़ना, यहाँ तक कि तलाक जैसी विचित्र स्थितियाँ भी देखी गई हैं। शिक्षा क्षेत्र में भी दुरुपयोग से काफी अव्यवस्था है। Uber की growth की तरह, OpenAI की सफलता का सामाजिक असर पूरी तरह सकारात्मक ही होगा, यह मानना सही नहीं होगा
  • o3 मॉडल अभी शीर्ष मॉडलों में से एक है, और इसकी कीमत Claude, Gemini के बराबर या उनसे कम है। लगता है जैसे प्रतिद्वंद्वियों को साँस लेने की भी मोहलत नहीं मिल रही
    • Gemini भी लगभग उसी स्तर पर है, कभी-कभी उससे बेहतर भी, इसलिए उसे चुनना भी एक तर्कसंगत विकल्प है। o3-pro शायद उन सबसे एक कदम आगे हो सकता है
  • पहले Google Search की गुणवत्ता बिगड़ने में दशकों लगते थे, अब हम ऐसे समय में हैं जहाँ AI models की performance बिगड़ने में कुछ ही दिन लगते हैं
  • संभव है कि o3-pro का launch भी इसी वजह से जुड़ा हो