1 पॉइंट द्वारा GN⁺ 3 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Anthropic नई funding round के बाद valuation के मामले में OpenAI को पीछे छोड़ते हुए दुनिया का सबसे मूल्यवान AI startup बन गया है
  • Claude बनाने वाली Anthropic की valuation 1 trillion dollar के करीब पहुंच गई है, जो फरवरी में लगभग 380 billion dollar से लगभग तीन गुना अधिक है
  • Series H round में इसने 65 billion dollar जुटाए, और Altimeter Capital, Dragoneer, Greenoaks, Sequoia Capital प्रमुख निवेशकों में शामिल रहे
  • growth की प्रमुख ताकत Claude AI assistant और developers के बीच व्यापक रूप से इस्तेमाल होने वाला Claude Code है, जबकि annual revenue 10 billion dollar से बढ़कर 47 billion dollar हो गया है
  • OpenAI को मार्च में 122 billion dollar round के बाद 852 billion dollar valuation मिली थी, और दोनों कंपनियां public stock offering पर विचार कर रही हैं

valuation और funding

  • Anthropic नई funding round के बाद market valuation में OpenAI को पीछे छोड़ते हुए दुनिया का सबसे मूल्यवान AI startup बन गया है
  • Claude AI assistant बनाने वाली Anthropic की valuation 1 trillion dollar के करीब है
  • Anthropic ने Series H investment round में 65 billion dollar जुटाए हैं
  • प्रमुख निवेशकों में Altimeter Capital, Dragoneer, Greenoaks, Sequoia Capital शामिल हैं
  • नई valuation फरवरी के लगभग 380 billion dollar की तुलना में लगभग तीन गुना अधिक है
  • investment package में Amazon के 5 billion dollar समेत पहले से सहमत निवेश भी शामिल हैं

growth factors और competitive landscape

  • Anthropic की growth का प्रमुख आधार Claude AI assistant और software developers के बीच व्यापक रूप से इस्तेमाल की जाने वाली Claude Code service की लोकप्रियता है
  • कंपनी का annual revenue लगभग 10 billion dollar से बढ़कर 47 billion dollar हो गया है
  • Anthropic ने नया AI model Claude Opus 4.8 और enterprise customers के लिए मजबूत cyber security features देने वाला closed system Claude Mythos Preview पेश किया है
  • Anthropic के CFO Krishna Rao ने कहा कि Claude products की demand दुनिया भर में तेज़ी से बढ़ती जा रही है
  • OpenAI को मार्च की 122 billion dollar investment round के बाद 852 billion dollar valuation मिली थी
  • बड़ी AI कंपनियां listing की तैयारी कर रही हैं, और CNBC के अनुसार OpenAI आने वाले कुछ हफ्तों में IPO के लिए आवेदन कर सकता है
  • Anthropic भी public stock offering पर विचार कर रहा है, लेकिन सटीक समय सार्वजनिक नहीं किया गया है

1 टिप्पणियां

 
GN⁺ 3 시간 전
Hacker News की राय
  • काश डेवलपर्स फिर कभी यह न कहें कि वे मार्केटिंग से प्रभावित नहीं होते। सिर्फ Claude की बात करने वाले समूह भी अक्सर दिखते हैं, और यह किसी आधुनिक Tupperware पार्टी जैसा लगता है
    मेरे एक सहकर्मी को पूरा यक़ीन था कि Claude बेहतर है, इसलिए मैंने Claude Code और Codex harness का इस्तेमाल करके ज़रूरी कुछ PRs को gpt5.5 और opus4.7 से इम्प्लीमेंट कराया, फिर सिर्फ कोड देखकर यह पहचानने को कहा कि कौन-सा मॉडल है, लेकिन वह पहचान नहीं पाया
    मुझे लगता है यहाँ मौजूद 99% लोग भी अगर 5 मॉडल टेस्ट दें, जिनके सारे नतीजे असल में एक ही मॉडल से आए हों, तो वे फर्क नहीं बता पाएँगे। आखिर में यह सब सिर्फ एहसास ही है

    • मुझे समझ नहीं आता कि सिर्फ दो PR देखकर कोई मॉडल का हस्ताक्षर पहचानने की उम्मीद क्यों करेगा। पहले से ही सैकड़ों टेस्ट पर आधारित बहुत से benchmarks हैं जो दिखाते हैं कि GPT-5.5 और Opus-4.8 काफ़ी मिलते-जुलते नतीजे देते हैं, हालांकि यह समझना मुश्किल है कि वे टेस्ट वास्तव में क्या जाँचते हैं
      दोनों को subscribe करके max reasoning पर चलाओ तो हर मॉडल की relative strengths और weaknesses दिखती हैं। सिर्फ कोड को सरसरी तौर पर देखने से यह हमेशा नहीं दिखता, और कुछ समस्याओं में एक मॉडल लंबे समय तक भटकता रहता है, जबकि दूसरा codebase के सही हिस्से ढूँढकर ज़्यादा efficient समाधान निकालता है
      antirez ने भी कहा था कि वह जो optimization काम कर रहे थे उसमें GPT-5.5, Opus से बेहतर था। उल्टा, कुछ ऐसे task groups भी हैं जहाँ GPT-5.5 बार-बार अटकता है और Opus उन्हें ज़्यादा जल्दी हल कर देता है। हाल में मैं ऐसे code पर भी काम कर रहा हूँ जहाँ दोनों ही अच्छा समाधान नहीं दे पाते, और large language models मूलतः ऐसे ही होते हैं
      Claude की चर्चा ज़्यादा इसलिए दिखी क्योंकि वह पहले आगे निकल गया था। Codex थोड़ा देर से आया, और GPT भी शुरू में Opus से कमज़ोर था। अब हम तब टेस्ट कर रहे हैं जब वह अंतर काफ़ी कम हो चुका है
    • इसे Tupperware पार्टी कहना भावनात्मक लगता है। ऐसा लगता है कि बराबरी साबित करने के लिए आप उन कई बातों को जानबूझकर नज़रअंदाज़ कर रहे हैं जो डेवलपर्स के लिए महत्वपूर्ण हैं, और असली software बनाने की प्रक्रिया को देख ही नहीं रहे
      वह टेस्ट सिर्फ final output देखता है और पूरी generation process को नज़रअंदाज़ करता है। Claude Code कुछ समय तक पहले आया था और बेहतर था, तो अगर कोई टूल वही output दे रहा है, तो भला बेवजह क्यों बदलें
      Claude Code agentic software development process में काफ़ी समय तक आगे था, और मैं अब भी उसकी features को ज़्यादा पसंद करता हूँ। मेरे हिसाब से Opus 4.7 बड़ा पीछे जाना था, और Claude Code में बार-बार होने वाले feature changes की वजह से ऐसा भी लगता है कि नतीजे रोज़ ख़राब हो रहे हैं। हालांकि मैं यह भी परख रहा हूँ कि कितना कम explicit रहने पर भी ठीक नतीजे मिल सकते हैं, इसलिए फर्क समझना मुश्किल हो जाता है
      इन ठोस वास्तविकताओं को पूरा का पूरा मार्केटिंग कहना अपने-आप में ऐसा लगता है जैसे अब तक क्या हुआ और आगे क्या होगा, यह देखे बिना Codex को काफ़ी अच्छा टूल बताकर push करने की कोशिश हो
    • लगता है आप यह ज़रूरत से ज़्यादा आँक रहे हैं कि किसी individual developer के पास कितनी choice होती है। कंपनी ने Claude Code membership का contract किया है, इसलिए Claude Code इस्तेमाल होता है, और Codex इस्तेमाल नहीं किया जा सकता
      काम की जगह Claude Code subscription इस्तेमाल करने वालों की बात अक्सर सुनता हूँ, लेकिन workplace Codex subscription की बात शायद ही कभी सुनता हूँ। Anthropic ने enterprise customers को OpenAI से कहीं बेहतर target किया, जबकि OpenAI Sora जैसे consumer products के पीछे भागता रहा
    • जैसे यह पहचानना मुश्किल हो सकता है कि कोई कोड Vim में लिखा गया है या VS Code में, लेकिन कोड लिखने वाले इंसान के लिए यह फ़र्क बहुत बड़ा हो सकता है। अंतिम परिणाम के अलावा बाकी चीज़ें भी टूल चुनने में मायने रखती हैं
    • यह बात हमेशा वाकई दिलचस्प लगती है। चाहे कोई व्यक्ति वास्तव में कितना भी बुद्धिमान हो, या खुद को कितना भी बुद्धिमान समझता हो, हम सब influence के प्रति संवेदनशील हैं और blind test चौंकाने वाली आसानी से बनाए जा सकते हैं
      यक़ीन है कि आप A और B में फर्क कर सकते हैं? अच्छा, करके देख लीजिए। चाहे dining table पर high-end wine की तुलना हो या agents की, बात एक ही है। एक option इस्तेमाल कीजिए, फिर दूसरा, और हो सकता है सब एक ही option हों; अगर आप स्थिर रूप से फर्क नहीं बता पाते, तो इसका मतलब है कि आप भी हम सब जैसे ही इंसान हैं
      बाद में यह कहना आसान है कि आपको पहले से पता था, लेकिन असली फर्क blind test में सामने आता है। या फिर सामने नहीं आता
  • मुझे लगता है Sam Altman कोई ख़ास अच्छा इंसान नहीं है, और मैं अपना पैसा कहीं और खर्च करना चाहूँगा
    frontier models का commoditization होना तय है। OpenAI अभी भी शायद यह सोचता है कि वह technology के आधार पर compete कर रहा है, लेकिन अगर उसे यह समझ होता कि अब प्रतिस्पर्धा user experience और market reputation पर है, तो वह यह भी समझता कि Altman की लगातार पैदा की गई उलझन से बनने वाली negative PR आख़िरकार सब कुछ डुबो सकती है

    • मुझे समझ नहीं आता कि आप Dario का समर्थन बेहतर कैसे कह सकते हैं
      किसी भी क्षेत्र में ऊपर की जगहों पर शायद ही कोई ठीक-ठाक इंसान होता है। वे सच में users की परवाह नहीं करते, उन्हें सिर्फ पैसा चाहिए
    • Dario भी Sam जितना ही बुरा है
    • Altman वाकई अच्छा इंसान नहीं लगता, लेकिन अगर आपको लगता है कि Anthropic अच्छा पक्ष है, तो मेरे पास बुरी ख़बर है। वह OpenAI से भी बदतर हो सकता है
    • यह विचार कि intelligence commodity बन जाएगी, पूरी तरह intuition के ख़िलाफ़ जाता है
      यह सोच इस विश्वास से आती है कि intelligence हमसे आगे नहीं जा सकती, लेकिन चरम पर यह लगभग निश्चित रूप से ग़लत है। जंगली जीवन की तरह बहुत-सी superintelligence के उभरने की संभावना काफ़ी ज़्यादा है
  • यह पूरी तरह मज़ाक है
    Anthropic ने कुछ समय के लिए code-केंद्रित होने के कारण जो बढ़त मिली थी, उसका अच्छा फायदा उठाया, और वही enterprise contracts में बदल गया
    लेकिन renewal के समय उसने उन्हीं कंपनियों के लिए मॉडल बदल दिया: seats के लिए users को जितना usage व्यावहारिक रूप से चाहिए वह शामिल होने के बजाय, seat cost के ऊपर हर token का API price भी देना पड़ता है। और वह API price भी पिछले 1 साल में कितनी बार बढ़ा, पता नहीं
    Sonnet 3.5 दौर की goodwill और enterprise purchasing delays की वजह से, उन्होंने लगभग बंधक जैसी स्थिति बनाकर revenue को पागलों की तरह बढ़ाया, और उसी revenue spike को valuation में बदल दिया
    वही कंपनियाँ bill देखकर चौंकेंगी और छोड़कर चली जाएँगी। यह बेहद हास्यास्पद short-term thinking है
    मुझे लगता है OpenAI बेहतर कंपनी है। transparency, open source releases, OpenClaw जैसी चीज़ों को संभालने का तरीका, competition का तरीका—सबमें; brand भी कहीं ज़्यादा मजबूत है, consumer touchpoint भी बेहतर हैं, और मेरे साथ-साथ बहुत से लोगों के लिए coding apps और models भी बेहतर हैं
    Anthropic का बार-बार ग्राहकों के ख़िलाफ़ जाकर सिर्फ short-term revenue spikes बनाने की कोशिश करना लंबे समय तक टिकाऊ business नहीं है
    इतनी कम उम्र की कंपनी का इतना लंबा bait-and-switch इतिहास होना सच में अजीब है। बार-बार price hikes, बार-बार rate limit कम करना, terms बदलना, OpenClaw वाले calls block करना, यहाँ तक कि IDE partners और enterprise partners को भी नाराज़ करना
    मेरी नज़र में Anthropic पर भरोसा करने वाला लगभग हर व्यक्ति किसी न किसी हद तक तुरंत इस्तेमाल किया गया। जल्द ही इसकी छवि AI कंपनियों की Oracle जैसी हो जाएगी
    मैं तो इसे OpenAI की आधी valuation भी नहीं दूँगा

    • कंपनियाँ पहले से ही जा रही हैं। bill shock भी है, और developer sentiment भी Codex की तरफ़ शिफ्ट होने लगा है। हालाँकि, शायद एक-दो महीने में हवा फिर बदल जाएगी
      Claude Code का इतनी जल्दी commodity बन जाना देखना दिलचस्प है
      लेकिन OpenAI का brand बहुत बेहतर है, इस बात से मैं बिल्कुल भी मज़बूती से सहमत नहीं हूँ। Anthropic ने इन दोनों में से अधिक ethical और more human company होने की branding काफ़ी सफलतापूर्वक बनाई है। असल में वह वैसी है या नहीं, इससे फ़र्क नहीं पड़ता
    • मैं कुछ हद तक असहमत हूँ। October में Opus 4.5 के बाद से agentic development को लेकर developer sentiment काफ़ी बदल गया है। बहुत सी teams ने बहुत हाल में Anthropic से पहले की तुलना में कहीं ज़्यादा वास्तविक value देखनी शुरू की है
      OpenClaw जैसी चीज़ें security risk की वजह से अभी भी किसी गंभीर enterprise environment का हिस्सा नहीं हैं
      मुझे समझ नहीं आता कि seat-based pricing का AI में आधा भी viable होना लोग क्यों मानते हैं। जिन organizations को मैं जानता हूँ, उन्होंने API pricing पर जाने के बाद ही, मिलने वाली value को बड़ा मानते हुए, वास्तव में गंभीर spending commit करनी शुरू की है
    • इस स्तर का गुस्सा और अतिशयोक्ति कुछ ज़्यादा लगती है। आप Anthropic को नापसंद कर सकते हैं और उसके business practices से असहमत हो सकते हैं, लेकिन internet standards के हिसाब से भी यह बहुत ज़्यादा है
    • Anthropic ने मेरे साथ कभी customer-hostile व्यवहार नहीं किया
  • अब Sam Altman, ऐसा लगता है, OpenAI की सफलता पर एक काफ़ी बड़ा liability बनता जा रहा है। पिछले 6 महीनों में Anthropic की explosive growth का बड़ा हिस्सा शायद इस धारणा से आया कि लोग उसे “वह AI startup जो Sam Altman नहीं चला रहा” मानते हैं
    Anthropic की technology शानदार है, लेकिन इस समय उसकी सबसे बड़ी asset शायद यह है कि वह “OpenAI नहीं” है। सही हो या ग़लत, फिलहाल यही OpenAI को पीछे खींचने वाला कारक लगता है

    • पता नहीं ज़्यादातर लोग इसकी परवाह भी करते हैं या उन्हें इसकी जानकारी भी है। ChatGPT अभी भी consumer market और brand awareness में भारी बढ़त रखता है
      Anthropic ने जो सच में बहुत अच्छा किया है, वह है enterprise के भीतर गहराई तक प्रवेश करना
      पिछले 6 महीनों में मैंने खुद देखा है कि enterprises के सामान्य employees ने Claude cowork को बहुत बड़े पैमाने पर अपनाया है। वे सब genuinely हैरान हैं कि यह उनके लिए क्या-क्या कर रहा है
      OpenAI ज़्यादा Google जैसी कंपनी बनना चाहती दिखती है, लेकिन यहाँ consumer side शायद उतना अच्छा battleground नहीं हो सकता
    • हैरानी की बात यह है कि Anthropic भी साफ़ तौर पर कोई saint नहीं है, फिर भी Altman उन्हें बेहतर पक्ष जैसा दिखाकर उनकी marketing को मज़बूत कर देता है
      जब Anthropic ने Department of War के साथ बहुत कमज़ोर शर्तों पर बहस की, तब कोई सचमुच moral AI company होती तो वह शुरू से ही war crimes में शामिल नहीं होती, लेकिन Altman के लिए वह एक test था। उसे बस वही रुख़ लेना था, लेकिन वह psychopath है, इसलिए वह उस बुनियादी test में भी fail हो गया
    • पता नहीं आपने Dario Amodei को बोलते हुए देखा है या नहीं। मुझे दोनों ही सच में नापसंद हैं, लेकिन Dario ऐसा लगता है जैसे लापरवाह बयान देकर लोगों को डराना उसका शौक हो, और उसकी आवाज़ भी Elizabeth Holmes की नकल जैसी लगती है
      उसने जो कहा या किया है, उसमें कुछ भी ऐसा नहीं था जिससे वह ज़्यादा भरोसेमंद व्यक्ति लगे
  • भले ही OpenAI के models व्यावहारिक रूप से Anthropic के models से बेहतर हों, फिर भी मैं Altman को support नहीं करना चाहता, इसलिए उनका उपयोग नहीं करूँगा

    • क्या आपको लगता है Amodei अलग है?
    • दुनिया में उसके पास आख़िर कितनी authority है? क्या उसके पास ऐसे projects हैं जिनकी लोग परवाह करते हैं, या ऐसे outputs जिन पर कोई निर्भर करता है?
      मुझे समझ नहीं आता कि आप उस व्यक्ति की इतनी परवाह कैसे कर लेते हैं जो आपके खरीदे API को बनाने और support करने वाले लोगों से लगभग 7 स्तर ऊपर बैठा है
  • कल रात मैंने बच्चों को बहस करते सुना। “मेरे पापा बहुत बड़े हैं।” “मेरे पापा घर से भी बड़े हैं।” “नहीं, मेरे पापा roller coaster से भी बड़े हैं।” “अच्छा? मेरे पापा 50km हैं।” “मतलब लंबे?” “हाँ, मेरे पापा तुमसे लंबे हैं।”
    बहुत मज़ेदार था। अच्छे दिन पर भी मेरी लंबाई लगभग 5 फुट 7 इंच है। valuation भी कुछ ऐसे ही काम करती लगती है। हम 5 फुट के दिग्गजों को सिर पर उठा रहे हैं

  • यह ऐसा है जैसे unicorns अपनी-अपनी rockets बाँधकर सिर्फ़ एक-दूसरे को देख रहे हों और उन्हें पता ही न चले कि धरती बहुत दूर छूट चुकी है
    वे या तो हम सबको मार देंगे या एक-दूसरे को। कम से कम वे वादे के मुताबिक दुनिया को बेहतर जगह तो नहीं बना रहे

    • Dario से तो मुझे बहुत तेज़ी से ऐसा vibe आता है: “पहले दुनिया को राख कर दूँगा, फिर उसे बेहतर बनाऊँगा, पक्का।”
  • oAI और Anthropic पर gwern के साथ हुई बातचीत को फिर से देखने का यह अच्छा समय है: https://news.ycombinator.com/item?id=40816755 और ये लगभग 2 साल पहले की भविष्यवाणियाँ हैं
    कुल मिलाकर, आजकल लगता है कि pure research specialization मुख्य फोकस नहीं रहा, और शायद इससे दुनिया को नुकसान भी हुआ हो। training scaling से “test-time” scaling की ओर शिफ्ट हुआ है, और मुझे व्यक्तिगत रूप से यह नाम पसंद नहीं है। लगता है Ilya ज़रूरी नहीं था, लेकिन वह क्या बना रहा है, इसे लेकर सचमुच जिज्ञासा है
    मेरी यह भविष्यवाणी ठीक लगती है कि जो चीज़ें गहराई से embedded हों, बहुत धनी हों, और global infrastructure का हिस्सा बन जाएँ, वे फ़ायदे में रहेंगी। oAI/MS 2024 की बढ़त का इस्तेमाल करके अंतर और बढ़ा देगा—यह सुझाव ग़लत निकला
    हमने दोनों ने coding को value और behavior को drive करने वाले product के रूप में ज़्यादा नहीं देखा था, और यही बात बहुत दिलचस्प है। जून 2024 में शायद किसी भी रूप में असली capability दिखने में लगभग 6 महीने बाकी थे
    लगता है हम दोनों को लगा था कि एक breakout company निकलेगी या निकल सकती है। मैंने basket में खरीदने का सुझाव दिया था, लेकिन GOOG, oAI, Anthropic—तीनों ने पिछली quarter/year में काफ़ी revenue बनाया, इसलिए यह स्पष्ट रूप से वैसा नहीं रहा
    2024 में Anthropic का जो क्षेत्र शुरुआती अवस्था में था लेकिन अब मुझे बहुत मूल्यवान लगता है, वह उसका mechanistic interpretability (mechinterp) group है। दूसरे labs के public work में अभी तक मैंने ऐसा quality level नहीं देखा जो Anthropic के क़रीब पहुँचता हो
    यह group साफ़ तौर पर एक productive phase में प्रवेश कर चुका है, और मुझे लगता है कि ship को steer करने वाले taste-makers के tools के रूप में यह सचमुच टिकाऊ strategic advantage दे सकता है। 2024 में interpretability लगभग हाथ न आने वाली समस्या लगती थी, लेकिन अब steady incremental progress से बहुत कुछ संभव लगता है

    • समग्र रूप से mechanistic interpretability इस समय पूरी तरह undervalued है। मैं सहमत हूँ कि Anthropic team सबसे rigorous काम कर रही है, और अब Goodfire भी साथ है
      वे neuroscience में in vivo thought tracing के सबसे क़रीब काम कर रहे हैं, और research topic के रूप में यह सचमुच बहुत rough science fiction जैसा लगता है। फिर भी ऐसा लगता है कि ज़्यादातर लोगों को पता ही नहीं है कि यह सब हो रहा है
      “universal subspace hypothesis” नाम के paper में खोजे गए विचारों के साथ जोड़ें तो यह engineering से आगे बढ़कर अधिक philosophical और spiritual क्षेत्रों तक की खाई पाटना शुरू करता है। लेकिन बात भटक गई
  • Codex gtp-5.5 बड़े projects में opus 4.7 से काफ़ी बेहतर है

    • मुझे काफ़ी मज़बूती से लगता है कि gpt-5.x बड़े projects में इसलिए अच्छा है क्योंकि इसे dedicated apply_patch primitive पर intensively train किया गया है
      आधिकारिक apply_patch implementation अच्छी तरह designed है। यह two-stage process है जिसमें change set की सभी files unambiguous होने तक कोई actual change नहीं किया जाता। pre-commit error feedback आम तौर पर एक-दो extra attempts में anchoring issues ठीक कर देता है
      आम प्रवाह कुछ ऐसा होता है: “file A L1:154 पढ़ो, file B L1:123 पढ़ो, patch apply करने की कोशिश करो, A और B दोनों में anchor errors, file A L43:67 पढ़ो, file B L50:74 पढ़ो, patch apply करने की कोशिश करो, patch सफल, compile और unit tests चलाओ”
      इस implementation में जिस current line number पर समस्या मिली है, वह भी return होती है, इसलिए anchor error feedback बेहद मददगार है
      पूरी file replace करना या find-and-replace पर निर्भर techniques ज़्यादा isolated context में उपयोगी होती हैं। लेकिन अगर 20+ files refactor करनी हों, तो apply_patch जैसी चीज़ चाहिए। actual replacement target के लिए specific line numbers पर निर्भर रहने का तरीका complex editing scenarios में पूरी तरह dead end है
      https://developers.openai.com/api/docs/guides/tools-apply-pa...
    • मेरा अनुभव भी यही है। Codex gtp-5.5 ज़्यादा बेहतर intuition दिखाता है, कम code लिखता है, और ठीक वही जगह ढूँढ लेता है जिसे बदलना चाहिए
      फिर भी opus 4.7 से 4.8 में जाते हुए उसका character काफ़ी बेहतर हुआ है। 4.7 बहुत ज़्यादा pleasing था
    • GPT-5.5 बेहतर programmer है, लेकिन Opus 4.8 अब भी बेहतर system designer और product designer है
      Codex अक्सर पेड़ तो देखता है, जंगल नहीं, लेकिन बड़े codebase में बड़े बदलाव सफलतापूर्वक करने की उसकी क्षमता कहीं बेहतर है। Claude Code ज़्यादा गलतियाँ करता है, लेकिन उसका taste बेहतर है और वह idiomatic, elegant software development को ज़्यादा अच्छी तरह समझता है
      अगर सामर्थ्य हो, तो दोनों को बारी-बारी से इस्तेमाल करने की सलाह दूँगा
    • Codex/GPT की दिक्कत यह है कि वह बहुत verbose है। ख़ासकर JavaScript और Python में helper functions बहुत होते हैं, एक ही जगह इस्तेमाल होने वाले 1~2 लाइन के functions बहुत होते हैं, और types या proxy-जैसी objects भी बहुत होती हैं
      इसे टालने के लिए मैं खास instructions डालता हूँ, लेकिन फिर भी आधा समय उसकी इस verbosity से लड़ने में चला जाता है
      अभी मैं उन functions/classes का सिर्फ़ NotImpelmented skeleton बनवाता हूँ जिनकी ज़रूरत मुझे पता है, और कहता हूँ कि implementation सिर्फ़ उसी specific जगह के अंदर करो। थोड़ा बेहतर हुआ है, लेकिन अब भी function के अंदर function definitions से जूझना पड़ता है
    • किस मायने में? LM Arena के code category में Opus 4.7 1567 -/+ 7 है और GPT-5.5 Codex 1505 -/+ 10 है। मैं अभी दोनों इस्तेमाल कर रहा हूँ
      हाल का अनुभव Opus, अब 4.8 की ओर झुकता है, लेकिन GPT-5.5 Codex के बेहतर होने की बातें दिलचस्प हैं, इसलिए मैं और testing कर रहा हूँ
  • अब मुझे लगता है कि कंपनियों के बीच घूमते हुए अगली चमकदार release का पीछा करने से ज़्यादा महत्वपूर्ण यह है कि जिस model का आप उपयोग करते हैं, वह कैसे काम करता है और क्या कर सकता है—इसकी मज़बूत workflow और समझ हो
    मैंने अभी Codex के साथ अपना पहला बड़ा project पूरा किया है, और यह मानना मुश्किल है कि Claude इससे बहुत बेहतर हो सकता है। वह थोड़ा बेहतर या बदतर हो सकता है, लेकिन अब सब इतने अच्छे हो चुके हैं कि फ़र्क उपयोगकर्ता बनाता है

    • अगर आपने इस industry में लंबे समय तक काम किया है, तो इसमें कुछ भी नया नहीं है
      हम पहले भी इस तरह की बहसें करते रहे हैं कि मेरी tech choice तुम्हारी tech choice से बेहतर है या नहीं। वही धर्मयुद्ध है, बस technology अलग है
      आज की सलाह भी 10, 20, 30 साल पहले जैसी ही है। अपने लिए जो काम करे उसे चुनो और कुछ अच्छा बनाओ
      सच तो यह है कि किसी को फ़र्क नहीं पड़ता कि आपने उसे कैसे बनाया। नतीजा अच्छा हो या बुरा, दोनों ही हाल में; और अगर बुरा हो, तो tool को दोष दे सकते हो
    • Anthropic और OpenAI दोनों के पास अभी vendor lock-in बनाने की मज़बूत incentive है। ख़ासकर बड़े users के लिए, कंपनियों के बीच move कर पाने की क्षमता काफ़ी महत्वपूर्ण लगती है
      अभी यह मुश्किल नहीं होना चाहिए, लेकिन आगे चलकर यह काफ़ी ज़्यादा कठिन हो सकता है