8 पॉइंट द्वारा GN⁺ 2025-05-07 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Google ने Gemini 2.5 Pro Preview(I/O Edition) को आधिकारिक I/O इवेंट से पहले ही जल्दी जारी किया, ताकि डेवलपर फ़ीडबैक को शामिल किया जा सके और प्रदर्शन बेहतर किया जा सके
  • यह फ्रंटएंड और UI डेवलपमेंट में खास तौर पर मजबूत प्रदर्शन देता है, और कोड रूपांतरण, संपादन, अमूर्तता का आकलन करने की क्षमता बेहतर हुई है
  • VideoMME बेंचमार्क में 84.8% प्रदर्शन के आधार पर अब वीडियो-आधारित लर्निंग ऐप का ऑटो-जनरेशन संभव हो गया है
  • डिज़ाइन रीजनिंग के ज़रिए स्टाइल के अनुरूप UI बनाना और फीचर जोड़ना भी आसानी से किया जा सकता है
  • 25 मार्च का मौजूदा वर्ज़न अपने आप 6 मई वाले वर्ज़न में अपडेट हो जाएगा, और बिना अतिरिक्त काम के बेहतर मॉडल का उपयोग किया जा सकेगा

फ्रंटएंड डेवलपमेंट में उत्कृष्ट प्रदर्शन

  • Gemini 2.5 Pro ने WebDev Arena लीडरबोर्ड में पहला स्थान हासिल किया
  • aesthetically pleasing UI और कार्यात्मक पूर्णता के आधार पर मानव वरीयता मूल्यांकन में शीर्ष स्तर का प्रदर्शन साबित किया
  • Cognition और Replit के साथ सहयोग के माध्यम से एजेंट-आधारित प्रोग्रामिंग की संभावनाएँ बढ़ाई जा रही हैं

कोड समझ और रीजनिंग का संयोजन

  • वीडियो → कोड फीचर

    • VideoMME बेंचमार्क में 84.8% प्रदर्शन के साथ SOTA स्तर की वीडियो समझ हासिल
    • YouTube वीडियो के आधार पर इंटरैक्टिव लर्निंग ऐप का ऑटो-जनरेशन संभव
    • पिछले वर्ज़न की तुलना में पूरे UI और इंटरैक्शन स्तर पर बेहतर परिणाम प्रदान करता है
  • फीचर डेवलपमेंट ऑटोमेशन

    • पहले डिज़ाइनर फ़ाइल खोलकर रंग, फ़ॉन्ट, मार्जिन आदि को मैन्युअली CSS में बदलना पड़ता था
    • Gemini 2.5 Pro अब स्टाइल-मैच्ड कंपोनेंट्स का ऑटो-जनरेशन कर सकता है
    • उदाहरण: Gemini 95 ऐप के साथ समान स्टाइल वाला वीडियो प्लेयर फीचर जोड़ना स्वचालित किया जा सकता है
  • आइडिया → ऐप इम्प्लीमेंटेशन की गति में सुधार

    • dictation starter app जैसे मामलों में, फीचर + विज़ुअल क्वालिटी दोनों को साथ लेकर ऐप जनरेट किया जा सकता है
    • waveform animation, responsive design, mouseover effects जैसे बारीक UI एलिमेंट्स का ऑटो-जनरेशन
    • उपयोगकर्ता के सीधे डिज़ाइन किए बिना भी डिफ़ॉल्ट रूप से सौंदर्यपूर्ण परिणाम तैयार होते हैं

डेवलपर फ़ीडबैक का समावेश और उपयोग का तरीका

  • पिछले वर्ज़न की तुलना में function calling error rate में कमी और call trigger में सुधार किया गया है
  • मौजूदा 03-25 वर्ज़न अपने आप 05-06 वर्ज़न को पॉइंट करेगा → अलग से अपडेट की ज़रूरत नहीं
  • Google AI Studio और Vertex AI में तुरंत उपयोग किया जा सकता है
  • मॉडल कार्ड भी नवीनतम जानकारी के साथ अपडेट कर दिया गया है
  • नवीनतम वर्ज़न में अपने आप अपडेट होगा, और कीमत में कोई बदलाव नहीं है

उपयोग और अपेक्षाएँ

  • Replit, Cursor, Cognition आदि में इसे अगली पीढ़ी के coding agent के रूप में अपनाने पर विचार हो रहा है या उपयोग किया जा रहा है
  • व्यक्तिगत डेवलपर से लेकर एंटरप्राइज़ तक एजेंट-आधारित डेवलपमेंट फ़्लो के प्रसार में योगदान की उम्मीद है

1 टिप्पणियां

 
GN⁺ 2025-05-07
Hacker News राय
  • पहले प्रोग्रामिंग के लिए ऐसे मॉडल इस्तेमाल करते समय सबसे बड़ी शिकायत यह थी कि ये मौजूद न होने वाले API गढ़ लेते थे। Gemini 2.5 मॉडल, खासकर Pro और Flash वर्ज़न, में यह समस्या दूसरे मॉडलों की तुलना में कम होती है

    • फिर भी काफ़ी सीमाएँ हैं, और मौजूदा मॉडल का इंसानों की तरह abstraction और architecture को समझना अभी संभव नहीं है
    • लेकिन Gemini मॉडल अब रोज़मर्रा की प्रोग्रामिंग में search और Stack Overflow की जगह ले सकते हैं
  • Gemini 2.5 Pro ने WebDev Arena leaderboard में पहला स्थान हासिल किया

    • WebDev Arena का नाम बदलकर React/Tailwind Arena रखना उचित लग सकता है
    • system prompt इन तकनीकों की माँग करता है, और जब vanilla JS या किसी दूसरे framework की माँग की जाती है, तो पूरा टूल ठीक से काम नहीं करता
    • web development की इतनी संकीर्ण परिभाषा पर मॉडलों का प्रतिस्पर्धा करना समस्या है
  • Gemini 2.5 से code माँगने पर यह बहुत ज़्यादा comments आउटपुट करता है

    • इसमें section comments, step comments, block comments, inline comments आदि की अत्यधिक मात्रा शामिल होती है
  • Gemini 2.5 agent tasks में बेहतरीन है, लेकिन code editing के लिए पूरी तरह सही diff बनाने में अभी भी दिक्कत होती है

    • पुराना Gemini 2.5 92% accuracy के साथ उचित diff बनाता है
    • उम्मीद है कि यह दर 95-98% तक बढ़ेगी
  • Google के प्रतिनिधि से सवाल: क्या Gemini-2.5-pro-exp (free version) भी अपडेट हुआ है, या यह गायब हो जाएगा?

    • blog post के अनुसार, पुराना वर्ज़न (03-25) अब नए वर्ज़न (05-06) की ओर इशारा कर रहा है, और बेहतर मॉडल इस्तेमाल करने के लिए किसी अतिरिक्त कार्रवाई की ज़रूरत नहीं है
    • यह जानना है कि क्या Gemini-2.5-pro-preview-03-25 अब 05-06 इस्तेमाल कर रहा है, और क्या यही बात Gemini-2.5-pro-exp-03-25 पर भी लागू होती है
  • experimental 03-25 और experimental 05-06 के benchmark की तुलना करने पर, नया वर्ज़न LiveCodeBench को छोड़कर हर चीज़ में थोड़ा कम स्कोर करता है

  • Gemini का इस्तेमाल लगभग हर काम में करता हूँ, लेकिन model card में तुलना सिर्फ़ o3-mini से की गई है

    • ज्ञात benchmark में o3 अब भी आगे है
  • Gemini 2.5 pro शानदार है, लेकिन UI में अभी भी scroll से जुड़ी समस्या है जिससे इसे इस्तेमाल करना कठिन हो जाता है

    • AI output पूरा होने के बाद कुछ मिनट इंतज़ार करना बेहतर है
    • developer tools में ms-code-block element ढूँढकर $0.textContext रिकॉर्ड करना भी भरोसेमंद है
  • Gemini 2.5 pro शानदार है, लेकिन इसकी लागत बहुत ज़्यादा है और यह लागत के बारे में अस्पष्ट जानकारी देता है

    • हाल में कई लोगों को अप्रत्याशित bills मिले हैं, और कुछ मामलों में सामान्य उपयोग पर भी $500 का खर्च आया
    • मैं भी इससे प्रभावित हुआ और टूल से API key हटा दी
  • यह मॉडल 12 benchmarks में से 10 में 03-25 से खराब प्रदर्शन करता है

    • coding के लिए training जारी रखते हुए सब कुछ और खराब हो गया, और संभव है कि sunk cost के कारण इसे छिपाने की कोशिश की गई हो
  • समझ नहीं आता कि "new preview" की जगह version number क्यों नहीं इस्तेमाल किया जा सकता

    • उदाहरण के लिए, इसे Gemini Pro 2.5.1 कहना बेहतर होगा