15 पॉइंट द्वारा GN⁺ 2024-03-13 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • Devin दुनिया का पहला पूरी तरह स्वायत्त AI software engineer है
  • Devin human engineers के साथ मिलकर या स्वतंत्र रूप से काम कर सकता है, और engineers को अधिक दिलचस्प समस्याओं पर ध्यान केंद्रित करने में मदद करता है
  • Devin जटिल engineering tasks की योजना बना सकता है और उन्हें execute कर सकता है, और shell, code editor, browser जैसे developer tools का उपयोग कर सकता है

Devin की क्षमताएँ

  • Devin ने long-term reasoning और planning में प्रगति की है, और यह हज़ारों फैसले लेते हुए जटिल engineering tasks को पूरा कर सकता है।
  • यह users के साथ सहयोग करते हुए real time में प्रगति रिपोर्ट कर सकता है, feedback ले सकता है, और design choices साथ मिलकर तय कर सकता है।
  • Devin नई technologies सीख सकता है, apps build और deploy कर सकता है, codebase में bugs ढूँढकर ठीक कर सकता है, और अपने AI models को train तथा fine-tune कर सकता है।

Devin का प्रदर्शन

  • SWE-bench coding benchmark में, Devin ने वास्तविक GitHub issues को हल करने में 13.86% की success rate दिखाई, जो पिछले सर्वश्रेष्ठ 1.96% रिकॉर्ड से काफी आगे है।
  • Devin का मूल्यांकन dataset के यादृच्छिक 25% subset पर किया गया, और जहाँ अन्य models को यह बताया गया था कि किन files को edit करना है, वहीं Devin ने बिना किसी मदद के काम किया।

Cognition का परिचय

  • Cognition reasoning पर केंद्रित एक applied AI lab है।
  • इसका लक्ष्य AI teammates विकसित करना है, जो आज के AI tools से आगे की क्षमताएँ प्रदान कर सकें।
  • Cognition को Founders Fund के नेतृत्व में 21 million dollar की Series A funding मिली है, और इसे industry leaders का समर्थन प्राप्त है।

Devin को hire करें

  • Devin अभी early access चरण में है, और यदि आप engineering tasks में Devin का उपयोग करना चाहते हैं, तो Cognition से संपर्क कर सकते हैं।

हमारे साथ जुड़ें

  • Cognition की team छोटी है, और founding team के पास IOI के 10 gold medals हैं, साथ ही इसमें Cursor, Scale AI, Lunchclub, Modal, Google DeepMind, Waymo, और Nuro में काम कर चुके leaders और builders शामिल हैं।
  • Devin का निर्माण केवल पहला कदम है, और सबसे कठिन चुनौतियाँ अभी बाकी हैं।

GN⁺ की राय

  • Devin नाम का यह AI software engineer software development के भविष्य का प्रतीक है, और automation तथा AI के संयोजन से engineering work की efficiency को काफी बढ़ाने की क्षमता रखता है।
  • AI ने वास्तविक engineering समस्याओं को हल करने में इतनी ऊँची success rate दिखाई है, यह एक उल्लेखनीय उपलब्धि है, और यह दिखाता है कि AI technology वास्तविक कार्यस्थल के वातावरण में कितनी अच्छी तरह integrate हो सकती है।
  • हालांकि, AI द्वारा मानव कार्य को प्रतिस्थापित करने के ethical और social प्रभावों पर विचार करना आवश्यक है। नौकरियों पर AI के प्रभाव और मानव भूमिकाओं में बदलाव के प्रति सावधानीपूर्ण दृष्टिकोण की आवश्यकता है।
  • समान सुविधाएँ देने वाले अन्य AI-आधारित development tools में GitHub Copilot शामिल है, जो developers को code लिखने में सहायता देने वाला व्यापक रूप से उपयोग किया जाने वाला tool है।
  • Devin जैसी technology को अपनाते समय data security, privacy, और AI के निर्णयों में transparency तथा accountability के मुद्दों पर विचार करना चाहिए। यह समझना और प्रबंधित करना महत्वपूर्ण है कि AI के निर्णय business और users को कैसे प्रभावित करते हैं।

2 टिप्पणियां

 
yangeok 2024-03-13

Devin को फ्री में आज़माना चाहता/चाहती हूँ

 
GN⁺ 2024-03-13
Hacker News की राय
  • एक डेवलपर और प्रोडक्ट जिम्मेदार व्यक्ति के रूप में, AI का इस्तेमाल करके कोडिंग करने की कोशिश की, लेकिन context length, मॉडल के कमजोर output, architecture की कमी आदि के कारण असफल रहे। Leetcode में मदद से आगे बढ़ने वाले उपयोगी काम AI से नहीं कर पाए। एक साधारण HTML पेज से selector निकालने का काम भी कई AI मॉडल्स के साथ आज़माया, लेकिन सफल नहीं हुए। तकनीकी प्रगति को लेकर उम्मीदें बहुत थीं, लेकिन अब ऐसा प्रोडक्ट चाहिए जो सच में ठीक से काम करे.
  • इंसान ऐसे काम की तलाश करता है जो अर्थ और संतोष दे। तकनीकी प्रगति के साथ कारीगर सबसे पहले बेकार हो जाते हैं। समाज यह संदेश देता है कि अगर आप value पैदा नहीं करते, तो आपकी गरिमा को मान्यता नहीं मिलती। कला और engineering को AI के हवाले करने से वे लोग भी इसे सस्ते में इस्तेमाल कर पाएंगे जो इसे समझते नहीं हैं। यह सवाल उठता है कि तकनीकी प्रगति से फायदा किसे हो रहा है, और भविष्य में इंसानों की जगह कहाँ होगी.
  • Scott Wu 1989 के बाद से परफेक्ट स्कोर पाने वाले गिने-चुने लोगों में से एक हैं, और प्रतिस्पर्धी programming olympiad में उनसे मुलाकात हुई थी। उनकी अद्भुत प्रतिभा का उपयोग होते देख खुशी होती है.
  • authentication के बिना मनचाहे आकार की फाइल अपलोड करने देने वाली वेबसाइट से बहुत प्रभावित नहीं हैं। 500MB की फाइल सर्वर पर अपलोड कर दी.
  • अगर AI वाकई उत्कृष्ट है, तो उसका उपयोग अच्छे कामों के लिए होना चाहिए। एक senior software engineer के रूप में, कोड लिखना काम का 90% नहीं है; असली काम जटिल requirements को स्पष्ट tasks में तोड़ना, requirements की खामियाँ ढूँढना, न्यूनतम कोड लिखना, और codebase को समझना है। "AI software engineer" से ज्यादा "AI human liaison" की जरूरत है.
  • डेमो प्रभावशाली है, लेकिन उसका दायरा सीमित है, इसलिए संदेह है कि वास्तविक परिस्थितियों में यह कितना अच्छा काम करेगा। क्या यह software architecture कर सकता है, क्या इसका समाधान सिर्फ पुनरुत्पादन भर है, और कितनी बार ऐसी स्थिति आएगी जहाँ 90% सही समाधान पर्याप्त नहीं होगा—ये सवाल हैं.
  • backend development का अनुभव रखने वाले व्यक्ति के रूप में, LLM तब code generation में चौंकाने वाला productivity boost देता है जब आपको मूल libraries/frameworks/language की अच्छी समझ हो। लेकिन फिर भी सब कुछ जानना जरूरी है, और AI अपने-आप सब कुछ नहीं कर सकता.
  • डेमो प्रभावशाली है और लॉन्च पर बधाई, लेकिन यह जानने की जिज्ञासा है कि Devin जिन bugs का सामना करता है, क्या वे आसान fixes से हल हो जाते हैं। उदाहरण के लिए, KeyError को ठीक करने के लिए कोड को try-catch में लपेट देना कोड को चला सकता है, लेकिन यह हमेशा आदर्श समाधान नहीं होता.
  • LLM अभी भी "तुक मिलाने" वाले चरण में है। यह "तार्किक सोच" तक पहुँच पाएगा या नहीं, यह अज्ञात है, लेकिन coding में जटिल समस्याओं पर तार्किक सोच की जरूरत होती है। बदलाव की रफ्तार को देखते हुए, किसी भी संभावना को पूरी तरह खारिज नहीं किया जा सकता.
  • इस क्षेत्र में काम करने वाले व्यक्ति के रूप में, coding में AI का उपयोग फिलहाल सहायक tool और advanced autocomplete के स्तर पर है। Pythagora जैसी कंपनियाँ मानती हैं कि मानव हस्तक्षेप महत्वपूर्ण है, और LLM को ऐसे उत्साही junior developer की तरह समझा जा सकता है जो निर्देश मिलने पर तेजी से काम करता है। अंदरूनी prompts और इंसानी थोड़े-से मार्गदर्शन के साथ यह चौंकाने वाले नतीजे दे सकता है.