AI इस कोड के काम करने के तरीके को गहराई से समझ रहा है

(github.com/ocaml)

4 पॉइंट द्वारा GN⁺ 2025-11-27 | 2 टिप्पणियां | WhatsApp पर शेयर करें

OCaml native compiler में DWARF v5 debugging information जोड़ने वाला 13,000-लाइन का बड़ा PR सबमिट किया गया, जो macOS और Linux पर GDB·LLDB source-level debugging को सपोर्ट करता है
इम्प्लीमेंटेशन में function·line-level breakpoints, parameters और local variables tracking, basic type information display, AMD64·ARM64 support आदि शामिल हैं
लेखक ने कहा कि यह कोड Claude Sonnet 4.5 और ChatGPT 5(Codex) जैसे AI मॉडलों के सहयोग से बना है, और उसने खुद कोड लिखने के बजाय AI को निर्देशित·review किया
OCaml maintainers ने copyright issues, design discussion की कमी, maintenance burden, AI code review की कठिनाई आदि कारणों से merge से इनकार किया और PR बंद कर दिया
यह चर्चा AI-generated code की quality·copyright·collaboration process को लेकर open source community के सामने उभरती नई चुनौतियों का एक उदाहरण है

DWARF v5 debugging support PR का अवलोकन

PR, OCaml native compiler में DWARF v5 debugging information जोड़कर GDB और LLDB में source-level debugging संभव बनाता है
- function name·file·line के हिसाब से breakpoint सेट करना, variable names दिखाना, type information देना
- AMD64·ARM64 architecture support, 32-bit platform unsupported
macOS(Mach-O) और Linux(ELF) दोनों में section-relative relocations का उपयोग कर complete DWARF support इम्प्लीमेंट किया गया
LLDB plugin (ocaml_lldb.py) जोड़कर OCaml values के लिए print command (ocaml print) उपलब्ध कराया गया
टेस्ट 9 आइटम से बने हैं और functionality·type·line debugging को verify करते हैं

इम्प्लीमेंटेशन की बारीकियां

DWARF v4 से v5 में upgrade करते हुए DW_FORM_string का उपयोग किया गया ताकि link errors से बचा जा सके
multiple compile units(CU) support और string table deduplication
local variables·parameters tracking, lexical blocks, basic type information को DWARF structure में दर्शाया गया
Var_lifetime module से variable lifecycle tracking, fun_var_info field से compiler pipeline में variable information पास की गई
DW_TAG_lexical_block के जरिए nested scopes को व्यक्त किया गया
test scripts GDB·LLDB में breakpoints और type display को verify करते हैं

AI-generated code विवाद

लेखक ने कहा, “Claude Sonnet 4.5 ने अधिकांश हिस्सा लिखा और ChatGPT 5(Codex) ने review किया”
- उसने समझाया, “मैंने सिर्फ AI को guide किया और review किया, खुद एक भी लाइन नहीं लिखी”
कुछ फाइलों में Mark Shinwell का नाम author के रूप में शामिल होने से copyright attribution controversy पैदा हुई
लेखक ने अलग analysis report में दावा किया कि “OxCaml implementation से structure·naming·type system अलग हैं, इसलिए यह copy नहीं है”

maintainers की प्रतिक्रिया

gasche: design discussion के बिना 13,000 से अधिक lines का code सबमिट किया गया, इसलिए review·maintenance burden बहुत बड़ा है
- AI-लिखित code “review करना और कठिन है और legal risk भी है”, यह कहते हुए merge अस्वीकार किया गया
dra27: “AI understands code” जैसी अभिव्यक्ति की आलोचना करते हुए कहा कि LLM समझने वाला नहीं बल्कि pattern generation tool है
bluddy और tmcgilchrist: DWARF code को अलग library के रूप में अलग किया जाना चाहिए; compiler के भीतर शामिल होने पर maintenance burden बढ़ेगा
बहस तेज होने पर PR को ‘too heated’ status में lock कर दिया गया

AI और open source collaboration के मुद्दे

लेखक ने जोर दिया कि यह AI-based development experiment था और वह “यह साबित करना चाहता था कि AI high-quality code पूरा कर सकता है”
maintainers ने “AI-generated code की quality·copyright·review process” पर स्पष्ट policy की कमी की ओर इशारा किया
यह मामला AI-assisted development को open source projects में integrate करते समय जरूरी प्रक्रियाओं और मानकों पर चर्चा को प्रेरित करता है

2 टिप्पणियां

iolothebard 2025-11-27

लेकिन… PR सबमिट करने वाले व्यक्ति को इसकी ज़रा भी समझ नहीं है।
इसलिए… इस PR को ख़ारिज किया जाता है। (ठक ठक ठक)

GN⁺ 2025-11-27

Hacker News राय

सोचता हूँ क्या OCaml maintainers ने मुश्किल लोगों से निपटने की कोई खास ट्रेनिंग ली है
उनका धैर्य और परिपक्वता हैरान कर देने वाली है। मैं होता तो शायद Torvalds-स्टाइल में तुरंत ब्लॉक कर देता
- जिस बड़ी कंपनी में मैं काम करता हूँ वहाँ AI को लेकर संदेह रखने पर अलग-थलग समझा जाता है
  leadership को AI पर लगभग धार्मिक-सा विश्वास है, इसलिए वे चाहते हैं कि हर engineer AI का अधिकतम इस्तेमाल करे
  code review भी धीरे-धीरे AI को सौंपा जा रहा है। लेकिन इस मामले में शायद लोग इस वजह से विनम्र नहीं थे
- लगता है बड़े open source projects के maintainers को स्वाभाविक रूप से ऐसी ट्रेनिंग मिल ही जाती है
- contributor की नीयत दुर्भावनापूर्ण नहीं लग रही थी। शायद उस ऊर्जा को रचनात्मक दिशा में मोड़ने का कोई तरीका हो सकता था
  जैसे PR को बाँटना या design proposal देने के लिए प्रेरित करना
- कुछ लोगों की सोचने की क्षमता AI की वजह से बिगड़ गई लगती है
  maintainers इतने अच्छे हैं कि उन्हें ऐसे लोगों पर समय बर्बाद करते देख झुंझलाहट होती है
- thread दोबारा पढ़कर मैं प्रभावित हुआ
  maintainers ने बिना भावुक हुए जिस तरह तर्क और सहानुभूति से जवाब दिया, वह सच में पाठ्यपुस्तक जैसा communication था
  लेकिन यह भी सोचने वाली बात है कि कहीं ऐसी विनम्रता भ्रम को और मजबूत तो नहीं कर रही
एक व्यक्ति तो LLM से भी कम self-awareness वाला लगा
AI से बने commit की वैधता AI से पूछना वाकई बेतुका है
फिर भी कम से कम वह ईमानदार तो था। “मैं इस कचरे के पहाड़ को maintain करूँगा, लेकिन पैसे देने होंगे” वाली लाइन कमाल की थी
- community ने बहुत शांति से रचनात्मक feedback दिया, यह प्रभावशाली था
  उससे मुझे भी OCaml ecosystem में योगदान देने का मन हुआ
- मुझे लगता है वह सिर्फ मूर्ख नहीं था, बल्कि high-level troll भी हो सकता है
- वही हिस्सा तो पूरे दृश्य पर चेरी जैसा था
“आपने जो file submit की, उसके author के रूप में Mark Shinwell क्यों लिखा है?” इस सवाल पर
“AI ने ऐसा तय किया, मैंने पूछा ही नहीं” वाला जवाब सब कुछ बता देता है
- उससे पहले उसने कहा था, “AI इस code को गहराई से समझता है, चाहो तो चुनौती दे लो,” यह और भी मजेदार था
- इससे वह बात याद आती है कि अच्छे developers को कई abstraction levels पर एक साथ सोचना आना चाहिए
  AI पीढ़ी के ये लोग न्यूनतम बहु-दृष्टिकोण वाला सोच भी नहीं करते
  यह तो साफ था कि copyright क्यों डाला गया, यह पूछा जाएगा, फिर भी जवाब तैयार नहीं था
- open source होने के बावजूद, इस तरह का contribution मानसिक open source भावना से काफ़ी दूर लगता है
  review का बोझ आखिरकार maintainer पर डाल दिया जाता है, और maintenance की जिम्मेदारी contributor नहीं लेता
- पहले मुझे लगा यह मजाक है, लेकिन सच निकला तो झटका लगा
- मुझे लगा कहीं असली Mark Shinwell यहाँ सचमुच मौजूद तो नहीं, इसलिए मैंने उनका GitHub प्रोफ़ाइल देख लिया
इस आदमी का resume तो दंतकथा जैसा है
Wall Street बैंकों से लेकर Deutsche Bank में technology director, EA को license बेचना,
“Hardcore Erlang” किताब लिखने की कोशिश, 2 दिनों में 2 million dollar crypto funding वगैरह
या तो यह प्रतिभाशाली है, या सदी का सबसे बड़ा डींगमार
संबंधित लिंक: पुराना ब्लॉग, resume PDF, interview, official site, Erlang किताब रद्द होने की खबर
भले code AI ने बनाया हो, लेकिन अगर community समय लगाकर बात कर रही है और feedback दे रही है,
फिर भी author AI द्वारा लिखे लंबे टेक्स्ट को ज्यों का त्यों copy-paste करे, तो मेरे हिसाब से यह तुरंत block करने लायक है
spam bot की तरह व्यवहार करोगे तो spam bot जैसा ही व्यवहार मिलेगा
- पहले एक सहकर्मी ने Jira ticket को ChatGPT में डालकर उसका जवाब कॉपी किया और PR submit कर दिया
  मैं जब सवाल पूछता, तो उसके जवाब में वही सामान्य GPT-शैली झलकती थी
  आखिरकार मैंने खुद प्रयोग किया तो लगभग शब्द-शब्द वही जवाब निकल आया,
  और उसके बाद मैंने घोषित कर दिया कि मैं उसका code review नहीं करूँगा
“यह AI द्वारा लिखा गया copyright analysis है” सुनते ही सीमा पार हो गई थी
मैं होता तो उसी वक्त repo access ब्लॉक कर देता
- maintainers की भावनात्मक परिपक्वता वाकई चौंकाने वाली थी
- मुझे तो यह सिर्फ मसखरापन लगा, जिस पर हँसकर आगे बढ़ जाना चाहिए
मैंने भी कई open source projects में AI-generated PR बंद किए हैं
ऐसे contributors एक project में मना होने पर दूसरे project में चले जाते हैं
review का बोझ बढ़ता है, और असली contributors कम होते जाते हैं
फिर भी HN पर ऐसी चर्चा को real time में देखना दिलचस्प है
- यह PR आखिरकार बंद और lock कर दिया गया। maintainers ने धैर्यपूर्वक जवाब दिया, लेकिन
  author तर्क से ज़रा भी नहीं माना। लगता है दूसरे projects भी इसी तरह टिक पाएँगे
- open source maintainers कम-से-कम HN या Reddit पर मज़ाक का पात्र बनने से बचने के लिए भी इस लहर का विरोध करेंगे
  असली चिंता तो enterprise software की तरफ होनी चाहिए
मैं AI समर्थकों से पूछना चाहता हूँ
अगर AI से लिखी गई presentation दे दी जाए, और फिर सवाल आएँ, तो आप क्या जवाब देंगे?
यह मामला बिल्कुल वैसा ही है
- AI समर्थक के नज़रिए से कहूँ तो समस्या AI खुद नहीं है, बल्कि बिना समझे submit करने का रवैया है
  13k lines का PR समझे बिना फेंक देना, AI हो या न हो, गलत ही है
  AI सिर्फ एक tool है; चाहे CNC machine इस्तेमाल करो या आरी, नतीजे को समझना ज़रूरी है
- “AI ने ऐसा तय किया, मैंने पूछा ही नहीं” वाला जवाब ही सब बता देता है
- “मेरे पास फंडिंग नहीं है इसलिए जवाब नहीं दे सकता। पैसे दो, फिर AI से पूछूँगा” जैसा रवैया हास्यास्पद है
- इस पर यह मजाक भी आया कि राजनेता तो बरसों से यही करते आए हैं
- “AI आपके सवाल को पूरी तरह समझता है। अब साबित कीजिए कि वह गलत है” जैसी बात भी कही गई
अब तक देखे गए AI-generated PRs में यह सबसे अनोखा मामला था
ज़्यादातर मामलों में कोई beginner ऐसा code भेजता है जो चलता ही नहीं, लेकिन इस बार चीज़ जटिल थी और वास्तव में काम कर रही थी
author Joel Reymont 30 साल के अनुभव वाला developer था, और 2008 से HN account रखने वाला veteran भी
OCaml maintainers का धैर्य काबिले-तारीफ़ था, और आखिर में उसने एक मानवीय comment के साथ अपनी स्थिति समेटते हुए
कहा कि वह AI के जरिए OSS में योगदान देना बंद करेगा
फिर भी ऐसे PR अब भी सबके लिए समय की बर्बादी हैं,
और अब तक मैंने उनका कोई उत्पादक उपयोग नहीं देखा
यह सचमुच हैरान कर देने वाला PR था
संबंधित commit लिंक
- मजाक में कहा गया कि कम-से-कम वह बदलाव शायद AI ने नहीं लिखा होगा /s