- OCaml native compiler में DWARF v5 debugging information जोड़ने वाला 13,000-लाइन का बड़ा PR सबमिट किया गया, जो macOS और Linux पर GDB·LLDB source-level debugging को सपोर्ट करता है
- इम्प्लीमेंटेशन में function·line-level breakpoints, parameters और local variables tracking, basic type information display, AMD64·ARM64 support आदि शामिल हैं
- लेखक ने कहा कि यह कोड Claude Sonnet 4.5 और ChatGPT 5(Codex) जैसे AI मॉडलों के सहयोग से बना है, और उसने खुद कोड लिखने के बजाय AI को निर्देशित·review किया
- OCaml maintainers ने copyright issues, design discussion की कमी, maintenance burden, AI code review की कठिनाई आदि कारणों से merge से इनकार किया और PR बंद कर दिया
- यह चर्चा AI-generated code की quality·copyright·collaboration process को लेकर open source community के सामने उभरती नई चुनौतियों का एक उदाहरण है
DWARF v5 debugging support PR का अवलोकन
- PR, OCaml native compiler में DWARF v5 debugging information जोड़कर GDB और LLDB में source-level debugging संभव बनाता है
- function name·file·line के हिसाब से breakpoint सेट करना, variable names दिखाना, type information देना
- AMD64·ARM64 architecture support, 32-bit platform unsupported
- macOS(Mach-O) और Linux(ELF) दोनों में section-relative relocations का उपयोग कर complete DWARF support इम्प्लीमेंट किया गया
- LLDB plugin (ocaml_lldb.py) जोड़कर OCaml values के लिए print command (
ocaml print) उपलब्ध कराया गया
- टेस्ट 9 आइटम से बने हैं और functionality·type·line debugging को verify करते हैं
इम्प्लीमेंटेशन की बारीकियां
- DWARF v4 से v5 में upgrade करते हुए DW_FORM_string का उपयोग किया गया ताकि link errors से बचा जा सके
- multiple compile units(CU) support और string table deduplication
- local variables·parameters tracking, lexical blocks, basic type information को DWARF structure में दर्शाया गया
- Var_lifetime module से variable lifecycle tracking, fun_var_info field से compiler pipeline में variable information पास की गई
- DW_TAG_lexical_block के जरिए nested scopes को व्यक्त किया गया
- test scripts GDB·LLDB में breakpoints और type display को verify करते हैं
AI-generated code विवाद
- लेखक ने कहा, “Claude Sonnet 4.5 ने अधिकांश हिस्सा लिखा और ChatGPT 5(Codex) ने review किया”
- उसने समझाया, “मैंने सिर्फ AI को guide किया और review किया, खुद एक भी लाइन नहीं लिखी”
- कुछ फाइलों में Mark Shinwell का नाम author के रूप में शामिल होने से copyright attribution controversy पैदा हुई
- लेखक ने अलग analysis report में दावा किया कि “OxCaml implementation से structure·naming·type system अलग हैं, इसलिए यह copy नहीं है”
maintainers की प्रतिक्रिया
- gasche: design discussion के बिना 13,000 से अधिक lines का code सबमिट किया गया, इसलिए review·maintenance burden बहुत बड़ा है
- AI-लिखित code “review करना और कठिन है और legal risk भी है”, यह कहते हुए merge अस्वीकार किया गया
- dra27: “AI understands code” जैसी अभिव्यक्ति की आलोचना करते हुए कहा कि LLM समझने वाला नहीं बल्कि pattern generation tool है
- bluddy और tmcgilchrist: DWARF code को अलग library के रूप में अलग किया जाना चाहिए; compiler के भीतर शामिल होने पर maintenance burden बढ़ेगा
- बहस तेज होने पर PR को ‘too heated’ status में lock कर दिया गया
AI और open source collaboration के मुद्दे
- लेखक ने जोर दिया कि यह AI-based development experiment था और वह “यह साबित करना चाहता था कि AI high-quality code पूरा कर सकता है”
- maintainers ने “AI-generated code की quality·copyright·review process” पर स्पष्ट policy की कमी की ओर इशारा किया
- यह मामला AI-assisted development को open source projects में integrate करते समय जरूरी प्रक्रियाओं और मानकों पर चर्चा को प्रेरित करता है
2 टिप्पणियां
लेकिन… PR सबमिट करने वाले व्यक्ति को इसकी ज़रा भी समझ नहीं है।
इसलिए… इस PR को ख़ारिज किया जाता है। (ठक ठक ठक)
Hacker News राय
सोचता हूँ क्या OCaml maintainers ने मुश्किल लोगों से निपटने की कोई खास ट्रेनिंग ली है
उनका धैर्य और परिपक्वता हैरान कर देने वाली है। मैं होता तो शायद Torvalds-स्टाइल में तुरंत ब्लॉक कर देता
leadership को AI पर लगभग धार्मिक-सा विश्वास है, इसलिए वे चाहते हैं कि हर engineer AI का अधिकतम इस्तेमाल करे
code review भी धीरे-धीरे AI को सौंपा जा रहा है। लेकिन इस मामले में शायद लोग इस वजह से विनम्र नहीं थे
जैसे PR को बाँटना या design proposal देने के लिए प्रेरित करना
maintainers इतने अच्छे हैं कि उन्हें ऐसे लोगों पर समय बर्बाद करते देख झुंझलाहट होती है
maintainers ने बिना भावुक हुए जिस तरह तर्क और सहानुभूति से जवाब दिया, वह सच में पाठ्यपुस्तक जैसा communication था
लेकिन यह भी सोचने वाली बात है कि कहीं ऐसी विनम्रता भ्रम को और मजबूत तो नहीं कर रही
एक व्यक्ति तो LLM से भी कम self-awareness वाला लगा
AI से बने commit की वैधता AI से पूछना वाकई बेतुका है
फिर भी कम से कम वह ईमानदार तो था। “मैं इस कचरे के पहाड़ को maintain करूँगा, लेकिन पैसे देने होंगे” वाली लाइन कमाल की थी
उससे मुझे भी OCaml ecosystem में योगदान देने का मन हुआ
“आपने जो file submit की, उसके author के रूप में Mark Shinwell क्यों लिखा है?” इस सवाल पर
“AI ने ऐसा तय किया, मैंने पूछा ही नहीं” वाला जवाब सब कुछ बता देता है
AI पीढ़ी के ये लोग न्यूनतम बहु-दृष्टिकोण वाला सोच भी नहीं करते
यह तो साफ था कि copyright क्यों डाला गया, यह पूछा जाएगा, फिर भी जवाब तैयार नहीं था
review का बोझ आखिरकार maintainer पर डाल दिया जाता है, और maintenance की जिम्मेदारी contributor नहीं लेता
इस आदमी का resume तो दंतकथा जैसा है
Wall Street बैंकों से लेकर Deutsche Bank में technology director, EA को license बेचना,
“Hardcore Erlang” किताब लिखने की कोशिश, 2 दिनों में 2 million dollar crypto funding वगैरह
या तो यह प्रतिभाशाली है, या सदी का सबसे बड़ा डींगमार
संबंधित लिंक: पुराना ब्लॉग, resume PDF, interview, official site, Erlang किताब रद्द होने की खबर
भले code AI ने बनाया हो, लेकिन अगर community समय लगाकर बात कर रही है और feedback दे रही है,
फिर भी author AI द्वारा लिखे लंबे टेक्स्ट को ज्यों का त्यों copy-paste करे, तो मेरे हिसाब से यह तुरंत block करने लायक है
spam bot की तरह व्यवहार करोगे तो spam bot जैसा ही व्यवहार मिलेगा
मैं जब सवाल पूछता, तो उसके जवाब में वही सामान्य GPT-शैली झलकती थी
आखिरकार मैंने खुद प्रयोग किया तो लगभग शब्द-शब्द वही जवाब निकल आया,
और उसके बाद मैंने घोषित कर दिया कि मैं उसका code review नहीं करूँगा
“यह AI द्वारा लिखा गया copyright analysis है” सुनते ही सीमा पार हो गई थी
मैं होता तो उसी वक्त repo access ब्लॉक कर देता
मैंने भी कई open source projects में AI-generated PR बंद किए हैं
ऐसे contributors एक project में मना होने पर दूसरे project में चले जाते हैं
review का बोझ बढ़ता है, और असली contributors कम होते जाते हैं
फिर भी HN पर ऐसी चर्चा को real time में देखना दिलचस्प है
author तर्क से ज़रा भी नहीं माना। लगता है दूसरे projects भी इसी तरह टिक पाएँगे
असली चिंता तो enterprise software की तरफ होनी चाहिए
मैं AI समर्थकों से पूछना चाहता हूँ
अगर AI से लिखी गई presentation दे दी जाए, और फिर सवाल आएँ, तो आप क्या जवाब देंगे?
यह मामला बिल्कुल वैसा ही है
13k lines का PR समझे बिना फेंक देना, AI हो या न हो, गलत ही है
AI सिर्फ एक tool है; चाहे CNC machine इस्तेमाल करो या आरी, नतीजे को समझना ज़रूरी है
अब तक देखे गए AI-generated PRs में यह सबसे अनोखा मामला था
ज़्यादातर मामलों में कोई beginner ऐसा code भेजता है जो चलता ही नहीं, लेकिन इस बार चीज़ जटिल थी और वास्तव में काम कर रही थी
author Joel Reymont 30 साल के अनुभव वाला developer था, और 2008 से HN account रखने वाला veteran भी
OCaml maintainers का धैर्य काबिले-तारीफ़ था, और आखिर में उसने एक मानवीय comment के साथ अपनी स्थिति समेटते हुए
कहा कि वह AI के जरिए OSS में योगदान देना बंद करेगा
फिर भी ऐसे PR अब भी सबके लिए समय की बर्बादी हैं,
और अब तक मैंने उनका कोई उत्पादक उपयोग नहीं देखा
यह सचमुच हैरान कर देने वाला PR था
संबंधित commit लिंक