• HTML5 parser JustHTML को Python से पूरी तरह JavaScript में port करने का एक उदाहरण, जिसे Codex CLI और GPT-5.2 की मदद से लगभग 4.5 घंटे में लागू किया गया
  • नई लाइब्रेरी JustJSHTML एक dependency-free HTML5 parser है, जो html5lib-tests के 9,200 tests पास करती है और मूल API डिज़ाइन को ज्यों का त्यों दोहराती है
  • पूरी प्रक्रिया 8 prompts और कुछ follow-up commands के साथ पूरी हुई, और GPT-5.2 ने 9,000 lines of code और 43 commits अपने-आप तैयार किए
  • प्रोजेक्ट auto-commit, test, documentation, और playground page generation सहित एक पूर्ण open source रूप में पूरा हुआ
  • यह प्रयोग LLM-आधारित coding agent की वास्तविक productivity के साथ-साथ copyright, ethics, और reliability से जुड़े सवाल भी सामने लाता है

प्रोजेक्ट अवलोकन

  • JustHTML Emil Stenström द्वारा विकसित एक standards-compliant HTML5 parser है, जो Python में लिखा गया है और html5lib-tests का पूरा suite पास करता है
    • html5lib-tests, HTML5 parsers के बीच interoperability testing का standard है, और Servo के html5ever सहित कई प्रोजेक्ट्स में इस्तेमाल होता है
  • Simon Willison ने इस प्रोजेक्ट को सीधे JavaScript में port करने का फैसला किया, और Codex CLI व GPT-5.2 का उपयोग करके इसे न्यूनतम manual work के साथ आगे बढ़ाया
  • तैयार परिणाम JustJSHTML browser और Node.js दोनों environments में चलता है, और बिना external dependencies के pure JavaScript में लिखा गया है

विकास प्रक्रिया

  • लोकल environment में justhtml और html5lib-tests repositories को clone किया गया, और नई directory justjshtml बनाई गई
  • Codex CLI को --yolo option (approval और sandbox bypass) के साथ चलाकर GPT-5.2 model इस्तेमाल किया गया
  • पहले prompt में मौजूदा Python code का विश्लेषण करके नई JavaScript API specification (spec.md) लिखने का निर्देश दिया गया
    • शुरुआती चरण (Milestone 0.5) में सरल HTML document parsing test पास करने वाला संस्करण लागू किया गया
  • इसके बाद चरण-दर-चरण “Implement Milestone 0.5”, “** commit and push often**” जैसे commands के जरिए automated development चलाया गया
    • GitHub Actions सेट करके हर commit पर tests चलाए गए
    • कुल 43 commits, 9,000 lines of code, और 9,200 tests पास करने वाला परिणाम तैयार हुआ

परिणाम और आउटपुट

  • Codex CLI ने कुल 2,089,858 tokens इस्तेमाल किए, और यह ChatGPT Plus की मासिक subscription के भीतर बिना अतिरिक्त लागत के किया गया
  • तैयार लाइब्रेरी में ये features शामिल हैं
    • stream(), query()/matches(), toMarkdown() जैसी API extensions
    • no-deps unit test script और CI integration
    • <br> tag handling error जैसे सूक्ष्म bugs का समाधान
  • playground.html अपने-आप बनाया गया, जिससे browser में सीधे test किया जा सकता है
  • README.md में usage, build process, और Node.js व HTML environments के examples शामिल हैं

LLM उपयोग के संकेत

  • GPT-5.2 ने सैकड़ों tool calls और कई घंटों के लगातार काम को न्यूनतम supervision में पूरा किया
  • जहाँ test-driven problem definition संभव हो, वहाँ coding agents काफी परिपक्व code को स्वायत्त रूप से तैयार कर सकते हैं
  • भाषाओं के बीच porting जैसे संरचित काम LLM बहुत प्रभावी ढंग से कर सकता है
  • code generation की लागत व्यावहारिक रूप से ‘लगभग मुफ्त’ स्तर तक गिर गई है, लेकिन verified code को बनाए रखने की लागत अब भी बनी हुई है

उठे नैतिक और कानूनी प्रश्न

  • Rust और Python मूल code के copyright infringement की संभावना
  • LLM द्वारा बनाए गए code के copyright ownership का सवाल
  • इस तरह की development शैली का open source ecosystem पर प्रभाव
  • auto-generated code की reliability और production use की accountability
  • मानव विशेषज्ञों द्वारा महीनों में विकसित code के साथ quality comparison की संभावना

निष्कर्ष

  • यह उदाहरण programming automation के एक नए चरण को दिखाता है और AI coding agents की व्यावहारिक क्षमता को साबित करता है
  • साथ ही यह कानूनी और नैतिक मानकों को स्थापित करने की जरूरत और open source collaboration के तरीकों को फिर से परिभाषित करने की चुनौती भी छोड़ता है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.