6 पॉइंट द्वारा GN⁺ 2024-06-30 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • Meta ने Code Llama पर आधारित, code optimization और compiler capabilities वाले LLM Compiler मॉडल परिवार की घोषणा की
  • इन मॉडलों में निम्न क्षमताएँ हैं:
    • compiler emulation
    • code size optimization के लिए optimal pass prediction
    • code disassembly
  • नए optimization और compiler कार्यों के लिए fine-tune किया जा सकता है

मुख्य विशेषताएँ

  • code size optimization और disassembly में सर्वोच्च स्तर के परिणाम हासिल किए
  • यह प्रदर्शित करता है कि AI code optimization सीख रहा है और compiler experts को optimization opportunities पहचानने में मदद कर सकता है

मॉडल रिलीज़

  • LLM Compiler 7B और 13B मॉडल को research और commercial use, दोनों के लिए permissive license के साथ जारी किया गया
  • ताकि developers और researchers इन्हें आसानी से उपयोग कर सकें और इस क्षेत्र में नया research कर सकें

2 टिप्पणियां

 
ragingwind 2024-07-01

आइडिया काफ़ी दिलचस्प लग रहा है।

 
GN⁺ 2024-06-30
Hacker News राय
  • LLM का compiler/decompiler के रूप में उपयोग एक दिलचस्प अनुप्रयोग है
  • compiler में reliability और accuracy महत्वपूर्ण हैं
  • LLM स्वभावतः अप्रत्याशित होते हैं, इसलिए उन्हें build pipeline में शामिल करना अजीब लगता है
  • पेपर में CodeLlama से शुरू करके मॉडल को तीन कार्यों पर train किया गया था
    • पहला कार्य compilation है: input code और compiler flags देकर output assembly का अनुमान लगाना
    • दूसरा कार्य compiler flags prediction/optimization है: assembly के आकार को optimize करना
    • तीसरा कार्य decompilation है: दावा है कि यह पिछले approaches की तुलना में बेहतर है
  • decompilation approach की verifiability में समस्या है
  • decompiled code को फिर से compile करके accuracy की जाँच करने की विधि इस्तेमाल की जाती है
  • accuracy लगभग 45% है, इसलिए अभी भरोसेमंद नहीं है, लेकिन पारंपरिक decompiler के साथ उपयोगी हो सकता है
  • मैं यह देखना चाहूँगा कि क्या यह मॉडल performance optimization तक विस्तार कर सकता है
  • लगता है कि ऐसे systems बढ़ेंगे जहाँ LLM intuition देंगे और processing यांत्रिक/कठोर तरीके से होगी
  • यह जानने की उत्सुकता है कि LLM input के अर्थ को सुरक्षित रखते हैं या नहीं, इसे कैसे जाँचा जाए
  • पिछला शोध GitHub पर देखा जा सकता है
  • Twitter इस शोध से प्रभावित था, लेकिन लगता है कि इससे program खराब होने की संभावना अधिक है
  • Meta के अन्य AI पेपरों के विपरीत, इसमें यह उल्लेख नहीं है कि इसका उपयोग Instagram, Facebook, या Meta में किया जाता है
  • "LLM Compiler" की तुलना में "Compiler LLM" अधिक सटीक नाम लगता है
  • मुझे इस काम का उद्देश्य समझ में नहीं आता
  • याद है कि <i>Deus Ex</i> गेम में Meta Technologies Neural Optimizer and Disassembler का सौदा किया था