Meta ने LLM Compiler की घोषणा की

(twitter.com/AIatMeta)

6 पॉइंट द्वारा GN⁺ 2024-06-30 | 2 टिप्पणियां | WhatsApp पर शेयर करें

Meta ने Code Llama पर आधारित, code optimization और compiler capabilities वाले LLM Compiler मॉडल परिवार की घोषणा की
इन मॉडलों में निम्न क्षमताएँ हैं:
- compiler emulation
- code size optimization के लिए optimal pass prediction
- code disassembly
नए optimization और compiler कार्यों के लिए fine-tune किया जा सकता है

मुख्य विशेषताएँ

code size optimization और disassembly में सर्वोच्च स्तर के परिणाम हासिल किए
यह प्रदर्शित करता है कि AI code optimization सीख रहा है और compiler experts को optimization opportunities पहचानने में मदद कर सकता है

मॉडल रिलीज़

LLM Compiler 7B और 13B मॉडल को research और commercial use, दोनों के लिए permissive license के साथ जारी किया गया
ताकि developers और researchers इन्हें आसानी से उपयोग कर सकें और इस क्षेत्र में नया research कर सकें

2 टिप्पणियां

ragingwind 2024-07-01

आइडिया काफ़ी दिलचस्प लग रहा है।

GN⁺ 2024-06-30

Hacker News राय

LLM का compiler/decompiler के रूप में उपयोग एक दिलचस्प अनुप्रयोग है
compiler में reliability और accuracy महत्वपूर्ण हैं
LLM स्वभावतः अप्रत्याशित होते हैं, इसलिए उन्हें build pipeline में शामिल करना अजीब लगता है
पेपर में CodeLlama से शुरू करके मॉडल को तीन कार्यों पर train किया गया था
- पहला कार्य compilation है: input code और compiler flags देकर output assembly का अनुमान लगाना
- दूसरा कार्य compiler flags prediction/optimization है: assembly के आकार को optimize करना
- तीसरा कार्य decompilation है: दावा है कि यह पिछले approaches की तुलना में बेहतर है
decompilation approach की verifiability में समस्या है
decompiled code को फिर से compile करके accuracy की जाँच करने की विधि इस्तेमाल की जाती है
accuracy लगभग 45% है, इसलिए अभी भरोसेमंद नहीं है, लेकिन पारंपरिक decompiler के साथ उपयोगी हो सकता है
मैं यह देखना चाहूँगा कि क्या यह मॉडल performance optimization तक विस्तार कर सकता है
लगता है कि ऐसे systems बढ़ेंगे जहाँ LLM intuition देंगे और processing यांत्रिक/कठोर तरीके से होगी
यह जानने की उत्सुकता है कि LLM input के अर्थ को सुरक्षित रखते हैं या नहीं, इसे कैसे जाँचा जाए
पिछला शोध GitHub पर देखा जा सकता है
Twitter इस शोध से प्रभावित था, लेकिन लगता है कि इससे program खराब होने की संभावना अधिक है
Meta के अन्य AI पेपरों के विपरीत, इसमें यह उल्लेख नहीं है कि इसका उपयोग Instagram, Facebook, या Meta में किया जाता है
"LLM Compiler" की तुलना में "Compiler LLM" अधिक सटीक नाम लगता है
मुझे इस काम का उद्देश्य समझ में नहीं आता
याद है कि <i>Deus Ex</i> गेम में Meta Technologies Neural Optimizer and Disassembler का सौदा किया था

Meta ने LLM Compiler की घोषणा की

मुख्य विशेषताएँ

मॉडल रिलीज़

संबंधित पढ़ाई

2 टिप्पणियां

Hacker News राय