- 1.5B पैरामीटर वाला Sweep Next-Edit मॉडल उपयोगकर्ता के अगले code modification का अनुमान लगाकर autocomplete सुविधा देता है
- लोकल environment में 500ms से कम गति पर चलता है, और 4 गुना से बड़े मॉडल्स से भी बेहतर performance दिखाता है
- Q8_0 GGUF quantization format में उपलब्ध है, जिससे हल्का होने के बावजूद लंबी 8192 token context length को सपोर्ट करता है
- Qwen2.5-Coder पर आधारित है और JetBrains plugin के साथ integrate किया जा सकता है
- Apache 2.0 license के तहत जारी किया गया है, इसलिए open source AI developers के लिए experimentation और integration में उपयोगी मॉडल है
मॉडल overview
- Sweep Next-Edit 1.5B code autocomplete के लिए एक next-edit prediction model है
- उपयोगकर्ता के code बदलने से पहले अगला edit predict करके सुझाव देता है
- लोकल laptop environment में भी 500ms से कम latency पर चल सकता है
- Speculative decoding का उपयोग करके तेज response speed देता है
- next-edit benchmark में 4 गुना से बड़े मॉडल्स से बेहतर performance दर्ज की
मॉडल details
- पैरामीटर संख्या: 1.5B
- फॉर्मैट: GGUF (Q8_0 quantization)
- context length: 8192 tokens
- base model: Qwen2.5-Coder
- license: Apache 2.0
उपयोग का तरीका
run_model.pyऔर मॉडल फ़ाइल डाउनलोड करने के बाद चलाएँ- इंस्टॉल कमांड:
uv pip install llama-cpp-python huggingface_hub python run_model.py
- इंस्टॉल कमांड:
- लोकल execution-केंद्रित संरचना होने के कारण, अलग से कोई cloud inference provider नहीं है
2 टिप्पणियां
हाल में Big Tech कंपनियां parameter count बढ़ाकर आगे बढ़ रही थीं, लेकिन क्या अब दिशा बदलने वाली है?
व्यक्तिगत रूप से मुझे लगता था कि सिर्फ parameter बढ़ाते हुए आगे बढ़ना वास्तव में कोई ठोस जवाब नहीं है।
जैसे अभी के भविष्य को छोड़कर सिर्फ growth करने जैसा एहसास होता था। खासकर जब MoE का दौर सबसे ज़्यादा था, तब यह और भी स्पष्ट लगा।
Google का Gemma 3 27b काफ़ी बड़ा माना जाता था, लेकिन अब LLM में उस स्तर का parameter count भी छोटा लगने लगा था।
तकनीकी प्रगति महत्वपूर्ण है, लेकिन उसे वास्तव में serve करने वाले चरण को ध्यान में रखकर भी कुछ आना चाहिए, और यह इस दिशा में एक अच्छा प्रयास लगता है।
(parameter बढ़ने को लेकर मैं संशय में इसलिए था क्योंकि performance अच्छी होती है, यह तो पता है, लेकिन उसे serve करने में और ज़्यादा लागत लगती है।)
Hacker News की राय
मैंने मॉडल को खुद इस्तेमाल करके देखा, और performance और quality सच में काफ़ी प्रभावशाली थे
इसे open source में जारी करने के लिए धन्यवाद
मैं Neovim के लिए edit completion plugin बनाने वाला व्यक्ति हूँ, और मैं इसे Sweep Edit मॉडल के साथ integrate करने में सफल रहा
दिलचस्पी रखने वाले लोग cursortab.nvim देख सकते हैं
मैंने पहले Continue.dev में Qwen 2.5 Coder को autocomplete के लिए इस्तेमाल किया था, लेकिन JetBrains IDE और VS Code दोनों में वह बुरी तरह विफल रहा
ऐसी कोशिशों को साझा किया जाना सच में अच्छा लगता है। ज़्यादातर IDE plugins (Cline, RooCode, KiloCode आदि) autocomplete model settings को ठीक से support नहीं करते
मैं Copilot subscription लगभग सिर्फ autocomplete की वजह से बनाए हुए था, इसलिए अब कोई विकल्प दिख रहा है तो खुशी हो रही है
जब भी मैं ऐसे plugins इस्तेमाल करता हूँ, मुझे फिर से एहसास होता है कि autocomplete AI के बिना coding करना कितना inefficient है
जितना ज़्यादा boilerplate code होता है, यह Claude Code से उतना ज़्यादा उपयोगी लगता है
मैं JetBrains का लंबे समय से उपयोगकर्ता रहा हूँ, इसलिए VSCode पर जाना मुश्किल था, लेकिन JetBrains के AI features बहुत पीछे थे
अब जाकर कोई ठीक-ठाक autocomplete tool आया है, इसलिए मैं Copilot subscription को इसकी ओर बदलने की सोच रहा हूँ
साथ ही open weights जारी करना और privacy mode देना भी मुझे पसंद आया
जो developers मुख्य रूप से नया code लिखते हैं, वे autocomplete से productivity improvement बहुत ज़्यादा महसूस करते हैं, जबकि maintenance-केंद्रित developers को Claude Code जैसे tools से ज़्यादा मदद मिलती है
लेकिन सामान्यतः मैं LLM को बंद रखता हूँ और ज़रूरत पड़ने पर ही चालू करता हूँ
मुझे लगता है कि छोटे specialized models की संभावनाओं को कम आँका जा रहा है
इसी बारे में मैं ‘Winning Big With Small AI’ नाम की किताब लिख रहा हूँ
मेरा मानना है कि इसका ज़्यादातर हिस्सा utilities या libraries में refactor किया जा सकता है
शायद इसलिए मुझे अलग लगता है क्योंकि मैं ज़्यादातर research pipeline code लिखता हूँ
वैसे yasnippet, ultisnips, VSCode snippets जैसे tools से भी बुनियादी autocomplete लागू किया जा सकता है
मैं सच में बहुत समय से ऐसी चीज़ का इंतज़ार कर रहा था
Cursor सिर्फ autocomplete इस्तेमाल करने पर भी 20 डॉलर महीना मांग रहा था, जिससे मैं असंतुष्ट था
मैंने खुद इसे बनाने पर भी विचार किया, लेकिन भरोसा नहीं था कि local में चलने लायक इतना छोटा model उपयोगी साबित होगा
इसलिए मैंने जल्दी-जल्दी एक VSCode extension बना लिया, और model काफ़ी अच्छा निकला
पहले local models inline completion में बहुत खराब थे, लेकिन इस बार काफ़ी बेहतर हैं
competition बढ़े, यही उम्मीद है
उन्होंने कहा कि token healing जैसी features से quality बेहतर की गई है — संबंधित लेख
मैंने सुना है कि 1.5B model इतना छोटा है कि local में चल सके, इसलिए मैं जानना चाहता हूँ कि क्या Sweep AI JetBrains plugin में भी यह वास्तव में local पर चलता है
install करने पर क्या model अपने-आप download हो जाता है, और क्या फिर कोई external communication नहीं होता?
JetBrains का AI implementation level इतना कम है कि मुझे हैरानी हुई
कई साल बीत जाने के बाद भी अगर हालात ऐसे ही हैं, तो लगता है कि नई कंपनियाँ भी इससे बेहतर कर सकती हैं
technical लेख भी दिलचस्प था
GLM-4.7-Flash और इस घोषणा को देखते हुए, छोटे models की सीमाओं को तोड़ना सच में बहुत रोमांचक है
अब ऐसे models लगातार बेहतर हो रहे हैं जो मेरे hardware पर भी आराम से चल सकते हैं, इसलिए उत्साह बढ़ रहा है
सच में शानदार
खासकर यह जानने की जिज्ञासा है कि repository से next edit training data कैसे बनाया गया
इस पर कुछ insights सुनना अच्छा लगेगा
बहुत बढ़िया। संबंधित blog post भी काफ़ी दिलचस्प थी
उम्मीद है कि Neovim के लिए plugin भी जल्द आएगा
संबंधित लेख
यह Qwen3 Coder के साथ अच्छी तरह चला, और अगर infill support हो तो शायद कोई समस्या नहीं होगी
मैं आज इसे टेस्ट करने वाला हूँ
मुझे next-edit model और FIM model के बीच का अंतर ठीक से समझ नहीं आता
अगर कोई बता सके कि किसे कब इस्तेमाल करना बेहतर है, तो अच्छा होगा
हो सके तो Sublime के लिए भी plugin बनाना चाहूँगा ताकि खुद आज़मा सकूँ
इसकी संरचना बुनियादी autocomplete functionality का उपयोग करती है
इसे AItoComplete में देखा जा सकता है
पारंपरिक autocomplete सिर्फ अंत में जोड़ता है, लेकिन FIM code blocks के बीच भरने का तरीका है
यानी यह insertion point के पहले और बाद, दोनों context को देखकर सबसे स्वाभाविक बीच की completion ढूँढने वाला model है