- GitHub Copilot में Kimi K2.7 Code जोड़ा गया है, और यह मॉडल selector में चुना जा सकने वाला पहला open weight model बन गया है
- GitHub इसे Microsoft Azure पर host कर रहा है, जिससे coding workflow में अधिक model विकल्प और कम लागत वाले option मिलते हैं
- billing usage-based pricing सिस्टम में provider list price के आधार पर लागू होगी, और वास्तविक लागत के लिए Copilot model और request pricing दस्तावेज़ देखना होगा
- इसे Copilot Pro, Pro+, Max प्लान से चरणबद्ध तरीके से rollout किया जा रहा है, और यह Visual Studio Code model selector में इस्तेमाल किया जा सकता है
- Copilot Business और Enterprise में यह डिफ़ॉल्ट रूप से disabled है, इसलिए संगठन में उपयोग से पहले admin policy enable करना और security, compliance, data governance की समीक्षा करना ज़रूरी है
Copilot में जोड़ा गया पहला open weight model
- Kimi K2.7 Code GitHub Copilot में आधिकारिक रूप से उपलब्ध open weight model है
- इसे Copilot model selector में चुने जा सकने वाले पहले open weight model के रूप में जोड़ा गया है
- यह coding workflow में अधिक model विकल्प और कम लागत वाला option देता है
- GitHub इस model को Microsoft Azure पर host कर रहा है
usage-based pricing
- Kimi K2.7 Code के लिए usage-based pricing में provider list price के अनुसार शुल्क लिया जाएगा
- विस्तृत billing मानदंड GitHub Copilot’s pricing for models and requests दस्तावेज़ में देखे जा सकते हैं
Copilot में उपलब्धता का दायरा
- Kimi K2.7 Code को पहले Copilot Pro, Pro+, Max प्लान में क्रमिक रूप से rollout किया जा रहा है
- उपयोगकर्ता Visual Studio Code के model selector में इस model को चुन सकते हैं
- rollout चरणबद्ध होगा, और GitHub model की quality और performance की निगरानी करता रहेगा
- आने वाले हफ्तों में इसे Copilot Business, Enterprise और अतिरिक्त usage surfaces तक बढ़ाया जाएगा
समर्थित client और surfaces
- model selector निम्न environments में उपलब्ध है
- Visual Studio Code 1.127.0 या बाद का संस्करण
- Visual Studio 17.14.6 या बाद का संस्करण
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile iOS और Android
- JetBrains 1.9.1-251 या बाद का संस्करण
- Xcode
- Eclipse
Business और Enterprise के लिए admin settings
- Kimi K2.7 Code Copilot Business और Copilot Enterprise में डिफ़ॉल्ट रूप से बंद है
- संगठन के सदस्य इस model को चुन सकें, इसके लिए plan admin को Copilot settings में Kimi K2.7 Code policy enable करनी होगी
- अगर policy बंद रहती है, तो उस संगठन में यह model इस्तेमाल नहीं किया जा सकेगा
- admin को enable करने से पहले यह समीक्षा करने की सलाह दी जाती है कि open weight model उनकी security, compliance और data governance आवश्यकताओं के अनुरूप है या नहीं
दस्तावेज़ और feedback channels
- GitHub Copilot में उपलब्ध सभी models की सूची supported models दस्तावेज़ में देखी जा सकती है
- अपने काम के लिए सही model चुनने की जानकारी choosing the right AI model for your task दस्तावेज़ में उपलब्ध है
- feedback GitHub Community discussion में साझा किया जा सकता है
1 टिप्पणियां
Hacker News की राय
cloud-आधारित AI products में अब मेरी लगभग कोई दिलचस्पी नहीं बची है
कभी जिन शानदार features और workflows को लेकर उम्मीद थी, वे price increase, महसूस होने वाली performance गिरावट, service shutdown, replacement जैसी कई वजहों से अब इस्तेमाल करना मुश्किल हो गए हैं, और यह सब बहुत थका देने वाला है
मैंने एक छोटा-सा setup बनाकर लगभग Qwen3.6 पर टिकाव कर लिया है, और ज़रूरी features धीरे-धीरे खुद जोड़ रहा हूँ। यह Claude से टक्कर लेने लायक है या नहीं, पता नहीं, और अब यह जांचना भी छोड़ दिया है। अभी भी यह काफ़ी value दे रहा है और लगातार बेहतर हो रहा है, और भले कहीं और की घास ज़्यादा हरी हो, कम से कम मेरे पैरों तले यह नहीं बदलता — यह बात अच्छी लगती है
जिन लोगों के पास 32GB-class बड़े models चलाने की memory नहीं है, उनके लिए यह बताना चाहूँगा कि pruned models की performance भी काफ़ी अच्छी होती है। छोटी machine के लिए 14GB में आने वाला GLM 4.7 Flash का pruned unsloth Q4 quantized model आज़माने लायक है: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
आमतौर पर ऐसे use case के लिए LM Studio इस्तेमाल करता हूँ, लेकिन unsloth का अपना studio app भी है जो ऐसे quantized models के लिए ज़्यादा उपयुक्त हो सकता है। मैंने कई महीनों तक GLM 4.7 Flash को main model के रूप में इस्तेमाल किया, और यह बहुत persistent और बहुत तेज़ था; सीमित hardware पर यह एक अच्छा विकल्प लगता है
उदाहरण के लिए नया Claude agentic coding के हिसाब से tuned है, इसलिए non-agentic coding में वह उल्टा नुकसानदेह हो सकता है, और Fable 5 अच्छा दिखता है, लेकिन inference cost ज़्यादा है और launch के बाद performance downgrade या limits/price reshuffle होने की संभावना भी काफ़ी है। Gemini 3.5 में limits ज़्यादा उदार हैं, लेकिन performance थोड़ी कम है
नए versions आते हैं और numbering बढ़ती जाती है, लेकिन यह सवाल रहता है कि क्या हर बदलाव सच में प्रगति है, या सिर्फ साल की शुरुआत जैसी ही dollar-per-performance स्थिति में tuning बदल गई है। असली बदलाव Qwen या Gemma 4 31B जैसे छोटे models में ज़्यादा दिखते हैं, और खासकर multilingual क्षमता तक देखें तो यह काफ़ी जादुई लगता है
अभी पोस्ट करते समय Fable का before/after comparison देखा, और reintroduced version में model को लगातार छेड़ते रहने के कारण BridgeBench performance बुरी तरह गिर गई है: https://x.com/Hesamation/status/2072692225100612032
यह ऑफिस में इस्तेमाल होने वाले Claude जितना तेज़ नहीं है, लेकिन local पर काफ़ी अच्छी तरह चलता है, और credits या features के अचानक गायब हो जाने जैसी चिंता नहीं रहती
मुझे Copilot CLI बहुत पसंद है। Claude Code की तुलना में यह ज़्यादा logical और कम friction वाला लगता है
यह भी अच्छा है कि कई models को अपनी मर्ज़ी से घुमाकर इस्तेमाल किया जा सकता है। जैसे, “Opus 4.6 से plan बनवाओ, GPT 5.4 से उस plan को validate करके feedback लो, फिर Sonnet 4.6 से implement कराओ”
लेकिन जून में Copilot की pricing change की वजह से मुझे भी और हमारी पूरी टीम को Claude Code पर जाना पड़ा। अप्रैल-मई में included credits थोड़ा-सा cross करने पर बस कुछ dollars extra खर्च होते थे, लेकिन जून से monthly budget हर 2–3 दिन में खत्म हो जाता था
ग्राहक के नज़रिए से यह पूरी तरह पागलपन वाला price increase है, और समझ नहीं आता Microsoft क्या सोच रहा था। अगर sustainability के लिए यह pricing ज़रूरी भी थी, तब भी उन्हें competitors के पहले pricing बदलने का इंतज़ार करना चाहिए था। अगर पिछले महीने Copilot ने अपने 50% से ज़्यादा customers खो दिए हों, तो मुझे हैरानी नहीं होगी
आख़िरकार अगर बड़े vendors सब इसी pricing पर आ गए, तो शायद सरकार को TV की तरह public-access AI चलाना पड़ सकता है। free open models इस्तेमाल करके, tax के पैसे से कुछ data centers चलाकर, regional limits और सख़्त throttling रखी जाए, लेकिन students और नागरिकों को इसे खुलकर इस्तेमाल करने दिया जाए
अगर कुछ साल बाद हर AI की कीमत Copilot जैसी हो गई, तो सिर्फ unicorn companies ही इसका इस्तेमाल कर पाएँगी, और बाकी के पास AI इस्तेमाल करने वाली कंपनियों से प्रतिस्पर्धा करने का मौका नहीं बचेगा
वे literally cost pass through कर रहे हैं: https://platform.claude.com/docs/en/about-claude/pricing
Anthropic subscription भी देता है, लेकिन enterprises आमतौर पर वह रास्ता नहीं अपनाना चाहते। क्योंकि उस route से जमा किया गया content training में इस्तेमाल हो सकता है या model का हिस्सा बन सकता है
employer की स्पष्ट अनुमति के बिना इसका इस्तेमाल करना contract violation हो सकता है, और अगर मुक़दमा हो गया तो परिणाम गंभीर हो सकते हैं
साथ ही, इस संभावना के लिए कि Claude Code आख़िरकार असली token cost के हिसाब से अब अच्छा सौदा न रहे, हम open-weight models के लिए AWS Bedrock और Deepinfra को test कर रहे हैं
tools के मामले में Claude काफ़ी आगे है, लेकिन sub-agent के अनुसार model assignment और सभी models तक access जैसी चीज़ें, इस समय Claude जो कुछ भी देता है उन्हें जोड़ दें उससे भी बेहतर feature हैं
कंपनी में मैं एक महीने में जितना AI consume कर सकता हूँ, उसकी एकमात्र सीमा dollars है, इसलिए जो चीज़ cost कम कर दे वही मेरे लिए सबसे अच्छा model और execution environment है। Copilot sub-agents को ज़्यादा उपयुक्त models अपने आप assign करने में भी बेहतर था, जबकि Claude अक्सर ज़्यादा महंगे models चुन लेता है
हालांकि ऐसे efficient models हैं जो किसी बेहतर model द्वारा बनाए गए plan को execute कर सकते हैं। Microsoft के auto model selection को देखें तो, पहले वाले loss-making pricing structure में dependency conflict resolution जैसे कामों के लिए state-of-the-art reasoning models चुन लेना थोड़ा शर्मनाक लगता है
मैंने भी VS 2026 डेवलपमेंट में GitHub Copilot इस्तेमाल किया और ChatGPT व Claude के बीच आता-जाता रहा, और यह सब Claude Code और Codex ऐप के बारे में जानने से पहले था
Copilot मेरे उपयोग के लिए ठीक था, और $10 प्रति माह काफ़ी था
लेकिन पिछले महीने नया pricing model आने के बाद, $10 कुछ ही दिनों में ख़त्म हो गए। मुझे पता है कि पुरानी pricing टिकाऊ नहीं थी, लेकिन उसी वजह से मैं Claude Code और Codex पर चला गया और फिर पीछे मुड़कर नहीं देखा। Claude Code और Codex के tokens भी काफ़ी subsidized pricing पर हैं, लेकिन जब तक अच्छा चल रहा है तब तक उसका फ़ायदा उठा लेना चाहिए
Copilot के ज़रिए Claude इस्तेमाल करने और Claude Code में सीधे Claude इस्तेमाल करने के बीच फ़र्क महसूस होता है। Microsoft पीछे से क्या कर रहा है, पता नहीं
Anthropic execution environment और model दोनों में थोड़ा आगे है, इसलिए उसके पास दोनों दुनियाओं के फ़ायदे हैं
Microsoft की तरफ़ भी शायद वही model हो, लेकिन आसपास के tools और prompts बदतर हैं, इसलिए नतीजे भी बदतर लगते हैं
अभी मैं DeepSeek के लिए reasonix execution environment इस्तेमाल कर रहा हूँ, और cache hit होने पर लागत लगभग मुफ़्त जैसी हो जाती है। Digital Ocean या Cloudflare जैसे बिना subsidy वाले अमेरिकी providers इस्तेमाल करने पर भी ऐसा ही है
target language C++ है और कोई समस्या नहीं
Copilot के ज़रिए VS Code में Claude इस्तेमाल करने का तरीका मुझे पसंद है, और लगता है कि इससे code quality पर बेहतर control मिलता है, इसलिए बेहतर code मिलता है। यह Claude Code की तुलना में कहीं ज़्यादा transparent है, open source है, और IDE interface context व generated output पर ज़्यादा control देता है
लागत बढ़ना सिर्फ़ price hike की वजह से नहीं है, Opus model agent ज़्यादा tokens भी इस्तेमाल करता है। इसलिए मैं Claude Code पर चला गया, और अब भी Opus 4.6 से संतुष्ट हूँ। Fable और 4.7 बड़े units में काम करते हुए ज़्यादा भटकते हैं और assumptions बना लेते हैं, जिससे output बिखरा हुआ हो जाता है
आख़िरकार enterprises के इस्तेमाल के लिए किसी बड़े vendor का एक alternative आ गया
लोग किसी भरोसेमंद provider पर Chinese model चलाने का तरीका चाहते थे, और GitHub वही दे रहा है
अगर benchmarks पर भरोसा करें, तो performance Sonnet 4.6 के स्तर की है। GitHub pricing पर यह कितना उपयोगी है, यह देखना होगा
GPT-5.4 पहले annual subscribers के लिए 1x था, अब 6x हो गया है। कुछ ही prompts में premium requests ख़त्म हो जाती हैं। $10/month वाला GitHub Copilot पहले अमेरिकी AI labs के models सस्ते में इस्तेमाल करने का सबसे बढ़िया value-for-money विकल्प था
Claude जो काम एक बार में ख़त्म कर देता, उसमें यह घूमता ही रहता था। हालाँकि मेरा usage path Ollama Cloud था, और मुझे नहीं पता कि वह असली model दे रहा था या quantized version, और quantization ने performance घटाई भी हो सकती है
फिर भी अच्छी बात यह है कि एक precedent बन गया। अगर Microsoft अब Kimi K2.7 दे रहा है, तो जल्द ही GLM 5.2 भी दे सकता है, और वह वास्तव में बहुत competitive model है
Synthetic अपने models को reasonable pricing पर चलाता है, जिनमें GLM5.2 और Kimi K2.7-Code शामिल हैं
referral link: https://synthetic.new/?referral=kwjqga9QYoUgpZV
input: $0.95, cache hit: $0.19, output: $4.00
यह वही कीमत है जो Moonshot लेता है, और लगभग GPT 5.4 mini के price range में है, इसलिए बुरा विकल्प नहीं है
context के लिए tokens बर्बाद करने वाले एक बेवकूफ़ prompt का उदाहरण लें: “5x5 board पर अकेले tic-tac-toe खेलो। जो 5 को एक लाइन में रखेगा, वही जीतेगा।”
Kimi K2.7 में इसकी लागत $0.006 आती है और पूरा raw reasoning trace देखा जा सकता है। GPT-5.4 mini में इसकी लागत $0.016 आती है और उसे summarize कर दिया जाता है
अगर आप जानना चाहते हों, तो दोनों ही अविश्वसनीय रूप से बेवकूफ़ निकले
Kimi:
A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .
GPT 5.4 mini:
1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
बस जिज्ञासु लोगों के लिए बता दूँ, GPT 5.5 भी 5.4 mini की तरह ही कचरा खेलता है, लेकिन लागत 4 गुना है
Fable 40 cents की लागत में काफ़ी भरोसेमंद गेम बना देता है
X X O O O
O O X X X
X X X O O
X O O X O
X O X X O
अच्छा आइडिया है। मैंने iOS के Claude Chat में Haiku से यही काम करवाया, तो उसने interactive React game बना दिया, rules implement किए, और फिर खुद खेला
$1 input और $5 output के हिसाब से काफ़ी स्मार्ट चाल, Anthropic!
बड़े language models गेम्स में कमज़ोर होते हैं, लेकिन उसी गेम को सीखने वाला reinforcement learning agent लिखना पूरी तरह संभव है
अगर बहुत ज़्यादा बोर हुआ तो सोच रहा हूँ कि दो models को एक-दूसरे के ख़िलाफ़ chess खिलवाऊँ
लगता है कहीं न कहीं पहले से chess benchmark या large language model tournament मौजूद होगा
यह अजीब है कि AWS Bedrock ऐसे मॉडलों को बहुत कमजोर तरीके से सपोर्ट करता है
इसमें सिर्फ Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 जैसे मॉडल हैं और नए मॉडल नहीं हैं
Inf2 instances के लिए AWS Neuron की ज़रूरत होती है [1]। हो सकता है मॉडल को उस हार्डवेयर पर चलने लायक पोर्ट करने में बहुत ज़्यादा समय लगता हो
[1] https://aws.amazon.com/ai/machine-learning/neuron/
दूसरे मॉडलों की तुलना में इसका रनिंग कॉस्ट साफ तौर पर बहुत सस्ता है, और मैंने कल इसे करीब एक घंटे इस्तेमाल किया तो नतीजे उम्मीद जगाने वाले लगे
Reddit चर्चा में देखा कि टीम glm5.2 का मूल्यांकन कर रही है, इसलिए उम्मीद है कि और भी मॉडल जुड़ेंगे
क्या GitHub Copilot enterprise platform के तौर पर सबसे अच्छी स्थिति में है?
यह Claude, GPT, Gemini को सपोर्ट करता है और अब open weight models भी सपोर्ट करता है। बड़े संगठन वैसे भी API फीस के स्तर पर भुगतान करते हैं, इसलिए कहीं भी इस्तेमाल करें, लागत लगभग समान रहती है
इसके पास काफ़ी अच्छा agent CLI और SDK है, और अब desktop app भी है। hosted agents भी हैं और CI में ‘Agentic Workflows’ भी चलाए जा सकते हैं
क्या इसकी साख इतनी गिर चुकी है कि लोग सिर्फ विकल्पों पर ही ध्यान दे रहे हैं? या enterprise के बाहर के users usage cost की वजह से बाहर हो जाते हैं, इसलिए free marketing नहीं बनती?
Copilot को इसलिए बनाए रखा था क्योंकि उसके token बेहद सस्ते थे, लेकिन नई pricing आने के बाद यह openrouter जैसी कीमत वाला, मगर बहुत कम मॉडलों वाला service बन गया
सटीक वजह नहीं पता, लेकिन अनुभव अच्छा नहीं था
कंपनी में यह बात अक्सर उठती है, क्योंकि vendor management वाले लोग बड़े language model ecosystem को समझ नहीं पाते और मान लेते हैं कि Copilot के ज़रिए Claude और Claude Code के ज़रिए Claude एक ही चीज़ हैं
जब भी मुझसे फर्क समझाने को कहा जाता है, मैं बस दोनों को साथ-साथ तुलना में चलाता हूँ, और 5 में से 3~4 बार प्रदर्शन में भारी गिरावट साफ दिख जाती है
अगर कोई छोटी टीम Copilot आज़माना चाहती है, तो मैं चेतावनी देना चाहूँगा कि पुरानी documentation के पीछे चलते-चलते billing setup में उलझकर कई घंटे बर्बाद हो सकते हैं
सार यह है कि आखिर में हमें GitHub से यह email मिला: “Copilot Business उन teams को दिया जाता है जो 10 या उससे ज़्यादा licenses खरीदती हैं।” यह documented नहीं है, लेकिन दूसरे लोग भी यही झेल रहे हैं: https://github.com/orgs/community/discussions/199346
फिलहाल हम Cursor बनाए हुए हैं, और Kimi को “Composer” नाम से मुख्य रूप से इस्तेमाल कर रहे हैं
आखिरकार आ गया। क्या यह Copilot का पहला open weight LLM है? यानी दरवाज़ा खुल गया है