Kimi K2.7 Code अब GitHub Copilot में आधिकारिक रूप से उपलब्ध

(github.blog)

1 पॉइंट द्वारा GN⁺ 22 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें

GitHub Copilot में Kimi K2.7 Code जोड़ा गया है, और यह मॉडल selector में चुना जा सकने वाला पहला open weight model बन गया है
GitHub इसे Microsoft Azure पर host कर रहा है, जिससे coding workflow में अधिक model विकल्प और कम लागत वाले option मिलते हैं
billing usage-based pricing सिस्टम में provider list price के आधार पर लागू होगी, और वास्तविक लागत के लिए Copilot model और request pricing दस्तावेज़ देखना होगा
इसे Copilot Pro, Pro+, Max प्लान से चरणबद्ध तरीके से rollout किया जा रहा है, और यह Visual Studio Code model selector में इस्तेमाल किया जा सकता है
Copilot Business और Enterprise में यह डिफ़ॉल्ट रूप से disabled है, इसलिए संगठन में उपयोग से पहले admin policy enable करना और security, compliance, data governance की समीक्षा करना ज़रूरी है

Copilot में जोड़ा गया पहला open weight model

Kimi K2.7 Code GitHub Copilot में आधिकारिक रूप से उपलब्ध open weight model है
इसे Copilot model selector में चुने जा सकने वाले पहले open weight model के रूप में जोड़ा गया है
यह coding workflow में अधिक model विकल्प और कम लागत वाला option देता है
GitHub इस model को Microsoft Azure पर host कर रहा है

usage-based pricing

Kimi K2.7 Code के लिए usage-based pricing में provider list price के अनुसार शुल्क लिया जाएगा
विस्तृत billing मानदंड GitHub Copilot’s pricing for models and requests दस्तावेज़ में देखे जा सकते हैं

Copilot में उपलब्धता का दायरा

Kimi K2.7 Code को पहले Copilot Pro, Pro+, Max प्लान में क्रमिक रूप से rollout किया जा रहा है
उपयोगकर्ता Visual Studio Code के model selector में इस model को चुन सकते हैं
rollout चरणबद्ध होगा, और GitHub model की quality और performance की निगरानी करता रहेगा
आने वाले हफ्तों में इसे Copilot Business, Enterprise और अतिरिक्त usage surfaces तक बढ़ाया जाएगा

समर्थित client और surfaces

model selector निम्न environments में उपलब्ध है
- Visual Studio Code 1.127.0 या बाद का संस्करण
- Visual Studio 17.14.6 या बाद का संस्करण
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile iOS और Android
- JetBrains 1.9.1-251 या बाद का संस्करण
- Xcode
- Eclipse

Business और Enterprise के लिए admin settings

Kimi K2.7 Code Copilot Business और Copilot Enterprise में डिफ़ॉल्ट रूप से बंद है
संगठन के सदस्य इस model को चुन सकें, इसके लिए plan admin को Copilot settings में Kimi K2.7 Code policy enable करनी होगी
अगर policy बंद रहती है, तो उस संगठन में यह model इस्तेमाल नहीं किया जा सकेगा
admin को enable करने से पहले यह समीक्षा करने की सलाह दी जाती है कि open weight model उनकी security, compliance और data governance आवश्यकताओं के अनुरूप है या नहीं

दस्तावेज़ और feedback channels

GitHub Copilot में उपलब्ध सभी models की सूची supported models दस्तावेज़ में देखी जा सकती है
अपने काम के लिए सही model चुनने की जानकारी choosing the right AI model for your task दस्तावेज़ में उपलब्ध है
feedback GitHub Community discussion में साझा किया जा सकता है

1 टिप्पणियां

GN⁺ 22 시간 전

Hacker News की राय

cloud-आधारित AI products में अब मेरी लगभग कोई दिलचस्पी नहीं बची है
कभी जिन शानदार features और workflows को लेकर उम्मीद थी, वे price increase, महसूस होने वाली performance गिरावट, service shutdown, replacement जैसी कई वजहों से अब इस्तेमाल करना मुश्किल हो गए हैं, और यह सब बहुत थका देने वाला है
मैंने एक छोटा-सा setup बनाकर लगभग Qwen3.6 पर टिकाव कर लिया है, और ज़रूरी features धीरे-धीरे खुद जोड़ रहा हूँ। यह Claude से टक्कर लेने लायक है या नहीं, पता नहीं, और अब यह जांचना भी छोड़ दिया है। अभी भी यह काफ़ी value दे रहा है और लगातार बेहतर हो रहा है, और भले कहीं और की घास ज़्यादा हरी हो, कम से कम मेरे पैरों तले यह नहीं बदलता — यह बात अच्छी लगती है
- अच्छा लगा कि यह top comment है। मैं भी पूरी तरह local पर ही इस्तेमाल कर रहा हूँ
  जिन लोगों के पास 32GB-class बड़े models चलाने की memory नहीं है, उनके लिए यह बताना चाहूँगा कि pruned models की performance भी काफ़ी अच्छी होती है। छोटी machine के लिए 14GB में आने वाला GLM 4.7 Flash का pruned unsloth Q4 quantized model आज़माने लायक है: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
  आमतौर पर ऐसे use case के लिए LM Studio इस्तेमाल करता हूँ, लेकिन unsloth का अपना studio app भी है जो ऐसे quantized models के लिए ज़्यादा उपयुक्त हो सकता है। मैंने कई महीनों तक GLM 4.7 Flash को main model के रूप में इस्तेमाल किया, और यह बहुत persistent और बहुत तेज़ था; सीमित hardware पर यह एक अच्छा विकल्प लगता है
- Qwen3.6-35B-A3B-UD-Q4_K_M मेरे पुराने 1060 पर भी लगभग 11 tokens per second की रफ़्तार से चलता है। हम यहाँ तक पहुँच गए हैं, यह सचमुच अविश्वसनीय है
- आजकल AI प्रगति ज़्यादातर fine-tuning differences को आगे धकेलने जैसी लगती है
  उदाहरण के लिए नया Claude agentic coding के हिसाब से tuned है, इसलिए non-agentic coding में वह उल्टा नुकसानदेह हो सकता है, और Fable 5 अच्छा दिखता है, लेकिन inference cost ज़्यादा है और launch के बाद performance downgrade या limits/price reshuffle होने की संभावना भी काफ़ी है। Gemini 3.5 में limits ज़्यादा उदार हैं, लेकिन performance थोड़ी कम है
  नए versions आते हैं और numbering बढ़ती जाती है, लेकिन यह सवाल रहता है कि क्या हर बदलाव सच में प्रगति है, या सिर्फ साल की शुरुआत जैसी ही dollar-per-performance स्थिति में tuning बदल गई है। असली बदलाव Qwen या Gemma 4 31B जैसे छोटे models में ज़्यादा दिखते हैं, और खासकर multilingual क्षमता तक देखें तो यह काफ़ी जादुई लगता है
  अभी पोस्ट करते समय Fable का before/after comparison देखा, और reintroduced version में model को लगातार छेड़ते रहने के कारण BridgeBench performance बुरी तरह गिर गई है: https://x.com/Hesamation/status/2072692225100612032
- यह काफ़ी आकर्षक लग रहा है, लेकिन इतना करने के लिए Mac mini का कौन-सा spec चाहिए होगा?
- मैं भी अपने पुराने MBP पर Qwen3.6 चलाकर संतोषजनक तरीके से इस्तेमाल कर रहा हूँ
  यह ऑफिस में इस्तेमाल होने वाले Claude जितना तेज़ नहीं है, लेकिन local पर काफ़ी अच्छी तरह चलता है, और credits या features के अचानक गायब हो जाने जैसी चिंता नहीं रहती
मुझे Copilot CLI बहुत पसंद है। Claude Code की तुलना में यह ज़्यादा logical और कम friction वाला लगता है
यह भी अच्छा है कि कई models को अपनी मर्ज़ी से घुमाकर इस्तेमाल किया जा सकता है। जैसे, “Opus 4.6 से plan बनवाओ, GPT 5.4 से उस plan को validate करके feedback लो, फिर Sonnet 4.6 से implement कराओ”
लेकिन जून में Copilot की pricing change की वजह से मुझे भी और हमारी पूरी टीम को Claude Code पर जाना पड़ा। अप्रैल-मई में included credits थोड़ा-सा cross करने पर बस कुछ dollars extra खर्च होते थे, लेकिन जून से monthly budget हर 2–3 दिन में खत्म हो जाता था
ग्राहक के नज़रिए से यह पूरी तरह पागलपन वाला price increase है, और समझ नहीं आता Microsoft क्या सोच रहा था। अगर sustainability के लिए यह pricing ज़रूरी भी थी, तब भी उन्हें competitors के पहले pricing बदलने का इंतज़ार करना चाहिए था। अगर पिछले महीने Copilot ने अपने 50% से ज़्यादा customers खो दिए हों, तो मुझे हैरानी नहीं होगी
आख़िरकार अगर बड़े vendors सब इसी pricing पर आ गए, तो शायद सरकार को TV की तरह public-access AI चलाना पड़ सकता है। free open models इस्तेमाल करके, tax के पैसे से कुछ data centers चलाकर, regional limits और सख़्त throttling रखी जाए, लेकिन students और नागरिकों को इसे खुलकर इस्तेमाल करने दिया जाए
अगर कुछ साल बाद हर AI की कीमत Copilot जैसी हो गई, तो सिर्फ unicorn companies ही इसका इस्तेमाल कर पाएँगी, और बाकी के पास AI इस्तेमाल करने वाली कंपनियों से प्रतिस्पर्धा करने का मौका नहीं बचेगा
- आपने कहा कि उन्हें competitors के pricing बदलने तक इंतज़ार करना चाहिए था, लेकिन उन्होंने असल में वही किया है
  वे literally cost pass through कर रहे हैं: https://platform.claude.com/docs/en/about-claude/pricing
  Anthropic subscription भी देता है, लेकिन enterprises आमतौर पर वह रास्ता नहीं अपनाना चाहते। क्योंकि उस route से जमा किया गया content training में इस्तेमाल हो सकता है या model का हिस्सा बन सकता है
  employer की स्पष्ट अनुमति के बिना इसका इस्तेमाल करना contract violation हो सकता है, और अगर मुक़दमा हो गया तो परिणाम गंभीर हो सकते हैं
- Price increase पागलपन की हद तक था। मेरी day-job company भी Copilot से Claude Code subscription पर शिफ्ट कर रही है
  साथ ही, इस संभावना के लिए कि Claude Code आख़िरकार असली token cost के हिसाब से अब अच्छा सौदा न रहे, हम open-weight models के लिए AWS Bedrock और Deepinfra को test कर रहे हैं
- कई महीनों में पहली बार मैंने काम पर Claude credits खत्म कर दिए और Copilot पर वापस गया, और हैरानी की बात है कि अनुभव ठीक-ठाक था
  tools के मामले में Claude काफ़ी आगे है, लेकिन sub-agent के अनुसार model assignment और सभी models तक access जैसी चीज़ें, इस समय Claude जो कुछ भी देता है उन्हें जोड़ दें उससे भी बेहतर feature हैं
  कंपनी में मैं एक महीने में जितना AI consume कर सकता हूँ, उसकी एकमात्र सीमा dollars है, इसलिए जो चीज़ cost कम कर दे वही मेरे लिए सबसे अच्छा model और execution environment है। Copilot sub-agents को ज़्यादा उपयुक्त models अपने आप assign करने में भी बेहतर था, जबकि Claude अक्सर ज़्यादा महंगे models चुन लेता है
- मैं सच में जानना चाहता हूँ, क्या आप थोड़ा और समझा सकते हैं कि Copilot CLI आपको Claude Code से बेहतर कहाँ लगता है? अगर विकल्प हो तो मैं OpenCode इस्तेमाल करता हूँ, इसलिए जानना चाहता हूँ कि Copilot CLI में ऐसी कौन-सी बात है जो आपको ज़्यादा पसंद आती है
- models को auto-select करने देना अब टिकाऊ नहीं रहा
  हालांकि ऐसे efficient models हैं जो किसी बेहतर model द्वारा बनाए गए plan को execute कर सकते हैं। Microsoft के auto model selection को देखें तो, पहले वाले loss-making pricing structure में dependency conflict resolution जैसे कामों के लिए state-of-the-art reasoning models चुन लेना थोड़ा शर्मनाक लगता है
मैंने भी VS 2026 डेवलपमेंट में GitHub Copilot इस्तेमाल किया और ChatGPT व Claude के बीच आता-जाता रहा, और यह सब Claude Code और Codex ऐप के बारे में जानने से पहले था
Copilot मेरे उपयोग के लिए ठीक था, और $10 प्रति माह काफ़ी था
लेकिन पिछले महीने नया pricing model आने के बाद, $10 कुछ ही दिनों में ख़त्म हो गए। मुझे पता है कि पुरानी pricing टिकाऊ नहीं थी, लेकिन उसी वजह से मैं Claude Code और Codex पर चला गया और फिर पीछे मुड़कर नहीं देखा। Claude Code और Codex के tokens भी काफ़ी subsidized pricing पर हैं, लेकिन जब तक अच्छा चल रहा है तब तक उसका फ़ायदा उठा लेना चाहिए
Copilot के ज़रिए Claude इस्तेमाल करने और Claude Code में सीधे Claude इस्तेमाल करने के बीच फ़र्क महसूस होता है। Microsoft पीछे से क्या कर रहा है, पता नहीं
- execution environment बहुत महत्वपूर्ण है। कौन-कौन से tools उपलब्ध हैं और system prompt क्या है, यह execution environment के हिसाब से बदलता है
  Anthropic execution environment और model दोनों में थोड़ा आगे है, इसलिए उसके पास दोनों दुनियाओं के फ़ायदे हैं
  Microsoft की तरफ़ भी शायद वही model हो, लेकिन आसपास के tools और prompts बदतर हैं, इसलिए नतीजे भी बदतर लगते हैं
- Zed के अंदर Copilot छोड़ते समय भी ऐसा ही लगा
  अभी मैं DeepSeek के लिए reasonix execution environment इस्तेमाल कर रहा हूँ, और cache hit होने पर लागत लगभग मुफ़्त जैसी हो जाती है। Digital Ocean या Cloudflare जैसे बिना subsidy वाले अमेरिकी providers इस्तेमाल करने पर भी ऐसा ही है
- मैं भी Cursor पर चला गया। उसे msbuild invoke करना सिखाया तो native Visual Studio plugin के बिना भी वह अपने-आप edit कर लेता है
  target language C++ है और कोई समस्या नहीं
- पिछले कुछ हफ़्तों में GitHub Copilot की लागत काफ़ी बढ़ गई है, और जो काम पहले $100 में हो जाता था अब उसके लिए $300 चाहिए
  Copilot के ज़रिए VS Code में Claude इस्तेमाल करने का तरीका मुझे पसंद है, और लगता है कि इससे code quality पर बेहतर control मिलता है, इसलिए बेहतर code मिलता है। यह Claude Code की तुलना में कहीं ज़्यादा transparent है, open source है, और IDE interface context व generated output पर ज़्यादा control देता है
  लागत बढ़ना सिर्फ़ price hike की वजह से नहीं है, Opus model agent ज़्यादा tokens भी इस्तेमाल करता है। इसलिए मैं Claude Code पर चला गया, और अब भी Opus 4.6 से संतुष्ट हूँ। Fable और 4.7 बड़े units में काम करते हुए ज़्यादा भटकते हैं और assumptions बना लेते हैं, जिससे output बिखरा हुआ हो जाता है
- Claude 4.8 Opus के साथ तो Copilot quota शायद 2~3 prompts में ही ख़त्म हो गया। मुझे लगा था कि यह ख़राब होगा, लेकिन इतना होगा यह नहीं सोचा था। जब तक चला, अच्छा था
आख़िरकार enterprises के इस्तेमाल के लिए किसी बड़े vendor का एक alternative आ गया
लोग किसी भरोसेमंद provider पर Chinese model चलाने का तरीका चाहते थे, और GitHub वही दे रहा है
अगर benchmarks पर भरोसा करें, तो performance Sonnet 4.6 के स्तर की है। GitHub pricing पर यह कितना उपयोगी है, यह देखना होगा
- Microsoft ने token-based billing पर स्विच किया है, तो उसे और सस्ते विकल्प भी देने चाहिए
  GPT-5.4 पहले annual subscribers के लिए 1x था, अब 6x हो गया है। कुछ ही prompts में premium requests ख़त्म हो जाती हैं। $10/month वाला GitHub Copilot पहले अमेरिकी AI labs के models सस्ते में इस्तेमाल करने का सबसे बढ़िया value-for-money विकल्प था
- मैं benchmarks पर भरोसा नहीं करता। मैंने Kimi K2.7 कई बार इस्तेमाल किया है और निराश हुआ हूँ
  Claude जो काम एक बार में ख़त्म कर देता, उसमें यह घूमता ही रहता था। हालाँकि मेरा usage path Ollama Cloud था, और मुझे नहीं पता कि वह असली model दे रहा था या quantized version, और quantization ने performance घटाई भी हो सकती है
  फिर भी अच्छी बात यह है कि एक precedent बन गया। अगर Microsoft अब Kimi K2.7 दे रहा है, तो जल्द ही GLM 5.2 भी दे सकता है, और वह वास्तव में बहुत competitive model है
- फिर से मुझे shill कहा जा सकता है, लेकिन यह संबंधित है इसलिए परवाह नहीं
  Synthetic अपने models को reasonable pricing पर चलाता है, जिनमें GLM5.2 और Kimi K2.7-Code शामिल हैं
  referral link: https://synthetic.new/?referral=kwjqga9QYoUgpZV
input: $0.95, cache hit: $0.19, output: $4.00
यह वही कीमत है जो Moonshot लेता है, और लगभग GPT 5.4 mini के price range में है, इसलिए बुरा विकल्प नहीं है
context के लिए tokens बर्बाद करने वाले एक बेवकूफ़ prompt का उदाहरण लें: “5x5 board पर अकेले tic-tac-toe खेलो। जो 5 को एक लाइन में रखेगा, वही जीतेगा।”
Kimi K2.7 में इसकी लागत $0.006 आती है और पूरा raw reasoning trace देखा जा सकता है। GPT-5.4 mini में इसकी लागत $0.016 आती है और उसे summarize कर दिया जाता है
अगर आप जानना चाहते हों, तो दोनों ही अविश्वसनीय रूप से बेवकूफ़ निकले
Kimi:

A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .

GPT 5.4 mini:

1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
- बस जिज्ञासु लोगों के लिए बता दूँ, GPT 5.5 भी 5.4 mini की तरह ही कचरा खेलता है, लेकिन लागत 4 गुना है
  Fable 40 cents की लागत में काफ़ी भरोसेमंद गेम बना देता है
  
  X X O O O
  O O X X X
  X X X O O
  X O O X O
  X O X X O
- अच्छा आइडिया है। मैंने iOS के Claude Chat में Haiku से यही काम करवाया, तो उसने interactive React game बना दिया, rules implement किए, और फिर खुद खेला
  $1 input और $5 output के हिसाब से काफ़ी स्मार्ट चाल, Anthropic!
- बड़े language models गेम्स में कमज़ोर होते हैं, लेकिन उसी गेम को सीखने वाला reinforcement learning agent लिखना पूरी तरह संभव है
- अगर बहुत ज़्यादा बोर हुआ तो सोच रहा हूँ कि दो models को एक-दूसरे के ख़िलाफ़ chess खिलवाऊँ
  लगता है कहीं न कहीं पहले से chess benchmark या large language model tournament मौजूद होगा
यह अजीब है कि AWS Bedrock ऐसे मॉडलों को बहुत कमजोर तरीके से सपोर्ट करता है
इसमें सिर्फ Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 जैसे मॉडल हैं और नए मॉडल नहीं हैं
- समझ नहीं आता कि यह प्रोडक्ट का फैसला है या GPU की सीमा
  Inf2 instances के लिए AWS Neuron की ज़रूरत होती है [1]। हो सकता है मॉडल को उस हार्डवेयर पर चलने लायक पोर्ट करने में बहुत ज़्यादा समय लगता हो
  [1] https://aws.amazon.com/ai/machine-learning/neuron/
दूसरे मॉडलों की तुलना में इसका रनिंग कॉस्ट साफ तौर पर बहुत सस्ता है, और मैंने कल इसे करीब एक घंटे इस्तेमाल किया तो नतीजे उम्मीद जगाने वाले लगे
Reddit चर्चा में देखा कि टीम glm5.2 का मूल्यांकन कर रही है, इसलिए उम्मीद है कि और भी मॉडल जुड़ेंगे
क्या GitHub Copilot enterprise platform के तौर पर सबसे अच्छी स्थिति में है?
यह Claude, GPT, Gemini को सपोर्ट करता है और अब open weight models भी सपोर्ट करता है। बड़े संगठन वैसे भी API फीस के स्तर पर भुगतान करते हैं, इसलिए कहीं भी इस्तेमाल करें, लागत लगभग समान रहती है
इसके पास काफ़ी अच्छा agent CLI और SDK है, और अब desktop app भी है। hosted agents भी हैं और CI में ‘Agentic Workflows’ भी चलाए जा सकते हैं
क्या इसकी साख इतनी गिर चुकी है कि लोग सिर्फ विकल्पों पर ही ध्यान दे रहे हैं? या enterprise के बाहर के users usage cost की वजह से बाहर हो जाते हैं, इसलिए free marketing नहीं बनती?
- बिना पहले से सूचना दिए कीमत बदल देने वाले rug pull को enterprise पक्ष ने अच्छा नहीं माना
- हमने सबकी plans रद्द कर दीं और अंदरूनी तौर पर liteLLM deploy कर दिया
  Copilot को इसलिए बनाए रखा था क्योंकि उसके token बेहद सस्ते थे, लेकिन नई pricing आने के बाद यह openrouter जैसी कीमत वाला, मगर बहुत कम मॉडलों वाला service बन गया
- पहले था, लेकिन जब से उसने खुद अपनी service को मारने का फैसला किया, तब से नहीं
- किसी वजह से Copilot, VS Code में Claude या VS Code में Codex की तुलना में ज़्यादा बेवकूफ़ लगता है
  सटीक वजह नहीं पता, लेकिन अनुभव अच्छा नहीं था
- Copilot का execution environment उन दूसरे CLI-आधारित execution environments की तुलना में बहुत खराब है जिनके साथ मैं comparative testing करता हूँ। हैरान कर देने लायक खराब
  कंपनी में यह बात अक्सर उठती है, क्योंकि vendor management वाले लोग बड़े language model ecosystem को समझ नहीं पाते और मान लेते हैं कि Copilot के ज़रिए Claude और Claude Code के ज़रिए Claude एक ही चीज़ हैं
  जब भी मुझसे फर्क समझाने को कहा जाता है, मैं बस दोनों को साथ-साथ तुलना में चलाता हूँ, और 5 में से 3~4 बार प्रदर्शन में भारी गिरावट साफ दिख जाती है
अगर कोई छोटी टीम Copilot आज़माना चाहती है, तो मैं चेतावनी देना चाहूँगा कि पुरानी documentation के पीछे चलते-चलते billing setup में उलझकर कई घंटे बर्बाद हो सकते हैं
सार यह है कि आखिर में हमें GitHub से यह email मिला: “Copilot Business उन teams को दिया जाता है जो 10 या उससे ज़्यादा licenses खरीदती हैं।” यह documented नहीं है, लेकिन दूसरे लोग भी यही झेल रहे हैं: https://github.com/orgs/community/discussions/199346
फिलहाल हम Cursor बनाए हुए हैं, और Kimi को “Composer” नाम से मुख्य रूप से इस्तेमाल कर रहे हैं
आखिरकार आ गया। क्या यह Copilot का पहला open weight LLM है? यानी दरवाज़ा खुल गया है

Kimi K2.7 Code अब GitHub Copilot में आधिकारिक रूप से उपलब्ध

Copilot में जोड़ा गया पहला open weight model

usage-based pricing

Copilot में उपलब्धता का दायरा

समर्थित client और surfaces

Business और Enterprise के लिए admin settings

दस्तावेज़ और feedback channels

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय