QwQ - ChatGPT o1 के समान Alibaba का reasoning LLM

(qwenlm.github.io)

6 पॉइंट द्वारा GN⁺ 2024-11-29 | 2 टिप्पणियां | WhatsApp पर शेयर करें

QwQ क्या है
- QwQ(Qwen with Questions) Alibaba द्वारा विकसित एक large language model (LLM) है, जो ChatGPT-4 के मुकाबले की मजबूत performance दिखाता है
- सोचने, सवाल पूछने और गहराई से समझने की मूल दार्शनिक सोच पर आधारित यह मॉडल गणित, प्रोग्रामिंग, सामान्य ज्ञान आदि कई क्षेत्रों में उत्कृष्ट विश्लेषण क्षमता दिखाता है
- यह खुद से प्रश्न करता है, मान्यताओं की समीक्षा करता है और अलग-अलग सोच के रास्तों को खोजता है ताकि गहरी अंतर्दृष्टि हासिल की जा सके
- शुरुआती चरण के learner के रूप में इसमें कुछ सीमाएँ हैं, लेकिन यही अपूर्णताएँ इसे लगातार बेहतर बनने में मदद करती हैं

प्रमुख विशेषताएँ और ताकतें

गहन सोच और self-reflection की क्षमता
- यह केवल समस्या हल करने तक सीमित नहीं रहता, बल्कि समाधान की प्रक्रिया में अपनी ही तर्कशृंखला की जाँच करके बेहतर उत्तर खोजता है
- गहन विश्लेषण और self-questioning की प्रक्रिया के जरिए जटिल समस्याओं को हल करने की क्षमता मजबूत होती है
benchmark tests में सिद्ध उत्कृष्ट प्रदर्शन
- QwQ ने कई सख्त benchmarks में शानदार प्रदर्शन दर्ज किया है और मजबूत problem-solving क्षमता दिखाई है
- GPQA: वैज्ञानिक समस्या-समाधान क्षमता मापने वाले उन्नत स्तर के benchmark में 65.2%
- AIME: हाई-स्कूल स्तर के गणितीय प्रश्नों को परखने वाले AIME में 50.0%
- MATH-500: विभिन्न गणितीय समस्याओं वाले test में 90.6%
- LiveCodeBench: वास्तविक जीवन की coding समस्याओं को मापने वाले test में 50.0%

सीमाएँ

भाषाओं का मिश्रण और switching
- यह कई भाषाएँ संभाल सकता है, लेकिन कभी-कभी उत्तर में भाषाएँ मिल सकती हैं या अचानक बदल सकती हैं
recursive thinking pattern
- तर्क की समीक्षा के दौरान यह circular logic में फँस सकता है, जिससे लंबे उत्तर बन सकते हैं
सुरक्षा और नैतिक विचार
- मॉडल को deploy करते समय safety और reliability सुनिश्चित करने के लिए अतिरिक्त कदमों की जरूरत होती है
common sense और language understanding की सीमाएँ
- तकनीकी problem-solving में यह मजबूत है, लेकिन सामान्य समझ पर आधारित reasoning और भाषा की सूक्ष्म समझ में अभी सुधार की गुंजाइश है

QwQ का अर्थ और मूल्य

ChatGPT-4 से तुलना
- QwQ, ChatGPT-4 के बराबरी का एक large language model है, जो खासकर गणित और प्रोग्रामिंग समस्या-समाधान में अलग पहचान बनाता है
- Alibaba की तकनीकी क्षमता पर बना QwQ, मजबूत विश्लेषण और self-reflection के जरिए अधिक परिष्कृत उत्तर देता है
निरंतर सीखना और विकास
- QwQ कोई पूर्ण रूप से तैयार मॉडल नहीं, बल्कि लगातार विकसित और सीखने वाला मॉडल है
- अपनी सीमाओं और अपूर्णताओं को स्वीकार करते हुए बेहतर दिशा में आगे बढ़ने का इसका रवैया, AI मॉडल के रूप में इसकी संभावनाओं को साबित करता है

2 टिप्पणियां

xguru 2024-11-29

Alibaba वास्तव में LLM क्षेत्र में बहुत निवेश कर रहा है।

Alibaba, Qwen 2 मॉडल जारी
Alibaba, ओपन सोर्स AI मॉडल QWEN जारी
Qwen1.5-110B : Alibaba की ओपन सोर्स LLM Qwen1.5 सीरीज़ का पहला 100B+ मॉडल
Alibaba, Qwen2-Math मॉडल जारी

GN⁺ 2024-11-29

Hacker News राय

एक उपयोगकर्ता ने AI को अपने बनाए हुए टोपोलॉजी के सवाल को हल करते हुए देखकर हैरानी जताई। उसे लगा कि AI की समस्या-सुलझाने की प्रक्रिया मानवीय है
- उसने वह क्षण देखा जब AI दिए गए संकेत को समझ गया
- वह GPT-4o को छात्र की भूमिका में सेट करके सवाल हल कराने का प्रयोग करने की योजना बना रहा है
एक अन्य उपयोगकर्ता ने बताया कि उसने Mac पर Ollama के ज़रिए AI चलाकर अच्छे नतीजे पाए
- 20GB डाउनलोड के साथ यह जल्दी चल पड़ा और शुरुआती प्रॉम्प्ट पर अच्छे नतीजे दिखाए
QwQ को reverse engineering की समस्या एक ही बार में हल करने की क्षमता दिखाने के लिए प्रभावशाली बताया गया
- इसने वह समस्या हल कर दी जिसे केवल o1-preview और o1-mini ही हल कर पाए थे
strawberry में r की संख्या पूछने वाले सवाल पर AI ने कई बार अनुमान लगाए और बहुत संसाधन खर्च किए
- आखिरकार उसने सही जवाब दिया, लेकिन यह अक्षम था
AI के शुरुआती संस्करण के अब भी सीखने की प्रक्रिया में होने का ज़िक्र किया गया, और सीखने की सुंदरता की बात कही गई
- जब AI को समय लेकर सोचने दिया जाता है, तो गणित और प्रोग्रामिंग के बारे में उसकी समझ गहरी हो जाती है
यह भी कहा गया कि सही सवाल ढूँढ़ना कठिन है
- अक्सर सवाल या तो बहुत आसान होते हैं या बहुत कठिन
2019^8+1 का सबसे छोटा विषम अभाज्य गुणनखंड खोजने की समस्या को AI ने जिस तरह हल किया, उसे प्रभावशाली बताया गया
यह तर्क दिया गया कि LLM की वास्तविक reasoning क्षमता जाँचने के लिए ऐसे गणित के सवाल इस्तेमाल होने चाहिए जो training data में न हों
o1-preview ने उदाहरण वाले सवाल पर गलत जवाब दिया था, लेकिन अंत में सही उत्तर तक पहुँच गया
Deepseek के R1-lite की तुलना में इसके आकार को लेकर जिज्ञासा जताई गई, और इसके दिलचस्प नाम का भी ज़िक्र हुआ

QwQ - ChatGPT o1 के समान Alibaba का reasoning LLM

प्रमुख विशेषताएँ और ताकतें

सीमाएँ

QwQ का अर्थ और मूल्य

संबंधित पढ़ाई

2 टिप्पणियां

Hacker News राय