6 पॉइंट द्वारा GN⁺ 2024-11-29 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • QwQ क्या है
    • QwQ(Qwen with Questions) Alibaba द्वारा विकसित एक large language model (LLM) है, जो ChatGPT-4 के मुकाबले की मजबूत performance दिखाता है
    • सोचने, सवाल पूछने और गहराई से समझने की मूल दार्शनिक सोच पर आधारित यह मॉडल गणित, प्रोग्रामिंग, सामान्य ज्ञान आदि कई क्षेत्रों में उत्कृष्ट विश्लेषण क्षमता दिखाता है
    • यह खुद से प्रश्न करता है, मान्यताओं की समीक्षा करता है और अलग-अलग सोच के रास्तों को खोजता है ताकि गहरी अंतर्दृष्टि हासिल की जा सके
    • शुरुआती चरण के learner के रूप में इसमें कुछ सीमाएँ हैं, लेकिन यही अपूर्णताएँ इसे लगातार बेहतर बनने में मदद करती हैं

प्रमुख विशेषताएँ और ताकतें

  • गहन सोच और self-reflection की क्षमता
    • यह केवल समस्या हल करने तक सीमित नहीं रहता, बल्कि समाधान की प्रक्रिया में अपनी ही तर्कशृंखला की जाँच करके बेहतर उत्तर खोजता है
    • गहन विश्लेषण और self-questioning की प्रक्रिया के जरिए जटिल समस्याओं को हल करने की क्षमता मजबूत होती है
  • benchmark tests में सिद्ध उत्कृष्ट प्रदर्शन
    • QwQ ने कई सख्त benchmarks में शानदार प्रदर्शन दर्ज किया है और मजबूत problem-solving क्षमता दिखाई है
    • GPQA: वैज्ञानिक समस्या-समाधान क्षमता मापने वाले उन्नत स्तर के benchmark में 65.2%
    • AIME: हाई-स्कूल स्तर के गणितीय प्रश्नों को परखने वाले AIME में 50.0%
    • MATH-500: विभिन्न गणितीय समस्याओं वाले test में 90.6%
    • LiveCodeBench: वास्तविक जीवन की coding समस्याओं को मापने वाले test में 50.0%

सीमाएँ

  • भाषाओं का मिश्रण और switching
    • यह कई भाषाएँ संभाल सकता है, लेकिन कभी-कभी उत्तर में भाषाएँ मिल सकती हैं या अचानक बदल सकती हैं
  • recursive thinking pattern
    • तर्क की समीक्षा के दौरान यह circular logic में फँस सकता है, जिससे लंबे उत्तर बन सकते हैं
  • सुरक्षा और नैतिक विचार
    • मॉडल को deploy करते समय safety और reliability सुनिश्चित करने के लिए अतिरिक्त कदमों की जरूरत होती है
  • common sense और language understanding की सीमाएँ
    • तकनीकी problem-solving में यह मजबूत है, लेकिन सामान्य समझ पर आधारित reasoning और भाषा की सूक्ष्म समझ में अभी सुधार की गुंजाइश है

QwQ का अर्थ और मूल्य

  • ChatGPT-4 से तुलना
    • QwQ, ChatGPT-4 के बराबरी का एक large language model है, जो खासकर गणित और प्रोग्रामिंग समस्या-समाधान में अलग पहचान बनाता है
    • Alibaba की तकनीकी क्षमता पर बना QwQ, मजबूत विश्लेषण और self-reflection के जरिए अधिक परिष्कृत उत्तर देता है
  • निरंतर सीखना और विकास
    • QwQ कोई पूर्ण रूप से तैयार मॉडल नहीं, बल्कि लगातार विकसित और सीखने वाला मॉडल है
    • अपनी सीमाओं और अपूर्णताओं को स्वीकार करते हुए बेहतर दिशा में आगे बढ़ने का इसका रवैया, AI मॉडल के रूप में इसकी संभावनाओं को साबित करता है

2 टिप्पणियां

 
GN⁺ 2024-11-29
Hacker News राय
  • एक उपयोगकर्ता ने AI को अपने बनाए हुए टोपोलॉजी के सवाल को हल करते हुए देखकर हैरानी जताई। उसे लगा कि AI की समस्या-सुलझाने की प्रक्रिया मानवीय है
    • उसने वह क्षण देखा जब AI दिए गए संकेत को समझ गया
    • वह GPT-4o को छात्र की भूमिका में सेट करके सवाल हल कराने का प्रयोग करने की योजना बना रहा है
  • एक अन्य उपयोगकर्ता ने बताया कि उसने Mac पर Ollama के ज़रिए AI चलाकर अच्छे नतीजे पाए
    • 20GB डाउनलोड के साथ यह जल्दी चल पड़ा और शुरुआती प्रॉम्प्ट पर अच्छे नतीजे दिखाए
  • QwQ को reverse engineering की समस्या एक ही बार में हल करने की क्षमता दिखाने के लिए प्रभावशाली बताया गया
    • इसने वह समस्या हल कर दी जिसे केवल o1-preview और o1-mini ही हल कर पाए थे
  • strawberry में r की संख्या पूछने वाले सवाल पर AI ने कई बार अनुमान लगाए और बहुत संसाधन खर्च किए
    • आखिरकार उसने सही जवाब दिया, लेकिन यह अक्षम था
  • AI के शुरुआती संस्करण के अब भी सीखने की प्रक्रिया में होने का ज़िक्र किया गया, और सीखने की सुंदरता की बात कही गई
    • जब AI को समय लेकर सोचने दिया जाता है, तो गणित और प्रोग्रामिंग के बारे में उसकी समझ गहरी हो जाती है
  • यह भी कहा गया कि सही सवाल ढूँढ़ना कठिन है
    • अक्सर सवाल या तो बहुत आसान होते हैं या बहुत कठिन
  • 2019^8+1 का सबसे छोटा विषम अभाज्य गुणनखंड खोजने की समस्या को AI ने जिस तरह हल किया, उसे प्रभावशाली बताया गया
  • यह तर्क दिया गया कि LLM की वास्तविक reasoning क्षमता जाँचने के लिए ऐसे गणित के सवाल इस्तेमाल होने चाहिए जो training data में न हों
  • o1-preview ने उदाहरण वाले सवाल पर गलत जवाब दिया था, लेकिन अंत में सही उत्तर तक पहुँच गया
  • Deepseek के R1-lite की तुलना में इसके आकार को लेकर जिज्ञासा जताई गई, और इसके दिलचस्प नाम का भी ज़िक्र हुआ