-
R1 1776 एक open source मॉडल है, जिसे Perplexity AI ने DeepSeek-R1 reasoning मॉडल को fine-tune करके चीनी कम्युनिस्ट पार्टी की सेंसरशिप हटाने के लिए बनाया है.
-
इसकी खासियत यह है कि यह बिना पक्षपात के सटीक जानकारी देने का लक्ष्य रखता है, साथ ही गणित/तर्क क्षमता भी बनाए रखता है.
-
फिलहाल यह मॉडल huggingface पर डाउनलोड के लिए उपलब्ध है.
-
1,000 से अधिक multilingual उदाहरणों वाले evaluation set का उपयोग करके सेंसरशिप से बचने की क्षमता को मापा गया (मानव evaluators + LLM judge साथ में)
-
चीन की राजनीति/समाज/मानवाधिकार जैसे संवेदनशील विषयों पर बिना टाले जवाब दे सकता है
-
decensoring प्रक्रिया के बाद भी MATH/GPQA जैसे benchmarks में बेस मॉडल के बराबर प्रदर्शन बनाए रखा
7 टिप्पणियां
क्या कोरियाई कंपनियों में भी इसके इस्तेमाल पर कोई पाबंदी नहीं लगेगी?
बहुत अच्छा है ^ओ^
क्या उन्होंने DeepSeek के दस्तावेज़ में बताए गए अनुसार बिल्कुल उसी तरह ट्रेनिंग की होगी?
लगता है कि DeepSeek-R1 reasoning model खुद ही open source है
वे सिर्फ़ प्रशिक्षित मॉडल का परिणाम सार्वजनिक करते हैं, लेकिन मूल डेटा सार्वजनिक नहीं किया जाता, इसलिए इसे "open source" नहीं कहा जा सकता। यह सीमित है, लेकिन पहले से प्रशिक्षित मॉडल पर अतिरिक्त training करना या उसमें बदलाव करना संभव है, और इस बार जो जारी किया गया है वह उसी तरह से संशोधित किया गया version है।
इसलिए मैं
open weightशब्द को ज़्यादा पसंद करता हूँ।इससे बेहतर भी कोई होता है।