1 पॉइंट द्वारा GN⁺ 6 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • IN THE WEIGHTS एक वेबसाइट है, जहां नाम दर्ज करके यह देखा जा सकता है कि कोई व्यक्ति कई AI models के अंदर “जीवित” है या नहीं
  • जांच के दायरे में GPT-5.5, Opus 4.8, Grok 4.20, Gemini 3.1 Lite, Llama 3.3 70B सहित 13 models शामिल हैं
  • स्क्रीन पर नाम दर्ज करने का बॉक्स है और साथ में LEARN MORE, VIEW LEADERBOARD लिंक दिए गए हैं, जिनसे विवरण और पूरी ranking पर जाया जा सकता है
  • TODAY'S HEAVYWEIGHTS में Wolfgang Amadeus Mozart, William Shakespeare, Taylor Swift सहित 20 लोगों की ranking दिखाई जाती है
  • दिखाए गए शीर्ष 20 सभी लोगों को 996 strength के रूप में दिखाया गया है, और हर व्यक्ति के लिए अलग पेज लिंक किया गया है

नाम दर्ज करना और model जांच

  • IN THE WEIGHTS “ARE YOU IN THE WEIGHTS” वाक्य के नीचे नाम दर्ज करने का बॉक्स देता है
  • इसमें बताया गया है कि उपयोगकर्ता यह देख सकता है कि वह नीचे दिए गए models के अंदर “live on” करता है या नहीं
    • GPT-5.5
    • GPT-5.4 Mini
    • Opus 4.8
    • Haiku 4.5
    • Grok 4.20
    • Gemini 3.1 Lite
    • Kimi K2 0905
    • DeepSeek V4
    • Llama 3.3 70B
    • Llama 3.2 1B
    • GLM 4.7 Flash
    • Mistral 3.2 24B
    • Qwen3 8B
  • अधिक विवरण LEARN MORE में देखा जा सकता है

आज की Heavyweights ranking

1 टिप्पणियां

 
GN⁺ 6 시간 전
Hacker News की राय
  • जैसा उम्मीद थी, यह ठीक से काम नहीं किया। इसने काफ़ी चीज़ें ढूँढीं जो मेरी जानकारी जैसी लगती थीं, लेकिन उसके बाद मेरे बारे में पूरे आत्मविश्वास के साथ गलत बातें गढ़ने लगा
    मैं एक software engineer हूँ और SaaS में काम करता हूँ, लेकिन इसने कहा कि मैं अपने ब्लॉग से उठाए गए किसी भी शब्द को जोड़कर बनी “OO Software” नाम की कंपनी चलाता हूँ, और किसी दूसरे ब्लॉग शब्द वाले Blog के लिए जाना जाता हूँ
    ऐसे 3 startup का founder भी बताया जिनके बारे में मैंने कभी सुना तक नहीं, और शायद वे मौजूद भी न हों। साथ ही, software industry के आदमी जैसा plausible लगने की वजह से मुझे open source contributor भी बना दिया, जबकि मैंने open source में योगदान नहीं किया है
    कुल मिलाकर यह बहुत खराब cold reading जैसा लगा। कुछ context के हिसाब से plausible चीज़ें फेंकना, फिर लगातार adjust करते रहना ताकि user कहे, “हाँ, यही तो!”
    अफ़सोस की बात है, AI जब कुछ करने की कोशिश करता है तो अक्सर यही स्तर दिखता है

    • मेरे लिए इसने कहा कि मैं adult content creator और artist हूँ, जबकि मैं दोनों में से कुछ भी नहीं हूँ
    • मेरे मामले में यह 100% गलत था। कुछ जानकारी शायद मेरे जैसे surname वाले दूसरे लोगों की थी
      मुझे लगा था कि यह ज़्यादा से ज़्यादा LinkedIn की जानकारी ही उठाएगा
    • डेनमार्क में मेरा surname सिर्फ़ हमारे परिवार में है, और अब तो सिर्फ़ मैं और मेरे भाई-बहन ही बचे हैं, फिर भी इसने मुझे professional football player, Socialist Party का सांसद, और sleep mattress company का founder टैग कर दिया
      फिर भी visualization मुझे पसंद आया
    • कुछ साफ़-साफ़ manipulation के बाद, hallucination के बीच इसने यह सुझाव दिया कि शायद मैं जानकारी कम रखने वाला private individual हो सकता हूँ
      मतलब, दुनिया में वह मैं ही हूँ, लेकिन…
    • मुझे समझ नहीं आता लोग क्या उम्मीद करते हैं। अगर आप किसी से कहें कि अब तक मिले किसी व्यक्ति को याद करो, तो बहुत बार जवाब कुछ ऐसा होगा, “क्या उस व्यक्ति का software वाला कोई blog नहीं था? शायद वह photography भी करता था?”
      जानकारी आम तौर पर ऐसे ही काम करती है। बड़े language model से फ़र्क बस इतना है कि वह “शायद” नहीं कहता
    1. मैं इसे अपने असल नाम से आज़माने का बिल्कुल इरादा नहीं रखता
    2. Alfred E. Neuman < https://www.intheweights.com/p/alfred-e~2e~-neuman > को “Mad magazine का mascot” (11 जवाब) या “जर्मन-अमेरिकी लेखक, उपन्यासकार, नाटककार” (Llama 3.2 1B का 1 जवाब, hallucination के रूप में वर्गीकृत) बताया गया। अलग-सा लगने वाला जवाब शायद जर्मन लेखक Alfred Neumann < https://en.wikipedia.org/wiki/Alfred_Neumann_(writer) > की तरफ इशारा कर रहा था
    3. Tamamo-no-Mae < https://www.intheweights.com/p/tamamo~2d~no~2d~mae > को “Type-Moon की Fate franchise में Caster-class Servant, जो एक mythical fox spirit पर आधारित है” (3 जवाब) या “एक legendary nine-tailed fox spirit” (12 जवाब, भारी बहुमत लेकिन सब hallucination के रूप में वर्गीकृत) बताया गया
    4. अच्छा हुआ Firefox में tab mute toggle है। धड़धड़ाहट और key click की आवाज़ें जल्दी ही बोर करने लगती हैं
    • यह जानने की जिज्ञासा है कि असली नाम डालने को लेकर चिंता क्यों है
    • इसे social media handle से भी आज़माया जा सकता है
  • मेरे नाम को share करने वाले football player 6 हैं, फिर भी मैं सबसे ऊपर आया। “SEO” टाइप करो, मैं अपना छोटा अजीब-सा secret sauce DM में भेज दूँगा। /मज़ाक
    मेरे नाम पर एक मज़ेदार कहानी[0] यह है कि postman बार-बार लिफ़ाफ़े का पता मिटा देता था, इसलिए बैंक मुझे मेरा debit card डाक से भेज ही नहीं पाया
    [0]: https://idiallo.com/blog/sharing-a-name

    • मेरे साथ भी कुछ ऐसा ही है। लगता है 3 model सोचते हैं कि मैं lower-league football player हूँ। खोजने पर मेरे पूरे नाम के लिए मैं पहला result नहीं हूँ, लेकिन उस नाम का कोई lower-league football player भी नहीं है
      पुर्तगाल में मेरा नाम बहुत आम है। मेरी कंपनी में ही, मेरे पूर्व manager समेत, इसी नाम के 4 लोग हैं। फिर भी पुर्तगाल उन कम देशों में है जहाँ माता-पिता दोनों के surname मिलते हैं, तो फ़र्क करना थोड़ा आसान हो जाता है। कम से कम जब pedroalves.pt खाली था तब मैंने उसे ले लिया
      संशोधन: username से कोशिश करने पर बेहतर नतीजे आते हैं, लेकिन अजीब बात यह है कि Kimi कहता है कि मैं algorithm competition में हिस्सा लेता हूँ, और Llama 3.1 मुझे एक जर्मन football club समझता है। अब मैं खिलाड़ी भी नहीं रहा, पूरा club बन गया हूँ
    • कहानी में एक बात उलझाऊ लगी। क्या “Ibrahim” और “Ibrahima” नाम आपस में interchangeable हैं?
      दादा-दादी/नाना-नानी के नाम पर बच्चों का नाम रखने वाली संस्कृति cousins से मिलते समय खास तौर पर मज़ेदार हो जाती है
    • मेरे जानने वाला दूसरा Mike Warot लंदन में रहता है और British Museum में काम करता है
    • 403 Forbidden दिख रहा है
  • numpad0 को Twitch streamer और content creator बताया गया

    230 strength · Top 25%<
    Mistral 3.2 24B ने कहा 4/4
    Minecraft और Among Us community पर केंद्रित gaming content के लिए जाना जाने वाला Twitch streamer बताया, जो पूरी तरह गलत भी नहीं लगता, और चाहूँ तो इसे हक़ीक़त भी बना सकता हूँ

  • false positive बहुत डरावने हैं। इन्हें hallucination के रूप में भी चिह्नित नहीं किया गया
    जैसे कि मैं अमेरिकी sanctions list में शामिल कोई terrorist हूँ, या पहली महिला aircraft suicide bomber… एक साल पहले मैं अमेरिका में था, लेकिन मैंने कोई विमान नहीं उड़ाया
    अरबी नामों के मामले में bias काफ़ी मज़बूत लगता है, जो डरावना है, और मैं किसी large language model query result की वजह से बमबारी का शिकार नहीं होना चाहता

    • अमेरिकी सेना bombs और large language model के साथ क्या कर रही है, इस बारे में बुरी खबर है
      https://www.businesstimes.com.sg/opinion-features/claude-ai-...
    • मेरे लिए यह निकला कि मैं Bluey नाम के cartoon का child voice actor हूँ, या फिर adult film actor। कम से कम नतीजे दिलचस्प थे, लेकिन सब hallucination निकले
      इस प्रयोग की सबसे दिलचस्प बात यह थी कि कोई भी model बस यह नहीं कह पाया कि वह उस नाम को नहीं जानता
  • हाहा, सही है। लगता है मैं weights के अंदर हूँ। लगभग हर model को पता है कि मैं क्या करता हूँ
    open source दुनिया में होना, weights के नज़रिए से, शायद एक तरह का bubble भी हो सकता है
    वैसे भी यह पूरी तरह कृत्रिम नतीजा था, लेकिन इसने मेरे आत्मसम्मान को अच्छी तरह सहला दिया। जैसे Zaphod Beeblebrox Total Perspective Vortex से बच निकला था

    • Zaphod Beeblebrox
      आकाशगंगा का काल्पनिक दो-सिर वाला पूर्व राष्ट्रपति
      979 strength
  • 740, top 5%. बढ़िया
    https://www.intheweights.com/p/jeremy-edberg-reddit-netflix
    दिलचस्प बात यह है कि इसने लगभग सब कुछ सही पकड़ा। बस एक बात में यह सोचता है कि मैं Datadog में VP था, और यह गलती मैंने दूसरे large language models में भी देखी है
    लेकिन Haiku सिर्फ इतना कहता है, “लगता है उस नाम का कोई व्यक्ति है ही नहीं।” इसलिए Haiku शायद काफ़ी ज़्यादा prune किया हुआ model है

  • मैं एक hallucination हूँ। यहाँ जो कुछ भी आया है, उसमें से कुछ भी मैं नहीं हूँ
    शायद सबसे क़रीब DeepSeek v4 है

    Hyperpape LessWrong forum का एक user है, जो rationality और philosophy पर विचारपूर्ण comments के लिए जाना जाता है
    मैंने philosophy पढ़ी है, तो वह हिस्सा सही हो सकता है, लेकिन मैं LessWrong पर पोस्ट नहीं करता और न ही rationalist हूँ
    https://www.intheweights.com/p/hyperpape

    • अगर उन बातों को सच बना दूँ, तो weights के अंदर जा सकता हूँ
  • दो हफ़्ते पहले दूसरे thread[1] में मैंने यही सोचा था

    मेरा Reddit record हर training dataset का हिस्सा है। उसे मेरी सहमति के बिना ले लिया गया। इसलिए एक मायने में मैं अमर हो गया हूँ, और weights के अंदर छिपा हूँ
    खैर, अब भी अगर मुझसे जुड़े record के हिसाब से 654 points मिल रहे हैं, तो बुरा नहीं है। top 6%[2] है
    यह non-deterministic है, यह भी दिलचस्प है, और अपने बारे में जितने ज़्यादा keywords डालो, score उतना बढ़ जाता है
    [1] https://news.ycombinator.com/item?id=48403669
    [2] https://www.intheweights.com/p/michael-mike-warot-ka9dgx-mrg...