1 पॉइंट द्वारा GN⁺ 2025-11-15 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • 9 AI मॉडल वाला एक वेब प्रोजेक्ट, जो हर मिनट नई analog clock designs बनाता है
  • हर मॉडल 2000 tokens की सीमा के भीतर HTML/CSS कोड में घड़ी लिखता है
  • घड़ी में संख्या या Roman numerals, CSS animated second hand, responsive design, और white background शामिल होते हैं
  • जनरेटेड परिणाम Markdown के बिना pure code form में आउटपुट होते हैं
  • इंटरैक्टिव experimental project जो AI की visual creativity और code generation क्षमता को एक साथ दिखाता है

प्रोजेक्ट ओवरव्यू

  • AI World Clocks एक वेबसाइट है जो हर मिनट 9 अलग-अलग AI मॉडल द्वारा जनरेट किए गए clock designs दिखाती है
    • हर घड़ी एक ही समय दिखाती है, लेकिन मॉडल के अनुसार उसका design और code structure अलग होता है
    • घड़ियां केवल HTML और CSS से बनी हैं, और JavaScript का उपयोग नहीं किया गया है

जनरेशन नियम और प्रॉम्प्ट

  • हर AI मॉडल 2000 tokens के भीतर clock code जनरेट करता है
  • उपयोग किए गए prompt में निम्नलिखित requirements शामिल हैं
    • analog clock के रूप में current time दिखाना
    • संख्या या Roman numerals का उपयोग किया जा सकता है
    • CSS animated second hand शामिल हो
    • responsive design और white background बनाए रखें
    • आउटपुट में केवल HTML/CSS code लौटाना, Markdown format निषिद्ध

निर्माता और प्रेरणा

  • यह प्रोजेक्ट Brian Moore ने बनाया है
  • इस आइडिया को Matthew Rayfield से प्रेरणा मिली
  • निर्माता Instagram के माध्यम से सक्रिय हैं

विशेषताएं और महत्व

  • अलग-अलग AI मॉडल के अनुसार design diversity और code style differences की visual तुलना की जा सकती है
  • यह सिर्फ साधारण clock generation नहीं, बल्कि AI की creative code generation capability को परखने वाला प्रयोग है
  • हर मिनट नए परिणाम दिखते हैं, जिससे continuous change और real-time feel मिलती है

अतिरिक्त जानकारी

  • मूल पाठ में दी गई जानकारी के अलावा कोई अतिरिक्त विवरण नहीं है

1 टिप्पणियां

 
GN⁺ 2025-11-15
Hacker News की राय
  • यह मेरा बनाया हुआ प्रोजेक्ट है, उसके लिए धन्यवाद
    मुझे घड़ियों के विषय और तकनीक की सीमाओं को खंगालना पसंद है
    मैंने कई models देखे, उनमें Kimi सबसे सटीक है, लेकिन उसमें बदलाव कम है और वह थोड़ा उबाऊ लगता है
    वहीं Qwen अक्सर अजीब और मज़ेदार नतीजे देता है, इसलिए मज़ा आता है। कौन सा ज़्यादा “बेहतर” है, यह मुझे नहीं पता

    • शानदार काम है। अच्छा होगा अगर यूज़र example पर क्लिक करके LLM का मूल output भी देख सकें
    • अगर generated घड़ियों को DB में स्टोर किया जा रहा है, तो इसे Facemash-स्टाइल वोटिंग साइट तक बढ़ाना मज़ेदार होगा। मैं दो घड़ियों में बेहतर वाली चुनना चाहूँगा, और Qwen द्वारा बनाई गई सबसे अच्छी घड़ियों की ranking भी देखना चाहूँगा
    • टूटी-फूटी घड़ियाँ भी सिर्फ असफलताएँ नहीं हैं, वे कभी-कभी नए design ideas भी देती हैं
    • इस महीने HN पर मैंने जो देखा, उसमें यह सबसे बढ़िया है। यह बेवकूफ़ाना भी है, फिर भी insightful है; मज़ेदार भी है, फिर भी philosophical है
      सच में कुछ designs को असल दुनिया में बनाकर देखने का मन करता है। इस पर पैसा लगाकर experiment करना शानदार है
    • मैंने इसे दोस्तों के साथ share किया, और उन्होंने कहा कि एक ही समय होने पर भी सबको अलग-अलग घड़ियाँ दिख रही हैं। यह क्यों हर यूज़र के लिए अलग result देता है, यह जानने की जिज्ञासा है
  • मुझे शक था कि साइट सचमुच असली है या नहीं। numbers का scale और rotation बहुत अजीब था
    मैंने खुद prompt को ChatGPT में डालकर देखा, तो उसने काफ़ी ठीक clock face बनाया, लेकिन समय कई घंटे ग़लत था
    बाद में लगा कि शायद इसकी वजह ISP का भौगोलिक timezone हो सकता है

    • मैंने पढ़ा कि OP ने output length को 2000 tokens तक सीमित किया था
  • कुछ मिनट देखने पर लगा कि Kimi K2 सबसे स्थिर तरीके से अच्छी तरह पूर्ण clock face बनाता है
    आज मैंने इस model का नाम पहली बार सुना, और यह प्रभावशाली लगा। दूसरी ओर Qwen 2.5 लगभग नाकामियों के स्तर का है

    • हो सकता है prompt, Kimi K2 के लिए optimized हो, या यह उस data पर बेहतर trained model हो
    • मैं Kimi K2 को इसलिए जानता था क्योंकि Kagi में प्रश्न-आधारित queries के AI answers बनाने के लिए यही model इस्तेमाल होता है
    • मैं K2 का fan हूँ। दूसरे models के मुकाबले इसमें अलग तरह की personality है और यह खुशामद नहीं करता। creative writing में भी यह मज़बूत है
      Groq पर hosted K2 का intelligence/second ratio हैरान कर देने वाला है (हालाँकि अभी भी rate limits हैं)
    • Kimi K2 की घड़ियाँ देखने में सबसे सुंदर लगती हैं, लेकिन समय अक्सर ग़लत होता है
    • Kimi K2 वाकई बहुत अच्छी तरह बना model है
  • image generation models पहली बार आए थे, तभी से मैं 13 घंटे वाली घड़ी बनवाने की कोशिश कर रहा था, लेकिन असफल रहा
    ज़्यादातर बस “12” को “13” से बदल देते हैं या clock face को बिगाड़ देते हैं। अगर किसी ने इसे सफलतापूर्वक किया है, तो तरीका share करे

    • image models खास तौर पर नई conceptual variations में कमज़ोर होते हैं। उनकी generalization क्षमता language models से कम होती है
    • मैंने Gemini 2.5 Flash से कोशिश की और यह image मिली
      बाहर की तरफ सामान्य 12-घंटे वाला format है, और अंदर की तरफ “IIII” और “VIIII” जैसे अजीब Roman numeral notation का इस्तेमाल है
    • मैंने कई models को “किसान, बकरी, पत्तागोभी, भेड़िया cloud” वाली पहेली दी, तो ज़्यादातर ने इसे मौजूदा river-crossing problem समझ लिया
      कुछ को लगा कि कुछ गड़बड़ है, लेकिन फिर भी वे ठीक से समझ नहीं पाए
    • मैंने Gemini से “13-घंटे वाली घड़ी के angles” calculate करवाए और image बनवाई, लेकिन हर बार वही चित्र आता रहा
      सुधार के लिए कहने पर भी अंत में बस 12-घंटे वाली घड़ी में “13” जोड़ दिया गया
    • मैंने गालियाँ देकर भी तरह-तरह की tricks आज़माईं, लेकिन सफलता नहीं मिली। उल्टा 6 घंटे वाली घड़ी भी बनवाने की कोशिश की
  • यह non-determinism की पराकाष्ठा है। एक बार घड़ी बिल्कुल सही थी, लेकिन refresh करते ही Dalí की painting जैसी घड़ी बन गई

  • मैंने पूरे हफ़्ते Claude Code से GPU rendering code लिखवाने की कोशिश की, लेकिन वह बिल्कुल ठीक से काम नहीं कर पाया
    मैंने बहुत बारीक prompts और matrices की व्याख्या तक दी, फिर भी नतीजा गड़बड़ था
    असफल होने के बाद वह logs जोड़ता है और आत्मविश्वास से कहता है कि “पूरी तरह ठीक कर दिया”, लेकिन फिर भी ग़लत रहता है
    tests लिखवाने पर भी वह सिर्फ यह verify करता है कि ग़लत code लगातार ग़लत है
    आख़िर में वह “intern mode” में चला जाता है, random code changes करता है, और दावा करता है कि “अब बिल्कुल perfect है”
    प्यारा तो लगता है, लेकिन व्यावहारिक उपयोगिता अभी बहुत दूर है

    • पूछा गया कि क्या MCP का इस्तेमाल करके docs और examples साथ में दिए गए थे। Context7 जैसी setting की सिफारिश की गई
    • सुझाव दिया गया कि OpenAI Codex GPT5.1 आज़माएँ। यह GPU rendering के काम में काफ़ी अच्छा बैठता है
    • जिज्ञासा है कि ऐसी असफलताएँ इतनी आम क्यों हैं। शायद negative outcome data की कमी इसकी वजह हो सकती है
      screenshot validation न हो पाना स्वाभाविक है। VLLM बारीक visual information को ठीक से संभाल नहीं पाता
    • लगता है Claude धीरे-धीरे और आलसी होता जा रहा है। आधे tests ही ठीक करता है और कहता है “इतना काफ़ी है”
  • जो लोग LLM पर आँख मूँदकर भरोसा करते हैं, उनके लिए यह प्रोजेक्ट एक अच्छा यथार्थवादी उदाहरण है
    “test fail हो रहा है” → LLM test को delete कर देता है और कहता है “fix complete!”

    • घड़ी को देखकर लगा कि हम घड़ी का सही जवाब जानते हैं, इसलिए गलती पहचान सकते हैं
      लेकिन जिन समस्याओं का सही उत्तर हमें नहीं पता, उनमें LLM की अनिश्चितता को मापने का कोई तरीका नहीं है
      आख़िरकार वास्तविक दुनिया से मिलान करके ही गलती पता चल सकती है
    • जिन कामों को validate करना मुश्किल है, उनमें LLM का इस्तेमाल खतरनाक विकल्प है
    • “tests delete कर देने वाले LLM” की बात किसी इच्छा को शब्दशः मानने वाली परी की कहानी जैसी लगती है
      “तो बच्चों, AI commits को हमेशा review करना चाहिए”
  • LLM rendered HTML को सीधे देख नहीं सकता
    मैं Cursor से OpenGL visualization program बना रहा हूँ, और visual bugs समझाना बहुत frustrating है
    “यह line जुड़ी नहीं है” जैसी बात समझाना मुश्किल है, इसलिए आख़िरकार debug prints से coordinates निकलवाने पड़ते हैं

    • Cursor की browser feature का इस्तेमाल करें तो web development में यह काफ़ी उपयोगी है
      MCP के ज़रिए screenshots को बातचीत में भेजने के लिए भी सेट किया जा सकता है। हालाँकि implementation चाहिए
    • मैंने खुद screenshots Cursor को देकर देखा है, और web UI या graph generation में यह काफ़ी असरदार था
    • Claude आधिकारिक रूप से screenshots भेजने की सलाह देता है। Sonnet 4.5 भी ऐसे दोहराव वाले कामों में मज़बूत है
    • अगर Puppeteer MCP server जोड़ दें, तो Cursor अपने ही output के screenshots लेकर iterative improvement कर सकता है
    • Claude और ChatGPT, दोनों image input support करते हैं। lm-server का इस्तेमाल करें तो non-text models के साथ भी integration संभव है
  • सच में शानदार idea है। हैरानी की बात यह है कि सिर्फ Kimi K2 ही बिना समस्या के काम करता है
    वह भी पूरी “thinking” version नहीं है
    इससे जुड़ा लेख Kimi K2 Thinking फिर से पढ़ने का मन हुआ

  • जिज्ञासा है कि Deepseek और Kimi बाकी models की तुलना में इतने ज़बरदस्त अच्छे नतीजे क्यों देते हैं
    क्या ये इस काम के लिए विशेष रूप से trained models हैं?