5 पॉइंट द्वारा GN⁺ 2025-11-19 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • WeatherNext 2 एक AI-आधारित मॉडल है, जिसने वैश्विक मौसम पूर्वानुमान की सटीकता और दक्षता में बड़ा सुधार किया है
  • यह एकल TPU पर 1 मिनट से कम समय में सैकड़ों मौसम परिदृश्य तैयार करता है और मौजूदा मॉडलों की तुलना में 8 गुना तेज पूर्वानुमान गति देता है
  • नई Functional Generative Network(FGN) संरचना के जरिए यह भौतिक रूप से सुसंगत पूर्वानुमान बनाए रखता है और घंटेवार resolution तक सपोर्ट करता है
  • पूर्वानुमान डेटा Earth Engine और BigQuery में उपलब्ध है, और Vertex AI के early access प्रोग्राम के जरिए कस्टम inference सुविधाएँ देता है
  • यह तकनीक Search, Gemini, Pixel Weather, Google Maps Platform सहित Google की सेवाओं में मौसम सुविधाओं को अपग्रेड करती है

WeatherNext 2 का अवलोकन

  • Google DeepMind और Google Research द्वारा संयुक्त रूप से विकसित WeatherNext 2 एक AI-आधारित मौसम पूर्वानुमान मॉडल है, जो पहले की तुलना में 8 गुना तेज गति और 1 घंटे के अंतराल वाला resolution प्रदान करता है
    • एकल इनपुट से सैकड़ों संभावित मौसम परिदृश्य तैयार करता है
    • पूर्वानुमान एकल TPU पर 1 मिनट से कम में पूरा हो जाता है, जबकि मौजूदा भौतिकी-आधारित supercomputer मॉडल को कई घंटे लगते हैं
  • यह मॉडल तापमान, पवन वेग, आर्द्रता सहित 99.9% variables और forecast lead times (0~15 दिन) में पिछले मॉडल से बेहतर प्रदर्शन दिखाता है
  • WeatherNext 2 पूरी पृथ्वी के लिए high-resolution पूर्वानुमान संभव बनाता है और मौसम एजेंसियों के निर्णय समर्थन में भी उपयोगी है

AI modeling के लिए नया दृष्टिकोण

  • WeatherNext 2 Functional Generative Network(FGN) नामक एक नया AI modeling तरीका अपनाता है
    • मॉडल संरचना में सीधे ‘noise’ inject करके यह सुनिश्चित किया जाता है कि पूर्वानुमान परिणाम भौतिक रूप से यथार्थवादी और आपस में जुड़े हुए बने रहें
  • यह दृष्टिकोण ‘marginal’ और ‘joint’ दोनों तरह के पूर्वानुमान के लिए उपयोगी है
    • marginal का मतलब अलग-अलग तत्वों से है, जैसे किसी विशेष स्थान का तापमान, ऊँचाई के अनुसार पवन वेग, आर्द्रता
    • joint का मतलब कई तत्वों के संयोजन से बने बड़े मौसम तंत्र से है, जो heatwave क्षेत्रों या wind power generation के पूर्वानुमान जैसे जटिल विश्लेषण के लिए जरूरी है
  • मॉडल केवल marginal डेटा पर ट्रेन होता है, लेकिन joint patterns को खुद सीखकर जटिल पूर्वानुमान कर सकता है

डेटा एक्सेस और उपयोग

  • WeatherNext 2 का पूर्वानुमान डेटा Google Earth Engine और BigQuery में सार्वजनिक रूप से उपलब्ध है
    • इसे Earth Engine data catalog और BigQuery Analytics Hub के जरिए देखा जा सकता है
  • Google Cloud Vertex AI में early access प्रोग्राम के जरिए कस्टम मॉडल inference सुविधा दी जाती है
  • यह तकनीक Search, Gemini, Pixel Weather, Google Maps Platform के Weather API में इंटीग्रेट की गई है, और आगे चलकर Google Maps की weather information features में भी लागू की जाएगी

शोध से वास्तविक उपयोग तक

  • WeatherNext 2 research outcomes को वास्तविक अनुप्रयोगों तक बढ़ाने का एक उदाहरण है
    • Google इस तकनीक के जरिए दुनियाभर के शोधकर्ताओं, डेवलपर्स और व्यवसायों के लिए जटिल समस्याओं के समाधान में उपयोगी tools और data को खोल रहा है
  • आगे चलकर नए data sources के integration और बेहतर accessibility के जरिए मॉडल के प्रदर्शन को लगातार बेहतर बनाने की योजना है
  • Google geospatial AI research ecosystem को मजबूत करने के लिए Earth Engine, AlphaEarth Foundations, Earth AI आदि के साथ जुड़ाव बढ़ा रहा है

अतिरिक्त सामग्री

  • WeatherNext 2 से संबंधित paper (arXiv: 2506.10772) प्रकाशित किया गया है
  • developer documentation, Earth Engine data catalog, BigQuery query examples, Vertex AI early access registration page उपलब्ध हैं
  • संबंधित मॉडलों में GenCast (extreme weather prediction) और GraphCast (तेज वैश्विक पूर्वानुमान) भी शामिल हैं

1 टिप्पणियां

 
GN⁺ 2025-11-19
Hacker News टिप्पणियाँ
  • मैं इस विषय में काफ़ी गहराई से जुड़ा हुआ हूँ, और बाहरी लोगों के लिए दिलचस्प बात यह हो सकती है कि neuralgcm या WeatherNext 1 जैसे नए मॉडल सभी CRPS नाम के objective function से train किए जाते हैं
    यह तरीका सामान्य ML में लगभग इस्तेमाल नहीं होता, और मैंने इसे केवल weather forecasting में ही देखा है
    संक्षेप में, input में random noise जोड़ा जाता है, और सामान्य loss (जैसे L1) को minimize करते हुए साथ ही अलग-अलग noise initialization से बने दो outputs के बीच का अंतर maximize करने के लिए train किया जाता है
    सोचता हूँ कि क्या यह approach कभी पारंपरिक GenAI पर भी लागू होगी

    • क्या noise input में नहीं बल्कि model parameters में जोड़ा जाता है?
      इससे Variational Noise paper याद आता है
      अगर noise input में जोड़ा जाता है, तो यह DINO जैसी SSL technique के समान लगेगा
    • हाल की एक optimization problem में मैं जानबूझकर दो अलग outputs बनाना चाहता था, लेकिन कोई अच्छी heuristic नहीं मिली
      उसका GenAI से संबंध नहीं था, लेकिन लगता है कि यह CRPS तरीका मददगार होता
    • यह approach Variational Autoencoder की याद दिलाती है
    • यह L2 loss के बजाय ऐसा तरीका क्यों इस्तेमाल करता है, इसका उद्देश्य जानना चाहता हूँ
    • यह स्पष्ट होना चाहिए कि model भले ही historical data पर train होता है, लेकिन actual prediction के समय नए observations के साथ कई बार ensemble run किया जाता है
  • हाल में महसूस हुआ कि Google Search का local weather forecast काफ़ी हद तक कम सटीक हो गया है
    कुछ हफ़्तों से यह लगातार कह रहा था कि रात का तापमान शून्य से नीचे जाएगा, लेकिन वास्तव में ऐसा नहीं हुआ
    मेरा इलाक़ा prediction के लिए मुश्किल ज़रूर है, लेकिन Google के अलावा दूसरे sources कहीं ज़्यादा accurate थे
    सोच रहा हूँ कि क्या नए model का rollout पहले ही हो चुका है और उससे चीज़ें बिगड़ी हैं, या उल्टा जल्द सुधार आने वाला है
    यह भी जानना चाहता हूँ कि क्या कोई ऐसी site है जहाँ local level पर model-wise forecast performance compare की जा सके

    • Open-Meteo का free API उपयोगी है
      इसमें अलग-अलग models के forecast data को graph के रूप में visualize किया जा सकता है, और कई प्रमुख models शामिल हैं
      लेकिन WeatherNext अभी उसमें नहीं है
    • locality के हिसाब से model performance comparison बहुत बुनियादी feature जैसा लगता है, लेकिन वास्तव में लगभग कहीं नहीं मिलता। वजह जानना चाहता हूँ
  • घोषणा में speed और scenarios की संख्या में सुधार पर ज़ोर था, लेकिन accuracy improvement पर पर्याप्त चर्चा नहीं लगी
    “WeatherNext 2 is 8x faster and provides hourly resolution” अच्छा सुनाई देता है, लेकिन आख़िरकार एक user के रूप में मुझे तो सिर्फ़ एक accurate forecast चाहिए

    • अहम बात यह है कि इस product का end user आम लोग नहीं हैं
      CRPS score जैसे metrics experts के लिए हैं, और ये पारंपरिक ensemble models की under-dispersion problem को हल करने के लिए हैं
      ऐसे improvements आगे चलकर आम users को दिखने वाले deterministic forecast की accuracy बढ़ाने की बुनियाद बनते हैं
      संबंधित तकनीक WeatherBench में देखी जा सकती है
    • आम user के नज़रिए से देखें तो explanation कमज़ोर था
      weather forecasting का मूल कई दशकों से ensemble scenarios का विचार रहा है, और “बारिश की 70% संभावना” का मतलब है कि 100 scenarios में से 70 में बारिश होती है
      यानी एक अकेला ‘सही forecast’ होता ही नहीं
    • एक user के रूप में मैं uncertainty का spread भी देखना चाहता हूँ
      कई weather apps इसे visual रूप में अच्छी तरह दिखाते हैं
    • सबसे महत्वपूर्ण benchmark accuracy है, और इसकी तुलना मौजूदा physics-based models (GFS, ECMWF आदि) से होनी चाहिए
      ऐसे models विशाल HPC clusters पर चलते हैं, लेकिन central रूप से compute करके केवल results distribute करने होते हैं, इसलिए वे efficient हैं
    • यह historical data पर trained model है, लेकिन इसमें physics-based तत्व कम दिखते हैं
      high performance के लिए ज़रूरी physical grounding कहाँ है, यह जानना चाहता हूँ
  • Google का weather prediction engine पहले से ही बहुत शानदार है, और इस season में hurricane track prediction हैरतअंगेज़ रूप से accurate था
    दूसरी ओर अमेरिका सरकार का Global Forecasting System(GFS) लगातार खराब होता दिख रहा है
    संबंधित लेख: Ars Technica लिंक

    • “GFS खराब हो रहा है” से आपका मतलब ठीक-ठीक क्या है, यह जानना चाहता हूँ
  • paper पढ़ने पर यह स्पष्ट नहीं हुआ कि model को कितनी बार retrain करना पड़ता है
    अगर इसकी संरचना local distributions सीखती है, तो समय के साथ patterns बदलने पर periodic retraining ज़रूरी लगती है
    अगर हर हफ़्ते 3 दिन training करनी पड़े, तो वह व्यावहारिक रूप से cost issue बन सकता है

  • इससे द्वितीय विश्व युद्ध के दौर का एक किस्सा याद आता है
    कहा जाता है कि Kenneth Arrow ने पाया था कि long-range forecasts random guess से बेहतर नहीं थे, लेकिन उनके superior ने जवाब दिया, “हमें पता है कि ये उपयोगी नहीं हैं, फिर भी planning के लिए इनकी ज़रूरत है”

    • मैंने statistics class में सुना था कि वास्तव में अच्छा मौसम खराब मौसम की तुलना में बहुत अधिक होता है
      इसलिए अगर आप सिर्फ़ “बारिश नहीं होगी” कहें, तो भी 90% बार सही निकल सकते हैं
      विडंबना यह है कि पुराने weather forecasts की accuracy इससे भी कम थी
      आज के models सचमुच आश्चर्यजनक रूप से accurate हैं, और 10-day forecast भी लगभग सही निकलता है
    • एक व्याख्या यह भी है कि प्राचीन divination सिर्फ़ अंधविश्वास नहीं था, बल्कि जब निर्णय लेना मुश्किल हो तो random choice के ज़रिए कार्रवाई करवाने वाला decision-making tool था
    • Eisenhower की यह बात याद आती है: “plans बेकार हो सकते हैं, लेकिन planning की प्रक्रिया अनिवार्य है”
  • हाल में Google के default weather app की accuracy गिर गई है
    अक्सर 2~5 degree का अंतर रहा है
    HN पर सुझाया गया Weawow app आज़माया, नाम भले अजीब लगे लेकिन accuracy शानदार है
    अब तक इस्तेमाल किए गए apps में यह सबसे संतोषजनक लगा

  • अभी भी AI-based weather forecasting रोज़मर्रा की ज़िंदगी में कुछ दूर की चीज़ लगती है
    माता-पिता की पीढ़ी के TV weather report वाले समय से तुलना करें, तो महसूस होने वाली accuracy में बहुत बड़ा फ़र्क नहीं लगता
    forecast किए गए साफ़ दिन पर मूसलाधार बारिश हो जाती है, या बारिश का forecast होने पर भी पूरा दिन साफ़ निकल जाता है
    consumer के नज़रिए से तकनीकी प्रगति वास्तविक महसूस होने वाली reliability में नहीं बदलती दिखती

    • data मौजूद है: Our World in Data के अनुसार forecast accuracy लगातार बेहतर हो रही है
    • समस्या data की presentation में है
      उदाहरण के लिए Apple Weather में “rainy day” तब दिख सकता है जब दिन के किसी एक समय पर भी बारिश की संभावना अधिक हो
      वास्तव में हो सकता है कि केवल सुबह 5 बजे बारिश हो और बाकी दिन साफ़ हो
      users को data interpret कर पाना चाहिए, और अच्छा होगा अगर AI user की व्यक्तिगत रुचियों के अनुसार forecast को contextualize करे
    • forecasts लगातार बेहतर हो रहे हैं, लेकिन यह incremental evolution है, अचानक आई क्रांति नहीं
      उदाहरण के लिए Weathergraph में rainbow.ai का short-term precipitation forecast जोड़ा गया, और यह अब तक का सबसे accurate लगा
      radar data ख़ुद भी काफ़ी noisy होता है, और उसे साफ़ करने की प्रक्रिया भी पहले से एक ML model है
    • वास्तविकता में accuracy काफ़ी बढ़ी है
      30 साल पहले के 1-day forecast की quality आज के 4-day forecast के बराबर है
      हालाँकि हमने मौसम को बेहतर समझना शुरू नहीं किया है; यह मुख्यतः computing power में भारी बढ़ोतरी का परिणाम है
    • सामान्य weather forecast अभी भी परफ़ेक्ट नहीं हैं
  • मैं जानना चाहता था कि इस model को कहाँ इस्तेमाल किया जा सकता है
    मैं पुराने Dark Sky जैसी hyperlocal forecast service ढूँढ रहा हूँ

    • अब यह research result वास्तविक services में integrate किया जा चुका है
      WeatherNext 2 का forecast data Earth Engine और BigQuery में उपलब्ध है, और Vertex AI पर custom inference के लिए early access program भी चल रहा है
      इसके अलावा यह Search, Gemini, Pixel Weather, Google Maps Platform Weather API में भी लागू है
    • निजी तौर पर मुझे Windy app सबसे पसंद है
      इसमें अलग-अलग models के forecasts की तुलना की जा सकती है, और wind vector animation दृश्य रूप से बहुत दिलचस्प है
    • HRRR model भी बहुत बेहतरीन है
      यह हर 1 घंटे में update होता है, 15-minute resolution पर 18 घंटे और 1-hour resolution पर 48 घंटे का forecast देता है
      HRRR साइट
    • पुराना Weather Underground निजी weather stations का data integrate करता था
      IBM के अधिग्रहण के बाद उसमें बहुत बदलाव आया, लेकिन हो सकता है वह project अब भी किसी रूप में मौजूद हो
    • Google का आधिकारिक Weather API लिंक भी देखने लायक है
  • मैं जानना चाहता हूँ कि इस season का सबसे accurate hurricane forecast देने वाला model क्या यही वही model है जिसकी इस बार घोषणा की गई है
    संबंधित लेख: Ars Technica लिंक