- WeatherNext 2 एक AI-आधारित मॉडल है, जिसने वैश्विक मौसम पूर्वानुमान की सटीकता और दक्षता में बड़ा सुधार किया है
- यह एकल TPU पर 1 मिनट से कम समय में सैकड़ों मौसम परिदृश्य तैयार करता है और मौजूदा मॉडलों की तुलना में 8 गुना तेज पूर्वानुमान गति देता है
- नई Functional Generative Network(FGN) संरचना के जरिए यह भौतिक रूप से सुसंगत पूर्वानुमान बनाए रखता है और घंटेवार resolution तक सपोर्ट करता है
- पूर्वानुमान डेटा Earth Engine और BigQuery में उपलब्ध है, और Vertex AI के early access प्रोग्राम के जरिए कस्टम inference सुविधाएँ देता है
- यह तकनीक Search, Gemini, Pixel Weather, Google Maps Platform सहित Google की सेवाओं में मौसम सुविधाओं को अपग्रेड करती है
WeatherNext 2 का अवलोकन
- Google DeepMind और Google Research द्वारा संयुक्त रूप से विकसित WeatherNext 2 एक AI-आधारित मौसम पूर्वानुमान मॉडल है, जो पहले की तुलना में 8 गुना तेज गति और 1 घंटे के अंतराल वाला resolution प्रदान करता है
- एकल इनपुट से सैकड़ों संभावित मौसम परिदृश्य तैयार करता है
- पूर्वानुमान एकल TPU पर 1 मिनट से कम में पूरा हो जाता है, जबकि मौजूदा भौतिकी-आधारित supercomputer मॉडल को कई घंटे लगते हैं
- यह मॉडल तापमान, पवन वेग, आर्द्रता सहित 99.9% variables और forecast lead times (0~15 दिन) में पिछले मॉडल से बेहतर प्रदर्शन दिखाता है
- WeatherNext 2 पूरी पृथ्वी के लिए high-resolution पूर्वानुमान संभव बनाता है और मौसम एजेंसियों के निर्णय समर्थन में भी उपयोगी है
AI modeling के लिए नया दृष्टिकोण
- WeatherNext 2 Functional Generative Network(FGN) नामक एक नया AI modeling तरीका अपनाता है
- मॉडल संरचना में सीधे ‘noise’ inject करके यह सुनिश्चित किया जाता है कि पूर्वानुमान परिणाम भौतिक रूप से यथार्थवादी और आपस में जुड़े हुए बने रहें
- यह दृष्टिकोण ‘marginal’ और ‘joint’ दोनों तरह के पूर्वानुमान के लिए उपयोगी है
- marginal का मतलब अलग-अलग तत्वों से है, जैसे किसी विशेष स्थान का तापमान, ऊँचाई के अनुसार पवन वेग, आर्द्रता
- joint का मतलब कई तत्वों के संयोजन से बने बड़े मौसम तंत्र से है, जो heatwave क्षेत्रों या wind power generation के पूर्वानुमान जैसे जटिल विश्लेषण के लिए जरूरी है
- मॉडल केवल marginal डेटा पर ट्रेन होता है, लेकिन joint patterns को खुद सीखकर जटिल पूर्वानुमान कर सकता है
डेटा एक्सेस और उपयोग
- WeatherNext 2 का पूर्वानुमान डेटा Google Earth Engine और BigQuery में सार्वजनिक रूप से उपलब्ध है
- इसे Earth Engine data catalog और BigQuery Analytics Hub के जरिए देखा जा सकता है
- Google Cloud Vertex AI में early access प्रोग्राम के जरिए कस्टम मॉडल inference सुविधा दी जाती है
- यह तकनीक Search, Gemini, Pixel Weather, Google Maps Platform के Weather API में इंटीग्रेट की गई है, और आगे चलकर Google Maps की weather information features में भी लागू की जाएगी
शोध से वास्तविक उपयोग तक
- WeatherNext 2 research outcomes को वास्तविक अनुप्रयोगों तक बढ़ाने का एक उदाहरण है
- Google इस तकनीक के जरिए दुनियाभर के शोधकर्ताओं, डेवलपर्स और व्यवसायों के लिए जटिल समस्याओं के समाधान में उपयोगी tools और data को खोल रहा है
- आगे चलकर नए data sources के integration और बेहतर accessibility के जरिए मॉडल के प्रदर्शन को लगातार बेहतर बनाने की योजना है
- Google geospatial AI research ecosystem को मजबूत करने के लिए Earth Engine, AlphaEarth Foundations, Earth AI आदि के साथ जुड़ाव बढ़ा रहा है
अतिरिक्त सामग्री
- WeatherNext 2 से संबंधित paper (arXiv: 2506.10772) प्रकाशित किया गया है
- developer documentation, Earth Engine data catalog, BigQuery query examples, Vertex AI early access registration page उपलब्ध हैं
- संबंधित मॉडलों में GenCast (extreme weather prediction) और GraphCast (तेज वैश्विक पूर्वानुमान) भी शामिल हैं
1 टिप्पणियां
Hacker News टिप्पणियाँ
मैं इस विषय में काफ़ी गहराई से जुड़ा हुआ हूँ, और बाहरी लोगों के लिए दिलचस्प बात यह हो सकती है कि neuralgcm या WeatherNext 1 जैसे नए मॉडल सभी CRPS नाम के objective function से train किए जाते हैं
यह तरीका सामान्य ML में लगभग इस्तेमाल नहीं होता, और मैंने इसे केवल weather forecasting में ही देखा है
संक्षेप में, input में random noise जोड़ा जाता है, और सामान्य loss (जैसे L1) को minimize करते हुए साथ ही अलग-अलग noise initialization से बने दो outputs के बीच का अंतर maximize करने के लिए train किया जाता है
सोचता हूँ कि क्या यह approach कभी पारंपरिक GenAI पर भी लागू होगी
इससे Variational Noise paper याद आता है
अगर noise input में जोड़ा जाता है, तो यह DINO जैसी SSL technique के समान लगेगा
उसका GenAI से संबंध नहीं था, लेकिन लगता है कि यह CRPS तरीका मददगार होता
हाल में महसूस हुआ कि Google Search का local weather forecast काफ़ी हद तक कम सटीक हो गया है
कुछ हफ़्तों से यह लगातार कह रहा था कि रात का तापमान शून्य से नीचे जाएगा, लेकिन वास्तव में ऐसा नहीं हुआ
मेरा इलाक़ा prediction के लिए मुश्किल ज़रूर है, लेकिन Google के अलावा दूसरे sources कहीं ज़्यादा accurate थे
सोच रहा हूँ कि क्या नए model का rollout पहले ही हो चुका है और उससे चीज़ें बिगड़ी हैं, या उल्टा जल्द सुधार आने वाला है
यह भी जानना चाहता हूँ कि क्या कोई ऐसी site है जहाँ local level पर model-wise forecast performance compare की जा सके
इसमें अलग-अलग models के forecast data को graph के रूप में visualize किया जा सकता है, और कई प्रमुख models शामिल हैं
लेकिन WeatherNext अभी उसमें नहीं है
घोषणा में speed और scenarios की संख्या में सुधार पर ज़ोर था, लेकिन accuracy improvement पर पर्याप्त चर्चा नहीं लगी
“WeatherNext 2 is 8x faster and provides hourly resolution” अच्छा सुनाई देता है, लेकिन आख़िरकार एक user के रूप में मुझे तो सिर्फ़ एक accurate forecast चाहिए
CRPS score जैसे metrics experts के लिए हैं, और ये पारंपरिक ensemble models की under-dispersion problem को हल करने के लिए हैं
ऐसे improvements आगे चलकर आम users को दिखने वाले deterministic forecast की accuracy बढ़ाने की बुनियाद बनते हैं
संबंधित तकनीक WeatherBench में देखी जा सकती है
weather forecasting का मूल कई दशकों से ensemble scenarios का विचार रहा है, और “बारिश की 70% संभावना” का मतलब है कि 100 scenarios में से 70 में बारिश होती है
यानी एक अकेला ‘सही forecast’ होता ही नहीं
कई weather apps इसे visual रूप में अच्छी तरह दिखाते हैं
ऐसे models विशाल HPC clusters पर चलते हैं, लेकिन central रूप से compute करके केवल results distribute करने होते हैं, इसलिए वे efficient हैं
high performance के लिए ज़रूरी physical grounding कहाँ है, यह जानना चाहता हूँ
Google का weather prediction engine पहले से ही बहुत शानदार है, और इस season में hurricane track prediction हैरतअंगेज़ रूप से accurate था
दूसरी ओर अमेरिका सरकार का Global Forecasting System(GFS) लगातार खराब होता दिख रहा है
संबंधित लेख: Ars Technica लिंक
paper पढ़ने पर यह स्पष्ट नहीं हुआ कि model को कितनी बार retrain करना पड़ता है
अगर इसकी संरचना local distributions सीखती है, तो समय के साथ patterns बदलने पर periodic retraining ज़रूरी लगती है
अगर हर हफ़्ते 3 दिन training करनी पड़े, तो वह व्यावहारिक रूप से cost issue बन सकता है
इससे द्वितीय विश्व युद्ध के दौर का एक किस्सा याद आता है
कहा जाता है कि Kenneth Arrow ने पाया था कि long-range forecasts random guess से बेहतर नहीं थे, लेकिन उनके superior ने जवाब दिया, “हमें पता है कि ये उपयोगी नहीं हैं, फिर भी planning के लिए इनकी ज़रूरत है”
इसलिए अगर आप सिर्फ़ “बारिश नहीं होगी” कहें, तो भी 90% बार सही निकल सकते हैं
विडंबना यह है कि पुराने weather forecasts की accuracy इससे भी कम थी
आज के models सचमुच आश्चर्यजनक रूप से accurate हैं, और 10-day forecast भी लगभग सही निकलता है
हाल में Google के default weather app की accuracy गिर गई है
अक्सर 2~5 degree का अंतर रहा है
HN पर सुझाया गया Weawow app आज़माया, नाम भले अजीब लगे लेकिन accuracy शानदार है
अब तक इस्तेमाल किए गए apps में यह सबसे संतोषजनक लगा
अभी भी AI-based weather forecasting रोज़मर्रा की ज़िंदगी में कुछ दूर की चीज़ लगती है
माता-पिता की पीढ़ी के TV weather report वाले समय से तुलना करें, तो महसूस होने वाली accuracy में बहुत बड़ा फ़र्क नहीं लगता
forecast किए गए साफ़ दिन पर मूसलाधार बारिश हो जाती है, या बारिश का forecast होने पर भी पूरा दिन साफ़ निकल जाता है
consumer के नज़रिए से तकनीकी प्रगति वास्तविक महसूस होने वाली reliability में नहीं बदलती दिखती
उदाहरण के लिए Apple Weather में “rainy day” तब दिख सकता है जब दिन के किसी एक समय पर भी बारिश की संभावना अधिक हो
वास्तव में हो सकता है कि केवल सुबह 5 बजे बारिश हो और बाकी दिन साफ़ हो
users को data interpret कर पाना चाहिए, और अच्छा होगा अगर AI user की व्यक्तिगत रुचियों के अनुसार forecast को contextualize करे
उदाहरण के लिए Weathergraph में rainbow.ai का short-term precipitation forecast जोड़ा गया, और यह अब तक का सबसे accurate लगा
radar data ख़ुद भी काफ़ी noisy होता है, और उसे साफ़ करने की प्रक्रिया भी पहले से एक ML model है
30 साल पहले के 1-day forecast की quality आज के 4-day forecast के बराबर है
हालाँकि हमने मौसम को बेहतर समझना शुरू नहीं किया है; यह मुख्यतः computing power में भारी बढ़ोतरी का परिणाम है
मैं जानना चाहता था कि इस model को कहाँ इस्तेमाल किया जा सकता है
मैं पुराने Dark Sky जैसी hyperlocal forecast service ढूँढ रहा हूँ
WeatherNext 2 का forecast data Earth Engine और BigQuery में उपलब्ध है, और Vertex AI पर custom inference के लिए early access program भी चल रहा है
इसके अलावा यह Search, Gemini, Pixel Weather, Google Maps Platform Weather API में भी लागू है
इसमें अलग-अलग models के forecasts की तुलना की जा सकती है, और wind vector animation दृश्य रूप से बहुत दिलचस्प है
यह हर 1 घंटे में update होता है, 15-minute resolution पर 18 घंटे और 1-hour resolution पर 48 घंटे का forecast देता है
HRRR साइट
IBM के अधिग्रहण के बाद उसमें बहुत बदलाव आया, लेकिन हो सकता है वह project अब भी किसी रूप में मौजूद हो
मैं जानना चाहता हूँ कि इस season का सबसे accurate hurricane forecast देने वाला model क्या यही वही model है जिसकी इस बार घोषणा की गई है
संबंधित लेख: Ars Technica लिंक