- Google Research द्वारा विकसित टाइम-सीरीज़ forecasting के लिए foundation model
- 100 अरब वास्तविक टाइम-सीरीज़ data points पर pre-train किया गया
- विभिन्न सार्वजनिक benchmark पर उत्कृष्ट zero-shot performance दिखाता है
- अलग-अलग domain और time granularity वाले datasets पर लागू किया जा सकता है
- टाइम-सीरीज़ forecasting का उपयोग retail, finance, manufacturing, healthcare, natural sciences सहित कई क्षेत्रों में व्यापक रूप से होता है
- उदाहरण के लिए, retail में demand forecasting की accuracy बेहतर होने से inventory cost घटाने और revenue बढ़ाने में मदद मिलती है
- deep learning models का उभार
- कई settings में बेहतर performance साबित करने वाले deep learning models का टाइम-सीरीज़ forecasting में व्यापक उपयोग हो रहा है
- M5 competition में भी deep learning models ने अच्छा प्रदर्शन किया
- large language models की प्रगति
- translation, retrieval-based generation, code completion जैसी natural language processing tasks में उपयोग होने वाले large language models तेज़ी से आगे बढ़ रहे हैं
- ये बड़े पैमाने के text data पर train होकर language patterns पहचानने की क्षमता रखते हैं
- retrieval के साथ मिलकर ये current events पर सवालों के जवाब देने और उनका सारांश बनाने के लिए शक्तिशाली zero-shot tools के रूप में उपयोग होते हैं
- deep learning-आधारित forecasting models की सीमाएँ
- पारंपरिक तरीकों से बेहतर performance होने के बावजूद training और inference cost घटाना कठिन है
- नए टाइम-सीरीज़ data पर model को test करने से पहले लंबा training और validation cycle चाहिए होता है
- TimesFM टाइम-सीरीज़ forecasting के लिए decoder-only foundation model है
- 100 अरब वास्तविक टाइम-सीरीज़ data पर pre-train किया गया एक single forecasting model
- इसमें नवीनतम large language models की तुलना में बहुत कम, 20 लाख parameters हैं
- विभिन्न domains और time granularities वाले datasets पर zero-shot में state-of-the-art supervised approaches के क़रीब performance दिखाता है
- बिना अतिरिक्त training के पहले कभी न देखे गए टाइम-सीरीज़ data पर तुरंत उपयुक्त forecasts देता है
- इससे users retail demand planning जैसे वास्तविक downstream tasks के लिए forecasting बेहतर करने पर ध्यान दे सकते हैं
- शोधपत्र: "A decoder-only foundation model for time-series forecasting", ICML 2024 में प्रस्तुत किया जाएगा
GN⁺ की राय
- यह एक आशाजनक नया टाइम-सीरीज़ forecasting model लगता है, लेकिन अभी इसे विभिन्न वास्तविक use cases में और validate करने की ज़रूरत दिखती है। खासकर probabilistic forecasting का अभी समर्थन न होना व्यावहारिकता के लिहाज़ से कमी है
- input में दिया जाने वाला frequency value वास्तविक टाइम-सीरीज़ data की frequency को दर्शाए बिना मनमाने ढंग से adjust किया जा सकता है, यह दिलचस्प है, लेकिन कौन-सा value सबसे अच्छा होगा, यह हर data और use case के अनुसार प्रयोग करके देखना होगा
- पहला सार्वजनिक checkpoint univariate पर केंद्रित है, इसलिए multivariate forecasting सक्षम version की भी उम्मीद है। multivariate time-series forecasting benchmark datasets पर performance comparison भी ज़रूरी लगता है
- इस model को अपनाने पर forecast किए जाने वाले टाइम-सीरीज़ की विशेषताओं (length, distribution, seasonality, frequency आदि) और आवश्यक forecast horizon के अनुसार model चुनने व tune करने में सक्षम विशेषज्ञ कर्मियों की ज़रूरत होगी। end-to-end inference API उपलब्ध होने से उपयोग आसान लगता है, लेकिन black-box model की सीमाओं पर भी विचार करना चाहिए
- इसी तरह की अन्य टाइम-सीरीज़ forecasting libraries में Meta का Kats, GluonTS, Darts, sktime आदि शामिल हैं। प्रत्येक library की विशेषताओं, फ़ायदे और कमियों की तुलना करने के बाद वास्तविक data के लिए सबसे उपयुक्त model चुनना बेहतर होगा
अभी कोई टिप्पणी नहीं है.