TimesFM - Google का 200M पैरामीटर, 16k context टाइम-सीरीज़ फाउंडेशन मॉडल
(github.com/google-research)- TimesFM Google Research द्वारा विकसित टाइम-सीरीज़ forecasting के लिए एक large pretrained model है, जो decoder-only आर्किटेक्चर का उपयोग करता है
- नवीनतम संस्करण 2.5 200M पैरामीटर, 16k context length, और अधिकतम 1k horizon forecast को सपोर्ट करता है
- इसमें continuous quantile forecasting, covariate input (XReg), और Flax·PyTorch backend जैसी विभिन्न सुविधाएँ शामिल हैं
- मॉडल Hugging Face के माध्यम से सार्वजनिक रूप से उपलब्ध है, और BigQuery में भी इंटीग्रेट किया गया है
- यह टाइम-सीरीज़ डेटा forecasting के लिए एक general-purpose foundation model है, जो research और production दोनों में scalability और efficiency प्रदान करता है
TimesFM अवलोकन
- TimesFM(Time Series Foundation Model) Google Research द्वारा विकसित टाइम-सीरीज़ forecasting के लिए एक pretrained model है
- यह ICML 2024 पेपर “A decoder-only foundation model for time-series forecasting” पर आधारित है
- मॉडल checkpoints Hugging Face collection के माध्यम से उपलब्ध हैं, और BigQuery में भी आधिकारिक रूप से इंटीग्रेट किए गए हैं
- open version आधिकारिक Google product नहीं है
मॉडल संस्करण और प्रमुख अपडेट
- नवीनतम संस्करण TimesFM 2.5 है; पुराने संस्करण (1.0, 2.0)
v1डायरेक्टरी में रखे गए हैं औरtimesfm==1.3.0से इंस्टॉल किए जा सकते हैं -
15 सितंबर 2025 अपडेट
- TimesFM 2.5 मॉडल जारी किया गया
- पैरामीटर संख्या 200M तक घटाई गई (पहले के 500M की तुलना में आधे से भी कम)
- context length 16k तक बढ़ाई गई (पहले 2048 थी)
- continuous quantile forecast को अधिकतम 1k horizon तक सपोर्ट किया गया, जिसमें वैकल्पिक 30M quantile head शामिल है
frequencyindicator हटा दिया गया- नए forecasting flags जोड़े गए
- inference API अपग्रेड किया गया
- भविष्य में जोड़े जाने वाले आइटम
- Flax version model सपोर्ट (तेज़ inference)
- covariate support की बहाली
- docstring, दस्तावेज़, notebooks को और बेहतर करना
-
29 अक्टूबर 2025 अपडेट
- XReg के माध्यम से covariate input support को TimesFM 2.5 में फिर से जोड़ा गया
इंस्टॉलेशन तरीका
- GitHub repository को clone करें और
uvका उपयोग करके virtual environment बनाएँ और package इंस्टॉल करेंtorch,flax,xregमें से वैकल्पिक backend इंस्टॉल किए जा सकते हैं- OS और accelerator (CPU, GPU, TPU, Apple Silicon) के अनुसार PyTorch या JAX(Flax) चुना जा सकता है
कोड उदाहरण
- PyTorch आधारित TimesFM 2.5 (200M पैरामीटर) मॉडल लोड करने का उदाहरण दिया गया है
timesfm.TimesFM_2p5_200M_torch.from_pretrained("google/timesfm-2.5-200m-pytorch")का उपयोगForecastConfigके माध्यम से input normalization (normalize_inputs), continuous quantile head का उपयोग, positive output force करना (infer_is_positive), quantile crossing fix (fix_quantile_crossing) जैसी सेटिंग्स संभव हैंforecast()कॉल करने पर point forecast और quantile forecast दोनों परिणाम मिलते हैंpoint_forecast.shape: (2, 12)quantile_forecast.shape: (2, 12, 10) — mean और 10~90 quantile शामिल
1 टिप्पणियां
Hacker News की राय
time series model जैसा सामान्य कॉन्सेप्ट थोड़ा अजीब लगता है
यह सवाल उठता है कि एक ही मॉडल इटली में अंडों की कीमत और वैश्विक inflation, दोनों का एक साथ भरोसेमंद पूर्वानुमान कैसे कर सकता है
इसके अलावा, अगर वह prediction के आधार को समझा न सके, तो उसके नतीजों पर भरोसा करना मुश्किल लगता है
Middle East war जैसी non-seasonal घटनाओं का inflation पर असर मॉडल पकड़ नहीं पाता
paper के appendix 8 के अनुसार, synthetic data को linear trend, ARMA, sine·cosine seasonal patterns जैसे पारंपरिक statistical models से बनाकर train किया गया
आखिरकार यह Transformer architecture है, इसलिए LLM की तरह input context के अनुसार problem-specific patterns ढूंढ लेता है
कई advertisers सिर्फ मौजूदा numbers से सीधी रेखा खींचकर भविष्यवाणी करते थे, लेकिन day-of-week·seasonality को शामिल न करने की वजह से वह inaccurate होती थी
वहीं time series models काफी ज्यादा accurate थे, और पूरे campaign data पर training के बाद 95% confidence interval भी दे सकते थे
sign और exponent धीरे-धीरे बदलते हैं, इसलिए उन्हें predict करके mantissa हिस्से का अनुमान Benford’s law से लगाया जा सकता है
title में (2024) जोड़ना अच्छा रहेगा
यह पहले ही Google Research ब्लॉग में आ चुका है, इसलिए यह बिल्कुल नई खबर नहीं है
संबंधित blog post GitHub की TimesFM page पर देखी जा सकती है
LLM की तुलना में यह काफी कम लगता है, इसलिए जानना है कि क्या individual researchers या university labs के स्तर पर भी इसे train किया जा सकता है
जानकारी के लिए, इसी तरह के projects में Nixtla और Prophet हैं
एक सवाल था: “क्या इसे ELI5 स्तर पर समझाया जा सकता है? और यह कितने data points पढ़ सकता है?”
यह जानने की उत्सुकता है कि क्या time series बिना context के सिर्फ numbers के set के रूप में दी जाती है
लगता है मॉडल data देखकर यह अंदाज़ा लगाता है कि यह किस category का है, जैसे stock price या search trend, और फिर उसी के अनुसार prediction देता है
लेकिन training data में न होने वाली categories पर यह कमजोर हो सकता है
व्यक्तिगत रूप से मुझे ARIMA जैसे simple models या theory-based models ज्यादा पसंद हैं
असली मुद्दा यह है कि architecture और training method कितनी अच्छी तरह generalize करते हैं
यह मॉडल कुछ महीने पहले से public था, तो जानना है कि क्या किसी ने वास्तव में इसके आधार पर कुछ बनाया भी है
अगर past solar radiation और weather forecast time series हों, तो क्या future time point के weather forecast का इस्तेमाल करके electricity price predict किया जा सकता है
यानी क्या एक time series के समय X के data से दूसरी time series के समय X का prediction किया जा सकता है, या यह सिर्फ एक single time series के अंदर के patterns तक सीमित है
लेकिन अगर training data कम हो, तो यह सिर्फ “ऊपर दाईं ओर जाने” वाला pattern ही सीख सकता है, इसलिए इसकी सीमाएँ हो सकती हैं
मैं यह project मिस कर गया, क्या इससे जुड़ी कोई competition है
time series और ML हमेशा मुश्किल लगे हैं, इसलिए खुद इसे आज़माना चाहता हूँ
एक सहकर्मी ने इस मॉडल से यह predict किया कि CEO Slack पर कब पोस्ट करेगा, और वह काफ़ी मज़ेदार था
व्यक्तिगत रूप से लगता है कि LLM + pandas + अपना experiment loop चलाकर इस मॉडल से बेहतर result निकाले जा सकते हैं
इसकी कोई तय सीमा नहीं है, और उल्टा यह दावा गलत होने की संभावना ज्यादा लगती है