7 पॉइंट द्वारा GN⁺ 2026-04-01 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • TimesFM Google Research द्वारा विकसित टाइम-सीरीज़ forecasting के लिए एक large pretrained model है, जो decoder-only आर्किटेक्चर का उपयोग करता है
  • नवीनतम संस्करण 2.5 200M पैरामीटर, 16k context length, और अधिकतम 1k horizon forecast को सपोर्ट करता है
  • इसमें continuous quantile forecasting, covariate input (XReg), और Flax·PyTorch backend जैसी विभिन्न सुविधाएँ शामिल हैं
  • मॉडल Hugging Face के माध्यम से सार्वजनिक रूप से उपलब्ध है, और BigQuery में भी इंटीग्रेट किया गया है
  • यह टाइम-सीरीज़ डेटा forecasting के लिए एक general-purpose foundation model है, जो research और production दोनों में scalability और efficiency प्रदान करता है

TimesFM अवलोकन

  • TimesFM(Time Series Foundation Model) Google Research द्वारा विकसित टाइम-सीरीज़ forecasting के लिए एक pretrained model है
  • यह ICML 2024 पेपर “A decoder-only foundation model for time-series forecasting” पर आधारित है
  • मॉडल checkpoints Hugging Face collection के माध्यम से उपलब्ध हैं, और BigQuery में भी आधिकारिक रूप से इंटीग्रेट किए गए हैं
  • open version आधिकारिक Google product नहीं है

मॉडल संस्करण और प्रमुख अपडेट

  • नवीनतम संस्करण TimesFM 2.5 है; पुराने संस्करण (1.0, 2.0) v1 डायरेक्टरी में रखे गए हैं और timesfm==1.3.0 से इंस्टॉल किए जा सकते हैं
  • 15 सितंबर 2025 अपडेट

    • TimesFM 2.5 मॉडल जारी किया गया
    • पैरामीटर संख्या 200M तक घटाई गई (पहले के 500M की तुलना में आधे से भी कम)
    • context length 16k तक बढ़ाई गई (पहले 2048 थी)
    • continuous quantile forecast को अधिकतम 1k horizon तक सपोर्ट किया गया, जिसमें वैकल्पिक 30M quantile head शामिल है
    • frequency indicator हटा दिया गया
    • नए forecasting flags जोड़े गए
    • inference API अपग्रेड किया गया
    • भविष्य में जोड़े जाने वाले आइटम
      1. Flax version model सपोर्ट (तेज़ inference)
      2. covariate support की बहाली
      3. docstring, दस्तावेज़, notebooks को और बेहतर करना
  • 29 अक्टूबर 2025 अपडेट

    • XReg के माध्यम से covariate input support को TimesFM 2.5 में फिर से जोड़ा गया

इंस्टॉलेशन तरीका

  • GitHub repository को clone करें और uv का उपयोग करके virtual environment बनाएँ और package इंस्टॉल करें
    • torch, flax, xreg में से वैकल्पिक backend इंस्टॉल किए जा सकते हैं
    • OS और accelerator (CPU, GPU, TPU, Apple Silicon) के अनुसार PyTorch या JAX(Flax) चुना जा सकता है

कोड उदाहरण

  • PyTorch आधारित TimesFM 2.5 (200M पैरामीटर) मॉडल लोड करने का उदाहरण दिया गया है
    • timesfm.TimesFM_2p5_200M_torch.from_pretrained("google/timesfm-2.5-200m-pytorch") का उपयोग
    • ForecastConfig के माध्यम से input normalization (normalize_inputs), continuous quantile head का उपयोग, positive output force करना (infer_is_positive), quantile crossing fix (fix_quantile_crossing) जैसी सेटिंग्स संभव हैं
    • forecast() कॉल करने पर point forecast और quantile forecast दोनों परिणाम मिलते हैं
      • point_forecast.shape: (2, 12)
      • quantile_forecast.shape: (2, 12, 10) — mean और 10~90 quantile शामिल

1 टिप्पणियां

 
GN⁺ 2026-04-01
Hacker News की राय
  • time series model जैसा सामान्य कॉन्सेप्ट थोड़ा अजीब लगता है
    यह सवाल उठता है कि एक ही मॉडल इटली में अंडों की कीमत और वैश्विक inflation, दोनों का एक साथ भरोसेमंद पूर्वानुमान कैसे कर सकता है
    इसके अलावा, अगर वह prediction के आधार को समझा न सके, तो उसके नतीजों पर भरोसा करना मुश्किल लगता है

    • दरअसल ऐसे मॉडल अंडों की कीमत या inflation को सीधे predict नहीं करते, बल्कि time series data को trend·seasonality·residual में decompose करते हैं
      Middle East war जैसी non-seasonal घटनाओं का inflation पर असर मॉडल पकड़ नहीं पाता
    • मेरी समझ से synthetic training data कई domains में साझा होने वाले abstract time series patterns को पकड़ने में मदद करने के लिए इस्तेमाल किया जाता है
      paper के appendix 8 के अनुसार, synthetic data को linear trend, ARMA, sine·cosine seasonal patterns जैसे पारंपरिक statistical models से बनाकर train किया गया
      आखिरकार यह Transformer architecture है, इसलिए LLM की तरह input context के अनुसार problem-specific patterns ढूंढ लेता है
    • Google Ads में काम करते समय, ad campaign के goal तक पहुँचने की probability predict करने के लिए time series forecasting का इस्तेमाल किया था
      कई advertisers सिर्फ मौजूदा numbers से सीधी रेखा खींचकर भविष्यवाणी करते थे, लेकिन day-of-week·seasonality को शामिल न करने की वजह से वह inaccurate होती थी
      वहीं time series models काफी ज्यादा accurate थे, और पूरे campaign data पर training के बाद 95% confidence interval भी दे सकते थे
    • Benford’s law(Benford’s law) भी लागू किया जा सकता है
      sign और exponent धीरे-धीरे बदलते हैं, इसलिए उन्हें predict करके mantissa हिस्से का अनुमान Benford’s law से लगाया जा सकता है
    • approach के तौर पर
      • decomposition: Fourier transform के generalized form को ढूंढकर मूल factors को अलग करना
      • memorization: कई domains में बार-बार दिखने वाले patterns (जैसे power law) को सीखना
      • multitask: weather और power जैसे domains के बीच के संबंधों का उपयोग करना
  • title में (2024) जोड़ना अच्छा रहेगा
    यह पहले ही Google Research ब्लॉग में आ चुका है, इसलिए यह बिल्कुल नई खबर नहीं है

    • लेकिन 2025 के अंत में एक बड़ा update आया था
  • संबंधित blog post GitHub की TimesFM page पर देखी जा सकती है

    • शायद वे इस Google Research ब्लॉग पोस्ट को link करना चाहते थे
    • मुझे कुल GPU training time जानना है
      LLM की तुलना में यह काफी कम लगता है, इसलिए जानना है कि क्या individual researchers या university labs के स्तर पर भी इसे train किया जा सकता है
    • iOS Chrome में यह जमा की गई GitHub repository वाले ही same content के साथ खुलता है
  • जानकारी के लिए, इसी तरह के projects में Nixtla और Prophet हैं

  • एक सवाल था: “क्या इसे ELI5 स्तर पर समझाया जा सकता है? और यह कितने data points पढ़ सकता है?”

  • यह जानने की उत्सुकता है कि क्या time series बिना context के सिर्फ numbers के set के रूप में दी जाती है
    लगता है मॉडल data देखकर यह अंदाज़ा लगाता है कि यह किस category का है, जैसे stock price या search trend, और फिर उसी के अनुसार prediction देता है
    लेकिन training data में न होने वाली categories पर यह कमजोर हो सकता है
    व्यक्तिगत रूप से मुझे ARIMA जैसे simple models या theory-based models ज्यादा पसंद हैं

    • फिर भी, जैसे LLM लंबे token stream में अगला token predict करता है, वैसे ही यह मॉडल भी काम कर सकता है
      असली मुद्दा यह है कि architecture और training method कितनी अच्छी तरह generalize करते हैं
  • यह मॉडल कुछ महीने पहले से public था, तो जानना है कि क्या किसी ने वास्तव में इसके आधार पर कुछ बनाया भी है

  • अगर past solar radiation और weather forecast time series हों, तो क्या future time point के weather forecast का इस्तेमाल करके electricity price predict किया जा सकता है
    यानी क्या एक time series के समय X के data से दूसरी time series के समय X का prediction किया जा सकता है, या यह सिर्फ एक single time series के अंदर के patterns तक सीमित है

    • paper में कहा गया है कि focus forecasting पर था
      लेकिन अगर training data कम हो, तो यह सिर्फ “ऊपर दाईं ओर जाने” वाला pattern ही सीख सकता है, इसलिए इसकी सीमाएँ हो सकती हैं
  • मैं यह project मिस कर गया, क्या इससे जुड़ी कोई competition है
    time series और ML हमेशा मुश्किल लगे हैं, इसलिए खुद इसे आज़माना चाहता हूँ

    • संबंधित सामग्री के रूप में Datadog ब्लॉग, Moment project, arXiv paper की सिफारिश की गई
      एक सहकर्मी ने इस मॉडल से यह predict किया कि CEO Slack पर कब पोस्ट करेगा, और वह काफ़ी मज़ेदार था
    • Hugging Face का GIFT leaderboard पर भी Transformer-based models हैं
    • एक और project OpenTSLM है
    • TabPFN भी time series features को support करता है
  • व्यक्तिगत रूप से लगता है कि LLM + pandas + अपना experiment loop चलाकर इस मॉडल से बेहतर result निकाले जा सकते हैं

    • तो फिर खुद करके देखना चाहिए
      इसकी कोई तय सीमा नहीं है, और उल्टा यह दावा गलत होने की संभावना ज्यादा लगती है