- टेबल (structured) डेटा के लिए विशेष Foundation Model, जो scikit-learn शैली के
fit/predict इंटरफ़ेस के साथ classification और regression कार्य सीधे चला सकता है
- बेस मॉडल TabPFN-2.6 को पूरी तरह synthetic डेटा पर train किया गया है, और पहली बार उपयोग के समय checkpoint अपने-आप डाउनलोड हो जाता है, इसलिए अलग training pipeline सेटअप की ज़रूरत नहीं है
- डेटा preprocessing की भी ज़रूरत नहीं: scaling, one-hot encoding आदि लागू किए बिना मूल डेटा को ज्यों का त्यों इनपुट करना चाहिए, और missing values को भी यह स्वयं संभाल सकता है
- GPU की सिफारिश की जाती है (~8GB VRAM या अधिक), और CPU पर लगभग 1,000 sample से कम ही चलाया जा सकता है; GPU न होने वाले environment के लिए TabPFN Client (cloud inference) भी उपलब्ध है
- batch prediction अनिवार्य है: हर individual sample पर
predict कॉल करने से training set हर बार फिर से recompute होता है, इसलिए एक single call की तुलना में लगभग 100 गुना धीमा — test set को 1,000 के batch में विभाजित करने की सिफारिश की जाती है
- सर्वोत्तम performance रेंज 100,000 sample और 2,000 feature से कम है; 50,000~100,000 sample के लिए
ignore_pretraining_limits=True सेटिंग, और 100,000 से अधिक पर Large Datasets Guide लागू करें
- TabPFN Extensions के साथ SHAP व्याख्या, outlier detection, synthetic डेटा generation, embedding extraction, hyperparameter optimization, Post-Hoc ensemble जैसी विस्तारित सुविधाएँ मिलती हैं
- HuggingFace पर कई specialized checkpoint उपलब्ध हैं: बड़े feature सेट (अधिकतम 1,000), बड़े sample सेट (30K+), छोटे sample सेट (3K से कम), और real डेटा fine-tuning version आदि
- Enterprise Edition में distillation engine आधारित low-latency inference, अधिकतम 10 million rows का समर्थन, और commercial license उपलब्ध है
- बिना कोड के उपयोग के लिए अलग से TabPFN UX (no-code graphical interface) भी उपलब्ध है
- कोड Prior Labs License (Apache 2.0 + attribution requirement) के तहत है, और TabPFN-2.5/2.6 model weights non-commercial license के तहत हैं
अभी कोई टिप्पणी नहीं है.