- OpenAI GPT-4o का उपयोग करके यथार्थवादी datasets को इंटरैक्टिव तरीके से जनरेट करने वाला, और preview·CSV/SQL export·Metabase integration तक एक ही जगह पर सपोर्ट देने वाला open source टूल
- इंटरैक्टिव prompt builder के साथ business type, schema, row count आदि को सहज रूप से सेट किया जा सकता है
- रीयल-टाइम browser preview सपोर्ट
- CSV (single file या multi-table Zip file) या SQL Insert statements के रूप में export संभव
- one-click से Metabase चलाकर डेटा को explore किया जा सकता है
- टेक स्टैक: Next.js + Tailwind CSS + ShadCN UI + OpenAI API + Metabase
- सिर्फ preview/spec generation के समय ही OpenAI API (लगभग $0.05) का उपयोग, जबकि data download/analysis पूरी तरह local Faker से मुफ्त में जनरेट — इससे data privacy और cost, दोनों सुनिश्चित होते हैं
- dataset preview के समय OpenAI का उपयोग करके चुने गए business type और parameters के लिए विस्तृत data spec (schema, business rules, event logic) तैयार किया जाता है
- सभी वास्तविक data rows, LLM द्वारा जनरेट किए गए spec के आधार पर Faker का उपयोग करके लोकल में जनरेट की जाती हैं
- डेटा डाउनलोड या export करते समय OpenAI को फिर से कॉल करने की जरूरत नहीं होती
- Schema options
- One Big Table (OBT): सभी संबंधित columns को शामिल करने वाली एक denormalized single table
- Star Schema: उन्नत analytics के लिए कई tables (fact + dimension). इसकी संरचना LLM spec के अनुसार तय होती है, और generator सभी tables को लोकल में आउटपुट करता है
1 टिप्पणियां
यह व्यावहारिक काम में काफ़ी उपयोगी लगेगा। लगता है कि लागत के पहलू पर भी बारीकी से विचार किया गया है।