12 पॉइंट द्वारा xguru 2024-06-20 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • विभिन्न स्रोतों और फ़ॉर्मैट से डेटा extract, prepare और organize करने के लिए डिज़ाइन किया गया Python-आधारित ETL
    • structured और unstructured, दोनों तरह की files के साथ काम कर सकता है (CSV, Parquet, PDF, Word, HTML आदि)
  • इसका लक्ष्य data scientist और data engineer, दोनों को एक intuitive low-code interface के ज़रिए आसानी से pipeline विकसित करने में मदद करना है, साथ ही ऐसा Python code जनरेट करना है जिसे कहीं भी deploy किया जा सके
    • GUI के ज़रिए data pipeline डिज़ाइन करें और on-premise/cloud कहीं भी deploy किए जा सकने वाले native Python code जनरेट करें
  • files से database तक data integration, data science और LLM-आधारित systems के लिए data extraction और preparation, तथा API retrieval और enrichment में बेहतरीन प्रदर्शन

1 टिप्पणियां

 
xguru 2024-06-20
Hacker News राय
  • Amphi संरचित और असंरचित डेटा के लिए एक low-code ETL टूल है, जो file integration, data preparation, data migration और AI कार्यों के लिए data pipeline बनाने में उपयोगी है। यह Python code जनरेट करता है, इसलिए इसे कहीं भी deploy किया जा सकता है.
  • non-technical लोगों के लिए data work आसान बनाना हमेशा अच्छी बात नहीं होती। अगर Python और SQL लिखना मुश्किल लगता है, तो कोई और काम करने पर विचार करना बेहतर हो सकता है.
  • शीर्षक बदलना चाहिए। यह open source नहीं है, बल्कि Elastic License v2 लाइसेंस है.
  • यह open source नहीं है। शीर्षक भ्रामक है.
  • जो लोग ETL संक्षेप नहीं जानते, उनके लिए वेबसाइट पर उसका विवरण जोड़ना अच्छा होगा.
  • open source Python ETL टूल्स में dlthub.com और hub.meltano.com बेहतर विकल्प हैं। मैं वास्तव में Meltano इस्तेमाल कर रहा हूँ और उससे संतुष्ट हूँ.
  • जिज्ञासा है कि क्या Amphi, pandas जैसे rapidsai dask_cudf framework को support करता है.
  • विचार अच्छा है, लेकिन documentation में high-level abstraction गलत है। data pipeline में table की तरह व्यवहार करने वाली चीज़ों को परिभाषित कर पाना और उन पर transformations लागू कर पाना संभव होना चाहिए। यह free tool है, यह सराहनीय है.
  • मैं Dagster से संतुष्ट हूँ, लेकिन Amphi भी दिलचस्प लग रहा है.
  • जिज्ञासा है कि Amphi जैसे टूल की शुरुआत कैसे हुई। पहले से कई open source Python ETL टूल मौजूद हैं, तो जानना चाहता हूँ कि क्या यह किसी खास समस्या को हल करने के लिए बनाया गया था, या फिर यह एक passion project है.