- Snowflake के AI/ML strategy head Ahmad Khan द्वारा प्रस्तुत बातें
'Unstructured' data के उपयोग से revenue generation
- अधिकांश enterprise data का 80% से अधिक हिस्सा Word documents, images, audio/video files जैसे 'unstructured data' में होता है
- लेकिन अधिकांश कंपनियां इस जानकारी का लगभग उपयोग ही नहीं करतीं, जिसका मतलब है कि business decisions लेते समय वे उपलब्ध data के 20% से भी कम हिस्से का उपयोग कर रही हैं
- अगर इस unstructured data को large language models के साथ रखा जाए और प्रभावी chatbot बनाए जाएं, तो यह अभी कम इस्तेमाल हो रही विशाल मात्रा की जानकारी की व्याख्या और विश्लेषण करने में मदद कर सकता है
- इन कंपनियों के संबंधित specific industries के लिए उपयुक्त models बनाने की संभावनाएं असीमित हैं
Privacy और security
- कंपनियों के बीच यह चिंता बढ़ रही है कि उनके data का उपयोग ऐसे models को train करने में किया जा सकता है जिन्हें प्रतिद्वंद्वियों सहित दूसरी कंपनियां भी इस्तेमाल कर सकें
- इसके परिणामस्वरूप कंपनियां अक्सर बेहतर security देने वाले कमतर products से समझौता कर लेती हैं, जिससे अधिक सुरक्षित products के लिए market बनता है
- उदाहरण के लिए, Llama 2 सबसे उच्च-प्रदर्शन वाला large language model नहीं है, फिर भी ग्राहक Chat GPT जैसे कम नियंत्रित models के बजाय Llama 2 चुनते हैं
- कई कंपनियां अपने data की uniqueness को अपनी ताकत मानती हैं, इसलिए वे ऐसी स्थिति से बचना चाहती हैं जिसमें data सार्वजनिक internet पर उजागर हो जाए
बेहतरीन user experience देकर competitive edge हासिल करना
- startup बड़े उद्यमों के scale के खिलाफ प्रतिस्पर्धा कैसे कर सकते हैं?
- सुझाव है कि आकर्षक user interface बनाने सहित आनंददायक user experience तैयार करने पर ध्यान दिया जाए
- Snowflake ने यही approach अपनाई
- खासकर इसलिए कि उसकी अधिकांश सेवाएं Amazon Web Services जैसे cloud providers से प्रतिस्पर्धा नहीं कर सकतीं, इसलिए उसने ऐसे उत्कृष्ट user experience बनाने पर ध्यान दिया जो ऊंची कीमत को उचित ठहरा सके
Vertical पर फोकस
- David बनाम Goliath की तरह जीतने का एक और तरीका यह है कि general-purpose applications के बजाय manufacturing, finance, healthcare, entertainment जैसे specific industries पर ध्यान दिया जाए
- उन्होंने सलाह दी, "पहले समझिए कि उस उद्योग की कंपनियां क्या खोज रही हैं, फिर उन जरूरतों को पूरा करने वाली सेवाएं दीजिए"
- उदाहरण के लिए, Google के healthcare large language model विकसित करने की संभावना अधिक है, लेकिन संभव है कि वह इसे खास तौर पर गहराई से न संभाले, इसलिए इससे छोटी कंपनियों को ऐसे model बनाने का अवसर मिल सकता है
Data attribution की मांग लगातार बढ़ रही है
- copyrighted materials को track कर मूल creators को भुगतान करने वाले नए models की संभावना है, ताकि उन्हें और सामग्री विकसित करने की प्रेरणा मिले
- Khan ने कई ऐसे उदाहरण दिए जहां कानूनी कारणों से open source models का उपयोग नहीं किया जा सकता, और image generation के लिए open source model का उपयोग नहीं करना चाहने वाले एक फिल्म studio का उदाहरण दिया
- यह studio licensing और fees चुकाकर Getty Images के data पर trained model का उपयोग करता है
- आगे चलकर attribution datasets का उपयोग करने वाले ऐसे समान models के लिए market और बढ़ेगा
अभी कोई टिप्पणी नहीं है.