10 पॉइंट द्वारा GN⁺ 2023-10-27 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • 8192 टोकन लंबाई को सपोर्ट करने वाला टेक्स्ट एम्बेडिंग मॉडल jina-embeddings-v2
  • OpenAI के text-embedding-ada-002 से प्रतिस्पर्धा करता है, और बेंचमार्क में classification/reranking/search/summarization आदि में बेहतर प्रदर्शन दिखाता है
  • इसे पूरी तरह से नए सिरे से बनाया गया है, और 8k context के साथ कई क्षेत्रों में उपयोग किया जा सकता है: कानूनी दस्तावेज़ विश्लेषण, चिकित्सा शोध, साहित्यिक विश्लेषण, वित्तीय पूर्वानुमान, conversational AI आदि
  • HuggingFace पर 2 मॉडल डाउनलोड के लिए उपलब्ध हैं
    • Base Model (0.27G): academic research या business analysis जैसे high-accuracy वाले intensive कार्यों के लिए डिज़ाइन किया गया
    • Small Model (0.07G): सीमित computing resources वाले mobile apps या devices जैसे lightweight applications के लिए बनाया गया

1 टिप्पणियां

 
GN⁺ 2023-10-27
Hacker News राय
  • Jina AI ने ओपन सोर्स 8k टेक्स्ट एम्बेडिंग मॉडल जारी किया है।
  • कुछ उपयोगकर्ताओं ने इस मॉडल के प्रदर्शन पर सवाल उठाए हैं और बताया है कि यह लीडरबोर्ड पर OpenAI embeddings और 14 अन्य योगदानों से नीचे रैंक करता है।
  • 8k context window एक नई सुविधा है, लेकिन खासकर 512 token सीमा को देखते हुए कुछ उपयोगकर्ता इसकी उपयोगिता पर सवाल उठाते हैं।
  • ज़्यादातर benchmarks छोटे documents को संभालते हैं, जबकि बड़े documents पर मॉडल के प्रदर्शन को लेकर संदेह है।
  • कुछ उपयोगकर्ताओं ने इस बात पर उत्साह जताया कि open source community, "Open"AI के साथ अंतर कम कर रही है।
  • नए मॉडल के embedding vectors, text-embedding-ada-002 के आधे आकार के हैं (768 बनाम 1536), जिससे database space बच सकता है और retrieval तेज़ हो सकता है।
  • 8k token embedding के use cases पर सवाल उठे हैं, और कुछ उपयोगकर्ताओं का सुझाव है कि यह RAG के लिए बहुत उपयोगी नहीं हो सकता।
  • एक उपयोगकर्ता ने onnx उपयोग के लिए मॉडल को quantize किया और transformers.js में file size 4 गुना घटा दिया।
  • इसकी तुलना OpenAI के मॉडल से की जा रही है, जो multilingual support देता है और अलग-अलग भाषाओं में एक ही अर्थ के लिए समान coordinates गणना करता है।
  • नया llm-embed-jina plugin, LLM tool में deploy किया गया है, जिससे नए Jina मॉडल तक पहुंच संभव है।
  • कुछ उपयोगकर्ता इस काम से प्रभावित हैं, लेकिन 8k embeddings का सबसे अच्छा उपयोग कैसे किया जाए इस पर सवाल उठाते हैं, और सुझाव देते हैं कि यह approximate similarity matching या plagiarism detection के लिए उपयोगी हो सकता है।
  • chip export restrictions और अमेरिका/चीन तनाव के कारण, Berlin और चीन में कार्यालय रखने वाली Jina AI की operations को लेकर चिंताएं हैं।