22 पॉइंट द्वारा sigridjineth 2025-01-06 | 4 टिप्पणियां | WhatsApp पर शेयर करें

यह एक ब्लॉग पोस्ट है जिसमें कोरियाई के लिए सबसे बेहतर RAG-विशेष embedding model BGE-M3 को, Huggingface द्वारा दिए गए Python implementation से आगे बढ़कर, TensorFlow/Keras का उपयोग करते हुए enterprise environment में बड़े पैमाने पर serving के लिए उपयुक्त रूप में फिर से इम्प्लीमेंट किया गया है.

  1. enterprise serving समर्थन
  • Java/Scala-आधारित Hadoop-Spark environment में बड़े पैमाने पर distributed processing संभव
  • Kotlin/Spring Boot के माध्यम से high-performance server implementation
  • TensorFlow Serving के माध्यम से बड़े production environment का समर्थन
  • TensorFlow Lite के माध्यम से mobile/embedded environment का समर्थन
  1. model structure का सरलीकरण
  • केवल Dense Layer और LayerNorm से core structure implement
  • जटिल Python dependency हटाई गई
  • हल्के structure से high throughput सुनिश्चित
  1. implementation की विशेषताएं
  • Word/Position/Token Type embedding को basic Dense Layer से implement
  • 24 Transformer block को pure TensorFlow operations से निर्मित
  • Multi-Head Self-Attention को custom implement कर performance optimization
  1. वास्तविक उपयोग के उदाहरण
  • बड़े Hadoop environment में distributed embedding processing
  • Spring Boot-आधारित federated learning और RAG service
  • Apple Neural Engine का उपयोग कर mobile inference
  • enterprise-grade TensorFlow Serving deployment

लेख में समझाया गया implementation approach Python निर्भरता हटाकर केवल TensorFlow की native capabilities का उपयोग करता है, और इसकी खासियत यह है कि यह बड़े enterprise environment में stable service को संभव बनाता है.

4 टिप्पणियां

 
sigridjineth 2025-01-07

https://github.com/sionic-ai/BGE-M3-Model-Converter
पूरा कोड सार्वजनिक कर दिया गया है.

 
aer0700 2025-01-07

लेख खुद इतना मुश्किल नहीं है, लेकिन विवरण के साथ दिए गए कोड कुछ हद तक अधूरे हैं, इसलिए अगर उसी तरीके से इम्प्लीमेंट किया गया पूरा कोड साझा किया गया होता तो और बेहतर होता।

 
sigridjineth 2025-01-07

https://github.com/sionic-ai/BGE-M3-Model-Converter
पूरे कोड को सार्वजनिक कर दिया गया है।

 
aer0700 2025-01-09

धन्यवाद
इसे धीरे-धीरे फिर से देखना पड़ेगा, हाहा