• "Effective Long-Context Scaling of Foundation Models" नामक पेपर के माध्यम से LLaMA2 Long मॉडल जारी किया
  • context window की लंबाई 32K(32,768) टोकन तक सपोर्ट करती है
  • 70B वर्ज़न पहले ही long-context task संग्रहों में gpt-3.5-turbo-16k के कुल प्रदर्शन को पार कर चुका है
  • मौजूदा मॉडल आर्किटेक्चर को बनाए रखते हुए, positional encoding में RoPE(Rotary Positional Embedding) लागू करके कम जानकारी के साथ बेहतर responses उत्पन्न किए गए

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.