7 पॉइंट द्वारा xguru 2023-07-03 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • DeepMind के Flamingo मॉडल का open source इम्प्लीमेंटेशन
  • 3B, 4B, 9B मॉडल जारी किए गए
    • MPT-1B/7B और RedPajama-3B आधारित
  • उसी Flamingo मॉडल के प्रदर्शन का 80% से अधिक हासिल
  • ट्रेनिंग और evaluation code में सुधार
    • Fully Sharded Data Parallel (FSDP) सपोर्ट
    • evaluation suite में नए datasets (TextVQA, VizWiz, HatefulMemes, Flickr30k) जोड़े गए