• Apple M1/M2 और consumer nVidia GPU पर LLama2-70B जैसे models को fine-tune करना
  • quantization का उपयोग करने के बजाय, forward/backward pass दोनों में model के कुछ हिस्सों को SSD या main memory में offload करने का तरीका
  • मौजूदा version updates को LoRA का उपयोग करके छोटे parameter set तक सीमित करता है
    • पहला version full fine-tuning भी कर सकता था, लेकिन अब हटा दिया गया है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.