nanoGPT - मध्यम आकार के GPT को सबसे तेज़ी से train/fine-tune करने के लिए open source
(github.com/karpathy)- Tesla के पूर्व AI हेड Andrej Karpathy द्वारा minGPT को फिर से लिखकर बनाया गया कोड
- पढ़ने में आसान और साधारण कोड लिखना लक्ष्य
- लगभग 300 लाइनों का
train.py - लगभग 300 लाइनों का
model.py
- लगभग 300 लाइनों का
- OpenWebText dataset पर GPT-2 को पुनःनिर्मित करने का काम जारी
अभी कोई टिप्पणी नहीं है.