- Yann LeCun आदि द्वारा 1989 में प्रकाशित "Backpropagation Applied to Handwritten Zip Code Recognition" पेपर के ऐतिहासिक महत्व पर एक लेख। इस पेपर को backpropagation का उपयोग करके न्यूरल नेटवर्क को end-to-end train करने वाले सबसे शुरुआती व्यावहारिक अनुप्रयोगों में से एक माना जाता है.
- लेखक ने PyTorch जैसे आधुनिक tools का उपयोग करके पेपर के काम को reproduce करने की कोशिश की, और उल्लेख किया कि मूल नेटवर्क को Bottou और LeCun 1988 के backpropagation simulator SN (जिसका बाद में नाम Lush रखा गया) का उपयोग करते हुए Lisp में implement किया गया था.
- मूल नेटवर्क को SUN-4/260 workstation पर 3 दिनों तक train किया गया था, लेकिन लेखक द्वारा MacBook Air (M1) CPU का उपयोग करके किया गया reproduction लगभग 90 सेकंड में पूरा हो गया.
- लेखक ने Adam optimizer का उपयोग करने, data augmentation और dropout जोड़ने, तथा tanh activation function को ReLU से बदलने जैसी आधुनिक deep learning techniques के साथ भी प्रयोग किया, जिससे error rate लगभग 60% कम हो गई.
- लेखक का सुझाव है कि network या dataset का आकार बढ़ाकर अतिरिक्त सुधार हासिल किए जा सकते हैं, लेकिन इससे compute cost बढ़ सकती है और inference latency पैदा हो सकती है.
- पिछले 33 वर्षों में deep learning की प्रगति को देखते हुए, लेखक बताते हैं कि मूल सिद्धांत वही रहे हैं, लेकिन datasets और models का scale बहुत बढ़ गया है, और models को train करने में लगने वाला समय काफी कम हो गया है.
- लेखक का अनुमान है कि 2055 तक neural networks और भी बड़े हो जाएंगे, और अधिकांश applications नेटवर्क के किसी हिस्से को हल्के रूप से fine-tune करने, prompt engineering करने, या data अथवा model को छोटे और विशेष-उद्देश्य वाले inference networks में distill करने से हासिल की जाएंगी.
1 टिप्पणियां
Hacker News की राय