- "Overview of SHARD: A System for Highly Available Replicated Data" 1988
- डेटाबेस sharding को परिचित कराने वाला पहला पेपर, जिसे अनगिनत शोध-पत्रों में उद्धृत किया गया, लेकिन "मौजूद नहीं है"
- "Integral Neural Networks"
- "Blue Is the New Black (Market): Privacy Leaks and Re-Victimization from Police-Auctioned Cellphones"
- "Latency Lags Bandwidth"
- "Liquid solution centrifugation for safe, scalable, and efficient isotope separation"
- "Co-cultivation enhanced microbial protein production based on autotrophic nitrogen-fixing hydrogen-oxidizing bacteria"
- "Enso: A Streaming Interface for NIC-Application Communication"
- "Search-Based Regular Expression Inference on a GPU"
- "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm"
- "FP2: Fully in-Place Functional Programming"
- "Enabling tabular deep learning when d ≫ n with an auxiliary knowledge graph"
- "A Holistic Approach to Undesired Content Detection in the Real World"
3 टिप्पणियां
Integral Neural Networks काफ़ी प्रभावशाली लगते हैं।
लगता है कि वज़न वितरण को विविक्त करना इसका मुख्य विचार है, और बात कुछ ऐसी है कि sampling theory की तरह सतत फ़ंक्शन के रूप में व्यक्त वज़न वितरण को विविक्त करके computation की मात्रा को optimize किया जा सकता है।
हाल के LLMs को भी देखें तो मॉडल को quantize करके समान प्रदर्शन के साथ कम computation की ज़रूरत वाले मॉडल बनाए जाते हैं, इसलिए यह उससे मिलती-जुलती पद्धति लगती है।
पहला आइटम थोड़ा अटपटा है, लेकिन मज़ेदार भी है
Where is the original "Overview of SHARD" paper?
उस लिंक की टिप्पणियाँ देखीं तो पता चला कि लेखक ने हाल ही में खुद जवाब दिया था।
क्योंकि वह कंपनी/रिसर्च लैब के आंतरिक उपयोग का दस्तावेज़ था, इसलिए उसे सार्वजनिक रूप से एक्सेस करने का कोई तरीका नहीं था।
"I'm the Ronni Rosenberg. This was an internal CCA paper (not from academia or a published journal), from 35 years ago! I don't have a copy and I have no idea how to get it. Sorry about that. It does seem to be the earliest reference to data "sharding." (The other early reference mentioned in Wikipedia is from much later, 1997.)
Fortunately, you need not go back 35 years to read about sharding; it's easy to get current info. Cheers."
असल में ऐसे मामले काफ़ी बार होते हैं, और भले ही मूल सामग्री को सीधे सत्यापित न किया जा सके, फिर भी citation देने का कारण यह होता है कि शोधपत्र में जिस विशिष्ट अवधारणा या शोध का उल्लेख है, उसके स्रोत को स्पष्ट किया जा सके। दूसरे शोधकर्ताओं के लिए यह जाँचना ज़रूरी होता है कि मेरे शोध में जिस Sharding की बात हो रही है, क्या वही Sharding दूसरे लोग भी उसी अर्थ में समझते हैं, या फिर नाम एक ही है लेकिन किसी और ने कोई अलग अवधारणा प्रस्तावित की थी, या फिर यह वास्तव में कोई अस्तित्वहीन अवधारणा है और कोई भ्रम पैदा करने के लिए Sharding नाम का इस्तेमाल कर रहा है।
Deep learning में भी कई बार ऐसा होता है कि नाम एक ही होता है, लेकिन network model अलग-अलग शोध परिणामों से आते हैं.