लगभग 100% compression ratio वाला π file system
(github.com)मज़बूती से माना जाता है कि π के दशमलव विस्तार में, चाहे उसे किसी भी base में लिखा जाए, सभी अंक समान अनुपात में दिखाई देते हैं; इसे normal number कहा जाता है.
यदि यह normal number है, तो यह सिद्ध है कि इसमें disjunctive sequence होती है, यानी सभी संभव digit combinations इसमें शामिल होते हैं.
अर्थात, binary में व्यक्त किए गए सभी computer programs π के दशमलव विस्तार में कहीं न कहीं मौजूद हैं. यदि π के दशमलव विस्तार में उनकी position खोज ली जाए, तो सभी जानकारी को store और restore किया जा सकता है.
कहा जाता है कि 400-line text file को store करने में लगभग 5 मिनट लगते हैं, लेकिन निर्माता का कहना है कि बस Moore's Law पर भरोसा करिए...।
12 टिप्पणियां
उदाहरण के लिए, अगर 01010 जैसा डेटा हो, तो मेरी समझ यह है कि pi में 01010 से मेल खाने वाली कोई पोज़िशन मौजूद होगी। इसलिए शायद सिर्फ़ उस पोज़िशन की जानकारी स्टोर करनी होगी..
मैं हाल ही में Silicon Valley नाम का ड्रामा देख रहा हूँ, उसमें compression algorithm का इस्तेमाल करने वाला एक नया इंटरनेट आता है। अगर तकनीक इतनी आगे बढ़ जाए कि लगभग 100% compression ratio वाला pi file system व्यावहारिक रूप से इस्तेमाल किया जा सके, तो क्या सच में ऐसा नया इंटरनेट आ सकता है?
इसे ऐसे समझा जा सकता है कि π हर जगह से एक्सेस की जा सकने वाली एक साझा dictionary की भूमिका निभाता है.
क्या कोई इसे थोड़ा आसान तरीके से समझा सकता है? मुझे ठीक से समझ नहीं आ रहा कि π का normal number होना और फ़ाइल स्टोर करते समय compression ratio का 100 प्रतिशत होना, इन दोनों का आपस में क्या संबंध है.
normal number से मतलब, उदाहरण के लिए अगर π को base-5 में लिखें और दशमलव के बाद 1000 अंकों तक फैलाएँ, तो 0,1,2,3,4 प्रत्येक लगभग 200 बार आएँगे — क्या यही बात है?
मैं उससे आगे समझ नहीं पा रहा हूँ.
मैंने इसे इस तरह समझा है.
अगर यह एक normal number है, तो यह साबित है कि सभी संभव अंकों के संयोजन इसमें कम-से-कम एक बार आते हैं. 0110001... जैसे binary numbers भी निश्चित ही pi के दशमलव के किसी न किसी हिस्से में होंगे. अगर हम सिर्फ उस दशमलव स्थान को याद रखें, तो फ़ाइल को स्टोरेज डिवाइस में सीधे सेव किए बिना भी उसे फिर से बहाल किया जा सकता है. चूँकि pi का मान एक mathematical constant है, इसलिए उसे स्टोरेज डिवाइस में अलग से सेव रखने की ज़रूरत नहीं होती, बल्कि हर बार ज़रूरत पड़ने पर pi का मान कैलकुलेट करके इस्तेमाल किया जा सकता है.
समझ गया। सच में बहुत धन्यवाद!
अगर ऐसी स्टोरेज हो जो π को बिना किसी त्रुटि के स्टोर कर सके, तो शुरुआत से ही compression की ज़रूरत नहीं होगी...
ऐसा लगता है कि π का मान storage में सेव करके इस्तेमाल नहीं किया जा रहा, बल्कि हर बार ज़रूरत पड़ने पर π का मान कैलकुलेट करके इस्तेमाल किया जा रहा है। शायद इसी वजह से इसे 100% compression कहा जा रहा है।
मैंने Wikipedia पर compression ratio की परिभाषा[1] देखी, तो लगा कि यह वह गणना-पद्धति नहीं है जिसे हम आमतौर पर सोचते हैं.
इस बारे में मेरा बहुत पुराना लिखा हुआ एक लेख[2] है. काफ़ी समय हो गया. हा हा
[1] https://en.wikipedia.org/wiki/Data_compression_ratio
[2] https://wp.me/pPGG8-41E
मुझे भी पहली बार पता चला कि compression ratio की परिभाषा compression से पहले का आकार / compression के बाद का आकार होती है। GitHub पर 100% compression लिखा था, इसलिए मैं गलत समझ बैठा था..
इससे Illegal prime की अवधारणा भी याद आ रही है, haha
https://wp.me/pPGG8-3sT
यह तो काफ़ी मज़ेदार बात है हाहाहाहा अब क्या गैरकानूनी pi का दौर आ गया है...
गैरकानूनी कंटेंट को उससे compress करो
उससे निकलने वाले, कहीं मौजूद pi value की position बता do
गैरकानूनी!
दशमलव गणना को पहली जगह से नहीं बल्कि किसी विशेष अंक स्थान से शुरू करके निकालने की विधि को spigot algorithm कहा जाता है, और pifs के मामले में कहा गया है कि यह pi के अंकों की गणना के लिए Bailey-Borwein-Plouffe formula का उपयोग करता है.
https://ko.wikipedia.org/wiki/Spigot_algorithm