लगभग 100% compression ratio वाला π file system

(github.com)

18 पॉइंट द्वारा budlebee 2021-07-17 | 12 टिप्पणियां | WhatsApp पर शेयर करें

मज़बूती से माना जाता है कि π के दशमलव विस्तार में, चाहे उसे किसी भी base में लिखा जाए, सभी अंक समान अनुपात में दिखाई देते हैं; इसे normal number कहा जाता है.

यदि यह normal number है, तो यह सिद्ध है कि इसमें disjunctive sequence होती है, यानी सभी संभव digit combinations इसमें शामिल होते हैं.

अर्थात, binary में व्यक्त किए गए सभी computer programs π के दशमलव विस्तार में कहीं न कहीं मौजूद हैं. यदि π के दशमलव विस्तार में उनकी position खोज ली जाए, तो सभी जानकारी को store और restore किया जा सकता है.

कहा जाता है कि 400-line text file को store करने में लगभग 5 मिनट लगते हैं, लेकिन निर्माता का कहना है कि बस Moore's Law पर भरोसा करिए...।

12 टिप्पणियां

hoochimong 2021-07-26

उदाहरण के लिए, अगर 01010 जैसा डेटा हो, तो मेरी समझ यह है कि pi में 01010 से मेल खाने वाली कोई पोज़िशन मौजूद होगी। इसलिए शायद सिर्फ़ उस पोज़िशन की जानकारी स्टोर करनी होगी..

मैं हाल ही में Silicon Valley नाम का ड्रामा देख रहा हूँ, उसमें compression algorithm का इस्तेमाल करने वाला एक नया इंटरनेट आता है। अगर तकनीक इतनी आगे बढ़ जाए कि लगभग 100% compression ratio वाला pi file system व्यावहारिक रूप से इस्तेमाल किया जा सके, तो क्या सच में ऐसा नया इंटरनेट आ सकता है?

ehlegeth 2021-07-19

इसे ऐसे समझा जा सकता है कि π हर जगह से एक्सेस की जा सकने वाली एक साझा dictionary की भूमिका निभाता है.

roxie 2021-07-18

क्या कोई इसे थोड़ा आसान तरीके से समझा सकता है? मुझे ठीक से समझ नहीं आ रहा कि π का normal number होना और फ़ाइल स्टोर करते समय compression ratio का 100 प्रतिशत होना, इन दोनों का आपस में क्या संबंध है.

normal number से मतलब, उदाहरण के लिए अगर π को base-5 में लिखें और दशमलव के बाद 1000 अंकों तक फैलाएँ, तो 0,1,2,3,4 प्रत्येक लगभग 200 बार आएँगे — क्या यही बात है?

मैं उससे आगे समझ नहीं पा रहा हूँ.

budlebee 2021-07-18

मैंने इसे इस तरह समझा है.

अगर यह एक normal number है, तो यह साबित है कि सभी संभव अंकों के संयोजन इसमें कम-से-कम एक बार आते हैं. 0110001... जैसे binary numbers भी निश्चित ही pi के दशमलव के किसी न किसी हिस्से में होंगे. अगर हम सिर्फ उस दशमलव स्थान को याद रखें, तो फ़ाइल को स्टोरेज डिवाइस में सीधे सेव किए बिना भी उसे फिर से बहाल किया जा सकता है. चूँकि pi का मान एक mathematical constant है, इसलिए उसे स्टोरेज डिवाइस में अलग से सेव रखने की ज़रूरत नहीं होती, बल्कि हर बार ज़रूरत पड़ने पर pi का मान कैलकुलेट करके इस्तेमाल किया जा सकता है.

roxie 2021-07-19

यह साबित किया जा चुका है कि अंकों के सभी संभावित संयोजन कम-से-कम एक बार आते हैं.

समझ गया। सच में बहुत धन्यवाद!

dbeat999 2021-07-17

अगर ऐसी स्टोरेज हो जो π को बिना किसी त्रुटि के स्टोर कर सके, तो शुरुआत से ही compression की ज़रूरत नहीं होगी...

budlebee 2021-07-18

ऐसा लगता है कि π का मान storage में सेव करके इस्तेमाल नहीं किया जा रहा, बल्कि हर बार ज़रूरत पड़ने पर π का मान कैलकुलेट करके इस्तेमाल किया जा रहा है। शायद इसी वजह से इसे 100% compression कहा जा रहा है।

zariski 2021-07-17

मैंने Wikipedia पर compression ratio की परिभाषा[1] देखी, तो लगा कि यह वह गणना-पद्धति नहीं है जिसे हम आमतौर पर सोचते हैं.

इस बारे में मेरा बहुत पुराना लिखा हुआ एक लेख[2] है. काफ़ी समय हो गया. हा हा

[1] https://en.wikipedia.org/wiki/Data_compression_ratio

[2] https://wp.me/pPGG8-41E

budlebee 2021-07-17

मुझे भी पहली बार पता चला कि compression ratio की परिभाषा compression से पहले का आकार / compression के बाद का आकार होती है। GitHub पर 100% compression लिखा था, इसलिए मैं गलत समझ बैठा था..

kunggom 2021-07-17

इससे Illegal prime की अवधारणा भी याद आ रही है, haha

https://wp.me/pPGG8-3sT

ffdd270 2021-07-18

यह तो काफ़ी मज़ेदार बात है हाहाहाहा अब क्या गैरकानूनी pi का दौर आ गया है...

गैरकानूनी कंटेंट को उससे compress करो
उससे निकलने वाले, कहीं मौजूद pi value की position बता do
गैरकानूनी!

budlebee 2021-07-17

दशमलव गणना को पहली जगह से नहीं बल्कि किसी विशेष अंक स्थान से शुरू करके निकालने की विधि को spigot algorithm कहा जाता है, और pifs के मामले में कहा गया है कि यह pi के अंकों की गणना के लिए Bailey-Borwein-Plouffe formula का उपयोग करता है.

https://ko.wikipedia.org/wiki/Spigot_algorithm

लगभग 100% compression ratio वाला π file system

संबंधित पढ़ाई

12 टिप्पणियां