2 पॉइंट द्वारा GN⁺ 2023-09-05 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • PDF टेक्स्ट सामग्री संपादित करने की गाइड: Adobe Acrobat जैसे commercial tools के बिना
  • Mac उपयोगकर्ताओं के लिए मुख्य गाइड: उन tools का उल्लेख जो ज़्यादातर Linux distributions में भी उपलब्ध हैं
  • PDF में टेक्स्ट डेटा का compressed storage: qpdf नाम के command-line tool का उपयोग करके decompression
  • decompression के बाद टेक्स्ट डेटा की जाँच: text editor में encoding और किसी specific font से जुड़े रूप में देखना
  • PDF में टेक्स्ट encoding की जटिलता: फ़ाइल में शामिल custom encodings सहित कई संभावित encodings
  • encoding जानकारी निकालना: pdffonts नाम के command-line tool का उपयोग
  • embedded encoding से जुड़े font की पहचान करने और उस font की embedded encoding table खोजने के तरीके का उदाहरण
  • encoding table: custom encoding points को Unicode points से map करना
  • Python का उपयोग करके table conversion: table को dictionary में बदलना और encoding व decoding functions लिखना
  • इन functions के ज़रिए मूल टेक्स्ट बदलना: custom-encoded replacement text से original text को replace किया जा सकता है

1 टिप्पणियां

 
GN⁺ 2023-09-05
Hacker News की राय
  • PDF स्पेसिफिकेशन जटिल है और Photoshop के layer blend mode तथा पहले की सामग्री को संशोधित करने वाली incremental additions सहित कई तरह की सुविधाओं को सपोर्ट करता है.
  • PDF में अलग-अलग "owner" और "user" password के साथ password-based encryption, और printing या text copy को रोकने वाले options शामिल होते हैं.
  • अपनी जटिल प्रकृति के बावजूद, PDF कोई अभेद्य binary format नहीं है, बल्कि आधिकारिक स्पेसिफिकेशन में अच्छी तरह वर्णित कई प्रकार के object graphs का संग्रह है.
  • mutool जैसे tools का उपयोग PDF को ऐसे version में बदलने के लिए किया जा सकता है जिसमें compressed data न हो, जिससे उसे समझना और संशोधित करना आसान हो जाता है.
  • PDF 3D objects, JavaScript, embedded Flash object movies, invisible annotations, और XHTML तथा CSS के subset का उपयोग करने वाले widgets जैसी कई सुविधाओं को सपोर्ट करता है.
  • लेकिन PDF मूल रूप से page description format है, जो दस्तावेज़ की संरचना नहीं बल्कि पेज के प्रदर्शन को दर्शाता है. इसलिए जिस document से PDF बनाया गया था, उसी को संपादित करना बेहतर माना जाता है.
  • PDF का मुख्य उद्देश्य सामग्री को पूरी तरह सही तरीके से दिखाना या प्रिंट करना है, इसलिए यह किसी ऐसे image format के अधिक करीब है जो वास्तविक image की तुलना में कम bytes लेता है.
  • qpdf और RUPS जैसे tools का उपयोग PDF की संरचना को समझने और उसमें संशोधन करने के लिए किया जा सकता है.
  • Firefox, PDF पर हस्ताक्षर करने का एक आसान तरीका प्रदान करता है.
  • PDF स्पेसिफिकेशन बहुत विशाल और जटिल है, और कई वर्षों तक इसका अध्ययन करने के बाद भी ऐसा लग सकता है कि आपने बस इसकी सतह को ही छुआ है.