7 पॉइंट द्वारा xguru 2020-03-02 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • संगठित अपराध और भ्रष्टाचार पर केंद्रित खोजी पत्रकारिता करने वाले OCCRP द्वारा बनाया गया डेटा जांच और विश्लेषण टूल

  • संरचित (DB) / असंरचित (PDF, XLS, DOC आदि) डेटा को एकीकृत करके क्रॉस-सर्च

  • डेटा विभाजन और एक्सेस मैनेजमेंट फीचर. बहुराष्ट्रीय टीमों के बीच लचीला शेयरिंग समर्थन

  • सैकड़ों सार्वजनिक डेटा स्रोतों से निरंतर क्रॉलिंग

  • विज़ुअल जांच विश्लेषण प्रदान करता है

  • डेटा इम्पोर्ट समर्थन

  • HTML/XML से लेकर PDF, RTF, Epub और अधिकांश Office दस्तावेज़ (Doc, PPT)

  • XLS/CSV तथा DBF, SQLite, Access जैसे टेबल फ़ॉर्मैट

  • RFC822 MIME ईमेल, Outlook PST/OLM जैसे मेलबॉक्स, Mbox, Vcard

  • Zip, Rar, Tar, 7Zip, Gzip

  • JPEG, PNG, GIF, TIFF, SVG से Tesseract 4 या Google Vision API के जरिए OCR कर टेक्स्ट एक्सट्रैक्ट करना

1 टिप्पणियां

 
xguru 2020-03-02

इसे बनाने वाला OCCRP ऐसी संस्था है.

"संगठित अपराध और भ्रष्टाचार पर केंद्रित खोजी मीडिया, OCCRP" https://newstapa.org/article/_DNLi

आप इसे https://aleph.occrp.org/ पर वास्तविक डेटा के साथ आज़मा सकते हैं.

OpenOil द्वारा बनाया गया ट्रेलर वीडियो Aleph को आसानी से समझाता है.

( OpenOil दुनिया भर के गैस, तेल, कोयला आदि प्राकृतिक संसाधनों के प्रबंधन के लिए एक open data framework बनाने वाली कंपनी है. )

https://www.youtube.com/watch?v=bg96HcR_2Jc

क्योंकि यह "भ्रष्टाचार" पर केंद्रित एक खोजी संगठन ने बनाया है, इसका बुनियादी डेटा मॉडल "Follow the Money" है.

यह पैसे का अलग-अलग कंपनियों और लोगों के बीच कैसे प्रवाह होता है, उसे अच्छी तरह ट्रैक करता है.

इसी वजह से यह जिन dataset entity types को बुनियादी रूप से सपोर्ट करता है, वे इस प्रकार हैं.

  • Airplane, Assessment, Asset, Bank Account, Company, Contract, Court case, Customs Declaration, Land, Legal Entity