-
संगठित अपराध और भ्रष्टाचार पर केंद्रित खोजी पत्रकारिता करने वाले OCCRP द्वारा बनाया गया डेटा जांच और विश्लेषण टूल
-
संरचित (DB) / असंरचित (PDF, XLS, DOC आदि) डेटा को एकीकृत करके क्रॉस-सर्च
-
डेटा विभाजन और एक्सेस मैनेजमेंट फीचर. बहुराष्ट्रीय टीमों के बीच लचीला शेयरिंग समर्थन
-
सैकड़ों सार्वजनिक डेटा स्रोतों से निरंतर क्रॉलिंग
-
विज़ुअल जांच विश्लेषण प्रदान करता है
-
डेटा इम्पोर्ट समर्थन
-
HTML/XML से लेकर PDF, RTF, Epub और अधिकांश Office दस्तावेज़ (Doc, PPT)
-
XLS/CSV तथा DBF, SQLite, Access जैसे टेबल फ़ॉर्मैट
-
RFC822 MIME ईमेल, Outlook PST/OLM जैसे मेलबॉक्स, Mbox, Vcard
-
Zip, Rar, Tar, 7Zip, Gzip
-
JPEG, PNG, GIF, TIFF, SVG से Tesseract 4 या Google Vision API के जरिए OCR कर टेक्स्ट एक्सट्रैक्ट करना
1 टिप्पणियां
इसे बनाने वाला OCCRP ऐसी संस्था है.
"संगठित अपराध और भ्रष्टाचार पर केंद्रित खोजी मीडिया, OCCRP" https://newstapa.org/article/_DNLi
आप इसे https://aleph.occrp.org/ पर वास्तविक डेटा के साथ आज़मा सकते हैं.
OpenOil द्वारा बनाया गया ट्रेलर वीडियो Aleph को आसानी से समझाता है.
( OpenOil दुनिया भर के गैस, तेल, कोयला आदि प्राकृतिक संसाधनों के प्रबंधन के लिए एक open data framework बनाने वाली कंपनी है. )
https://www.youtube.com/watch?v=bg96HcR_2Jc
क्योंकि यह "भ्रष्टाचार" पर केंद्रित एक खोजी संगठन ने बनाया है, इसका बुनियादी डेटा मॉडल "Follow the Money" है.
यह पैसे का अलग-अलग कंपनियों और लोगों के बीच कैसे प्रवाह होता है, उसे अच्छी तरह ट्रैक करता है.
इसी वजह से यह जिन dataset entity types को बुनियादी रूप से सपोर्ट करता है, वे इस प्रकार हैं.