- 1990 से 2025 तक के CIA World Factbook डेटा को संरचित करके खोज और विश्लेषण किया जा सकने वाला open source information archive
- 281 देशों और क्षेत्रों, 36 वार्षिक संस्करणों, और 10 लाख से अधिक data fields शामिल
- साल-दर-साल country profiles, time series data, full-text search, और geography, communications, trade network analysis सुविधाएँ प्रदान करता है
- COCOM region-based dashboard, country-to-country indicator comparison, global trend visualization जैसे analysis tools शामिल
- public domain सामग्री पर आधारित, और CIA या अमेरिकी सरकार से असंबंधित एक स्वतंत्र project
अवलोकन
- 36 वर्षों की geopolitical information को संरक्षित और संरचित करने वाला data archive
- मूल CIA World Factbook से parse किए गए डेटा पर आधारित
- 281 entities, 36 editions, 9,500 country-year records, और 1,061,341 data fields शामिल
- सभी डेटा searchable हैं, और साल के अनुसार country reports में हुए बदलावों को ट्रैक किया जा सकता है
प्लेटफ़ॉर्म संरचना
- Factbook Archive / Reference Library
- 1990~2025 के सभी संस्करण देखे जा सकते हैं
- मूल field data को ज्यों का त्यों दिखाता है, और वर्ष-दर-वर्ष बदलाव खोजे जा सकते हैं
- Intelligence Analysis / Analytic Workspace
- DoD combatant commands (COCOM) क्षेत्रों के अनुसार बना analysis workspace
- choropleth maps, time series comparison, country dossiers (ICD 203 format), और cross-indicator comparison सुविधाएँ प्रदान करता है
प्रमुख सुविधाएँ
- Library: सभी entities को प्रकार के अनुसार वर्गीकृत करता है, flags सहित
- Country Profile: हर देश के सभी field data को देखा जा सकता है
- Full-Text Search: 10 लाख से अधिक fields में Z39.58 syntax के साथ keyword search
- Field Time Series: किसी विशेष data field के 36 वर्षों के रुझान को ट्रैक करना
- Factbook Quiz: 4 modes में world knowledge quiz
- Factbook Export: सभी fields सहित print-ready country report बनाना
intelligence analysis tools
- Regional Dashboard: COCOM regions और capitals सहित world map
- Timeline Map: 36 वर्षों के डेटा को animation के रूप में visualize करता है
- Communications Analysis: internet, mobile, broadband penetration indicators दिखाता है
- Map Compare: दो वर्षों के maps को sync करके तुलना
- COCOM Region Detail: region-wise key indicators (KPI) दिखाता है
- Intelligence Dossier: ICD 203 मानक पर आधारित country dossier
- Global Rankings: indicators के आधार पर देशों की ranking
- Global Trends: सभी editions में वैश्विक indicators के trends
- Compare Countries: देशों के बीच indicators की तुलना
- Field Explorer: सभी data fields और coverage statistics की खोज
- Change Detection: year-by-year field changes का पता लगाना
- Dissolved States: अब अस्तित्व में न रहने वाले देशों और क्षेत्रों की जानकारी
- Trade Networks: trade relationship network graph
- Organization Networks: international organization membership relationship graph
- Query Builder: custom analysis queries बनाना
- Text Diff: साल-दर-साल text comparison और changes highlight करना
परियोजना जानकारी
- सभी डेटा अमेरिकी सरकार की public domain सामग्री (CIA World Factbook) से एकत्र किए गए हैं
- CIA या अमेरिकी सरकार से कोई संबंध नहीं
- analysis ICD 203 analytical standards का पालन करता है
- GitHub repository के माध्यम से source और methodology सार्वजनिक
1 टिप्पणियां
Hacker News की राय
अगर अगला प्रशासन इस संग्रहीत डेटा का उपयोग करके इसे फिर से बनाए, तो वह सच में शानदार होगा
कोई प्रोजेक्ट पोस्ट करता है, फिर कम्युनिटी रीयल टाइम में bugs ढूंढती है, और निर्माता तुरंत उन्हें ठीक करता है
FIPS और ISO country code conflict की समस्या इसका अच्छा उदाहरण है कि ऐसे दुर्लभ bugs कई लोगों की नजर से ही पकड़े जा सकते हैं
यह भी प्रभावशाली है कि निर्माता रक्षात्मक हुए बिना feedback पर सक्रिय रूप से प्रतिक्रिया दे रहा था
इसे “CIA.gov के मूल प्रारूप (1:1) में country profile dataset cache” कहा गया है
विस्तृत डेटा cache.factbook.json में देखा जा सकता है
लेकिन मुझे लगा कि 1990~2025 के डेटा को SQL database में बदलकर queryable बनाना जरूरी है
यह dataset GraphRAG feature testing के लिए बहुत उपयुक्त है
असली डेटा पर आधारित world simulation game भी बनाया जा सकता है
CIA द्वारा प्रकाशित मूल सामग्री ज्यों की त्यों रखी गई है, और parsing के दौरान सिर्फ formatting noise साफ किया गया है
इसके अलावा FIPS 10-4 codes, ISO Alpha-2/3, और MasterCountryID को map करने के लिए एक lookup table बनाई है, ताकि इन्हें एक-दूसरे से जोड़ा जा सके
इन सामग्रियों को भी GitHub में जोड़ने की योजना है
2002 Factbook में “Germany” पर क्लिक करने से हर बार “Gambia” पेज पर चला जाता है
दूसरे देशों में ऐसा नहीं देखा
Amazon लिंक
इसे trend analysis page में देखा जा सकता है
रिपोर्ट करने के लिए धन्यवाद!
उदाहरण: भारत fixed broadband subscriptions डेटा
उदाहरण के लिए, “18.17 million” को सिर्फ 18.17 के रूप में पढ़ा जा रहा था, जिससे graph अचानक गिरता दिख रहा था
unit handling जोड़कर bug ठीक कर दिया है, और अभी deploy भी कर दिया
इसकी सूचना देने के लिए धन्यवाद