4 पॉइंट द्वारा GN⁺ 2026-02-23 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • 1990 से 2025 तक के CIA World Factbook डेटा को संरचित करके खोज और विश्लेषण किया जा सकने वाला open source information archive
  • 281 देशों और क्षेत्रों, 36 वार्षिक संस्करणों, और 10 लाख से अधिक data fields शामिल
  • साल-दर-साल country profiles, time series data, full-text search, और geography, communications, trade network analysis सुविधाएँ प्रदान करता है
  • COCOM region-based dashboard, country-to-country indicator comparison, global trend visualization जैसे analysis tools शामिल
  • public domain सामग्री पर आधारित, और CIA या अमेरिकी सरकार से असंबंधित एक स्वतंत्र project

अवलोकन

  • 36 वर्षों की geopolitical information को संरक्षित और संरचित करने वाला data archive
    • मूल CIA World Factbook से parse किए गए डेटा पर आधारित
    • 281 entities, 36 editions, 9,500 country-year records, और 1,061,341 data fields शामिल
  • सभी डेटा searchable हैं, और साल के अनुसार country reports में हुए बदलावों को ट्रैक किया जा सकता है

प्लेटफ़ॉर्म संरचना

  • Factbook Archive / Reference Library
    • 1990~2025 के सभी संस्करण देखे जा सकते हैं
    • मूल field data को ज्यों का त्यों दिखाता है, और वर्ष-दर-वर्ष बदलाव खोजे जा सकते हैं
  • Intelligence Analysis / Analytic Workspace
    • DoD combatant commands (COCOM) क्षेत्रों के अनुसार बना analysis workspace
    • choropleth maps, time series comparison, country dossiers (ICD 203 format), और cross-indicator comparison सुविधाएँ प्रदान करता है

प्रमुख सुविधाएँ

  • Library: सभी entities को प्रकार के अनुसार वर्गीकृत करता है, flags सहित
  • Country Profile: हर देश के सभी field data को देखा जा सकता है
  • Full-Text Search: 10 लाख से अधिक fields में Z39.58 syntax के साथ keyword search
  • Field Time Series: किसी विशेष data field के 36 वर्षों के रुझान को ट्रैक करना
  • Factbook Quiz: 4 modes में world knowledge quiz
  • Factbook Export: सभी fields सहित print-ready country report बनाना

intelligence analysis tools

  • Regional Dashboard: COCOM regions और capitals सहित world map
  • Timeline Map: 36 वर्षों के डेटा को animation के रूप में visualize करता है
  • Communications Analysis: internet, mobile, broadband penetration indicators दिखाता है
  • Map Compare: दो वर्षों के maps को sync करके तुलना
  • COCOM Region Detail: region-wise key indicators (KPI) दिखाता है
  • Intelligence Dossier: ICD 203 मानक पर आधारित country dossier
  • Global Rankings: indicators के आधार पर देशों की ranking
  • Global Trends: सभी editions में वैश्विक indicators के trends
  • Compare Countries: देशों के बीच indicators की तुलना
  • Field Explorer: सभी data fields और coverage statistics की खोज
  • Change Detection: year-by-year field changes का पता लगाना
  • Dissolved States: अब अस्तित्व में न रहने वाले देशों और क्षेत्रों की जानकारी
  • Trade Networks: trade relationship network graph
  • Organization Networks: international organization membership relationship graph
  • Query Builder: custom analysis queries बनाना
  • Text Diff: साल-दर-साल text comparison और changes highlight करना

परियोजना जानकारी

  • सभी डेटा अमेरिकी सरकार की public domain सामग्री (CIA World Factbook) से एकत्र किए गए हैं
  • CIA या अमेरिकी सरकार से कोई संबंध नहीं
  • analysis ICD 203 analytical standards का पालन करता है
  • GitHub repository के माध्यम से source और methodology सार्वजनिक

1 टिप्पणियां

 
GN⁺ 2026-02-23
Hacker News की राय
  • लगता है मौजूदा प्रशासन ने CIA World Factbook का सारा आंतरिक डेटा हटा दिया, ताकि भविष्य में उसे बहाल करने की कोशिश न हो सके
    अगर अगला प्रशासन इस संग्रहीत डेटा का उपयोग करके इसे फिर से बनाए, तो वह सच में शानदार होगा
  • Show HN को ऐसे ही काम करना चाहिए
    कोई प्रोजेक्ट पोस्ट करता है, फिर कम्युनिटी रीयल टाइम में bugs ढूंढती है, और निर्माता तुरंत उन्हें ठीक करता है
    FIPS और ISO country code conflict की समस्या इसका अच्छा उदाहरण है कि ऐसे दुर्लभ bugs कई लोगों की नजर से ही पकड़े जा सकते हैं
    यह भी प्रभावशाली है कि निर्माता रक्षात्मक हुए बिना feedback पर सक्रिय रूप से प्रतिक्रिया दे रहा था
  • जिन लोगों को Factbook की JSON या Markdown files चाहिए, उनके लिए एक GitHub repository है
    इसे “CIA.gov के मूल प्रारूप (1:1) में country profile dataset cache” कहा गया है
    विस्तृत डेटा cache.factbook.json में देखा जा सकता है
    • लिंक के लिए धन्यवाद! मेरा GitHub और वेबसाइट भी इसी source का उपयोग कर रहे हैं
      लेकिन मुझे लगा कि 1990~2025 के डेटा को SQL database में बदलकर queryable बनाना जरूरी है
  • लेखक से: अगर आप database के fields या bugs (जैसे country codes) को ठीक कर रहे हैं, तो क्या उसका वह version भी साझा कर सकते हैं?
    यह dataset GraphRAG feature testing के लिए बहुत उपयुक्त है
    असली डेटा पर आधारित world simulation game भी बनाया जा सकता है
    • बिल्कुल संभव है! सभी data fixes का रिकॉर्ड .txt change log में रखा जा रहा है
      CIA द्वारा प्रकाशित मूल सामग्री ज्यों की त्यों रखी गई है, और parsing के दौरान सिर्फ formatting noise साफ किया गया है
      इसके अलावा FIPS 10-4 codes, ISO Alpha-2/3, और MasterCountryID को map करने के लिए एक lookup table बनाई है, ताकि इन्हें एक-दूसरे से जोड़ा जा सके
      इन सामग्रियों को भी GitHub में जोड़ने की योजना है
  • शानदार प्रोजेक्ट है। लेकिन एक समस्या मिली
    2002 Factbook में “Germany” पर क्लिक करने से हर बार “Gambia” पेज पर चला जाता है
    दूसरे देशों में ऐसा नहीं देखा
    • एक और उदाहरण: “Nicaragua” खोजने पर “Niger” पेज खुलता है
  • 2025–2026 version पहले से बाहर खरीदने और पढ़ने के लिए उपलब्ध है, और 2026–2027 edition 7 अप्रैल को रिलीज़ होने वाली है
    Amazon लिंक
    • मुझे पता ही नहीं था कि ऐसी किताबें सच में प्रकाशित होती हैं। बताने के लिए धन्यवाद
    • Internet Archive के पास 2025–2026 edition है, इसलिए scan के बाद इसे OpenLibrary में जोड़ा जाएगा
    • रिलीज़ होने पर मैं इसे अपने प्रोजेक्ट में भी जोड़ दूँगा। जानकारी साझा करने के लिए धन्यवाद
  • यह लिंक सच में कमाल का है: change analysis page
  • शानदार प्रोजेक्ट है। लेकिन लगता है दुनिया की जनसंख्या दोगुनी गिनी गई है
    इसे trend analysis page में देखा जा सकता है
    • कारण मिल गया। “World” entity (लगभग 8 अरब लोग) को अलग-अलग देशों के साथ जोड़ दिया गया था, इसलिए कुल संख्या दोगुनी हो रही थी
      रिपोर्ट करने के लिए धन्यवाद!
    • मैं अभी इसे ठीक कर रहा हूँ। शायद बहुत देर तक देखते-देखते यह चीज़ छूट गई। बताने के लिए धन्यवाद
  • क्या यह प्रोजेक्ट उस सेवा का archive है जिसे मौजूदा White House administration ने बंद कर दिया है?
    • हाँ, बिल्कुल वही सेवा है
  • time-series chart में bug है। डेटा को visualize करने से पहले normalization की ज़रूरत है
    उदाहरण: भारत fixed broadband subscriptions डेटा
    • समस्या मिल गई। totals को parse करने वाला regex unit suffixes (million/billion आदि) को संभाल नहीं पा रहा था
      उदाहरण के लिए, “18.17 million” को सिर्फ 18.17 के रूप में पढ़ा जा रहा था, जिससे graph अचानक गिरता दिख रहा था
      unit handling जोड़कर bug ठीक कर दिया है, और अभी deploy भी कर दिया
      इसकी सूचना देने के लिए धन्यवाद