2 पॉइंट द्वारा GN⁺ 2026-03-23 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Rust में विकसित उच्च-प्रदर्शन graph database, जो embedded और server mode दोनों में काम करता है और कम memory usage बनाए रखता है
  • Labeled Property Graph(LPG) और RDF triple मॉडल दोनों को support करता है, इसलिए social network से semantic web तक व्यापक उपयोग संभव है
  • GQL, Cypher, Gremlin, GraphQL, SPARQL, SQL/PGQ जैसी कई query languages को support करता है, जिससे developers के पास अधिक विकल्प होते हैं
  • HNSW-आधारित vector search, ACID transactions, MVCC snapshot isolation, multi-language bindings आदि के साथ एक पूर्ण feature set प्रदान करता है
  • LangChain, LlamaIndex, MCP जैसे AI frameworks के साथ integrate होता है, जिससे graph data और AI applications के संयोजन को support मिलता है

Grafeo का अवलोकन

  • Grafeo Rust में विकसित एक उच्च-प्रदर्शन graph database है, जो embedded और server mode दोनों में चलता है और कम memory usage बनाए रखता है
  • LDBC Social Network Benchmark में इसने सर्वोच्च performance दर्ज की है, और vectorized execution, adaptive chunking, SIMD-optimized operations को support करता है
  • Labeled Property Graph(LPG) और RDF triple दोनों data models को support करता है, इसलिए social network से semantic web तक कई domains के लिए उपयुक्त है
  • ACID transactions, MVCC-आधारित snapshot isolation, multi-language bindings, और AI integration ecosystem सहित एक पूर्ण feature set प्रदान करता है

मुख्य विशेषताएँ

  • उच्च-प्रदर्शन architecture

    • Rust-आधारित core engine में लिखा गया है, इसमें C dependency नहीं है, और वैकल्पिक रूप से jemalloc/mimalloc तथा TLS C libraries का उपयोग किया जा सकता है
    • इसमें push-आधारित execution engine, morsel-स्तरीय parallel processing, columnar storage, type-specific compression, और cost-based query optimizer शामिल हैं
    • Zone map का उपयोग करके data skipping के माध्यम से efficient query execution को support करता है
  • multi-query language support

    • GQL, Cypher, Gremlin, GraphQL, SPARQL, SQL/PGQ सभी को support करता है
    • project की प्रकृति और developer की expertise के अनुसार उपयुक्त language चुनी जा सकती है
    • GQL ISO standard declarative pattern matching देता है, Cypher Neo4j-compatible ASCII-art pattern देता है, और Gremlin Apache TinkerPop-आधारित traversal style प्रदान करता है
    • GraphQL LPG और RDF दोनों को support करता है, SPARQL W3C standard RDF query language है, और SQL/PGQ SQL:2023 GRAPH_TABLE syntax को support करता है
  • data models

    • LPG model labels और properties वाले nodes और edges की संरचना का उपयोग करता है, और कई data types की properties को support करता है
    • RDF model subject-predicate-object triple structure का उपयोग करता है, और SPO/POS/OSP indexes के जरिए efficient querying संभव बनाता है
    • RDF W3C standard compliance के कारण semantic web, ontology, और linked data के लिए उपयुक्त है
  • vector search features

    • HNSW-आधारित similarity search प्रदान करता है, और scalar·binary·product quantization को support करता है
    • graph traversal को semantic similarity search के साथ जोड़ा जा सकता है
  • embedded और standalone execution

    • बिना external dependencies के इसे सीधे application में embed किया जा सकता है, या REST API और web UI वाले standalone server के रूप में चलाया जा सकता है
    • edge devices से लेकर बड़े production clusters तक scale किया जा सकता है
  • transactions और memory safety

    • MVCC-आधारित snapshot isolation के साथ पूर्ण ACID transactions की गारंटी देता है
    • Rust की memory safety और fearless concurrency design के साथ reliable concurrency handling को support करता है
  • multi-language bindings

    • Python(PyO3), Node.js/TypeScript(napi-rs), Go(CGO), C(FFI), C#(.NET 8 P/Invoke), Dart(dart:ffi), WebAssembly(wasm-bindgen) support करता है
    • अलग-अलग language environments में वही Grafeo engine उपयोग किया जा सकता है
  • ecosystem और integration

    • LangChain, LlamaIndex, MCP जैसे AI frameworks के साथ integration
    • interactive notebook widgets, browser-आधारित WebAssembly graph visualization, web UI सहित standalone server, और benchmarking tools प्रदान करता है

इंस्टॉलेशन और शुरुआत

  • installation commands

    • Python: uv add grafeo
    • Node.js: npm install @grafeo-db/js
    • Go: go get github.com/GrafeoDB/grafeo/crates/bindings/go
    • Rust: cargo add grafeo
    • .NET: dotnet add package GrafeoDB
    • Dart: grafeo: ^0.5.21
    • WebAssembly: npm install @grafeo-db/wasm
  • quick start examples

    • Python उदाहरण में in-memory database बनाने के बाद INSERT और MATCH syntax से nodes और edges जोड़े जाते हैं और relations को query किया जाता है
    • Rust उदाहरण में GrafeoDB::new_in_memory() से database बनाया जाता है और session के माध्यम से वही queries चलाई जाती हैं

लाइसेंस

  • Grafeo Apache-2.0 license के तहत वितरित किया जाता है

1 टिप्पणियां

 
GN⁺ 2026-03-23
Hacker News की राय
  • जानना चाहूँगा कि क्या Grafeo ने LDBC benchmark इम्प्लीमेंट किया है
    इसे दूसरे graph databases से तुलना करना चाहूँगा। खासकर OLAP queries की performance को लेकर उत्सुक हूँ
    संबंधित लेख: Neo4j alternatives in 2026

  • हमने हाल ही में gfql के लिए cypher syntax जारी किया है
    यह dataframes पर सीधे चलने वाला पहला OSS CPU/GPU-आधारित cypher query engine है
    इसे Databricks या Splunk जैसे scalable DBs के साथ security, fraud detection, event analysis, और ML+AI embedding pipelines में मुख्य रूप से इस्तेमाल किया जाता है
    DB install किए बिना, एक single GPU पर यह प्रति सेकंड 1 अरब से अधिक edges प्रोसेस कर सकता है, और Apache Arrow या Parquet data पर भी सीधे लागू किया जा सकता है
    GFQL benchmark docs देखें
    इसका vectorized core पहले ही TCK के आधे से अधिक हिस्से को पूरा कर चुका है, और अभी अधिक जटिल हिस्से जोड़े जा रहे हैं
    NATO, banks, और US government सहित कई संस्थाएँ इसे पहले से production में इस्तेमाल कर रही हैं, और अब इसे open source किया गया है ताकि दूसरे developers या LLM भी इसे सीधे उपयोग कर सकें

  • जानना चाहता हूँ कि क्या यहाँ किसी को इस DB (Grafeo) के बारे में जानकारी है
    commit history देखने पर यह लगभग AI द्वारा लिखा गया project लगता है। एक व्यक्ति ने हर हफ्ते 100k~200k lines commit की हैं
    ऐसे मामलों में code quality कमजोर या जरूरत से ज्यादा जटिल होने की संभावना रहती है
    क्या कोई इसे वास्तव में इस्तेमाल कर रहा है, या यह सिर्फ AI portfolio experiment है?

    • Grafeo बनाने वाला मैं ही हूँ। यह जगह-जगह क्यों फैल रहा है, पता नहीं, लेकिन सवालों का जवाब दे सकता हूँ
      शुरुआती version मेरे द्वारा बनाए गए Graphos नामक local graph DB का पुनर्गठित रूप था
      engine, core, Python bindings, और tests मैंने हाथ से लिखे थे, जबकि docs और कुछ configuration AI-generated थे
      AI द्वारा बने हिस्सों की review की गई थी, लेकिन वे अभी production-level नहीं हैं
      इसकी शुरुआत Neo4j को लेकर असंतोष और DuckDB के Hännes के साथ हुई बातचीत से प्रेरित होकर हुई
      LadybugDB की memory usage बहुत अधिक लगी, इसलिए मैंने खुद बनाकर देखा, और फिलहाल मैं व्यक्तिगत रूप से संतुष्ट होकर इसका उपयोग कर रहा हूँ
      इसका कोई commercial उद्देश्य नहीं है, इसे open source के रूप में जारी किया है, और contributors का स्वागत है
    • इस मात्रा का code एक typical graph DB architecture के हिसाब से काफी ज्यादा है
      graph engine में बारीक design अहम होता है, इसलिए design quality के details को लेकर चिंता होती है
    • LLM द्वारा लिखे गए DB का उपयोग करना दुःस्वप्न जैसा लगता है। बड़े DBs को संभालना वैसे भी कठिन होता है
    • पिछले 3 महीनों में LLM द्वारा बनाए गए graph DBs की संख्या विस्फोटक रूप से बढ़ी है
      मैं जो gdotv.com चलाता हूँ, वहाँ भी यह तय करना लगातार मुश्किल होता जा रहा है कि किन्हें support किया जाए
    • हर हफ्ते 100k lines commit होना एक red flag है। ज़्यादातर यह code generation या formatting हो सकता है, और design या test reliability कमज़ोर हो सकती है
  • graph DBs इतने ज़्यादा हो गए हैं कि भ्रम होने लगा, इसलिए मैंने नई साइट gdb-engines.com बनाई
    वहाँ हर DB को classify और organize किया गया है

    • अच्छा होगा अगर तालिका में embedded है या server-based, इसका भी distinction हो
    • क्या यह सूची कहीं LLM से generate तो नहीं की गई, यह भी जानना चाहूँगा
  • जानना चाहता हूँ कि क्या वास्तव में production scale पर भरोसेमंद graph DBs मौजूद हैं
    open source या vendor products में, Meta के TAO जैसे विशेष मामलों को छोड़कर, कौन-कौन से विकल्प हैं?

    • सीधा जवाब देने से बचना चाहूँगा, लेकिन graph DB चुनना सचमुच बहुत कठिन समस्या है
      मैंने अपने FOSDEM 2025 talk में इसी विषय पर चर्चा की है
    • open source के लिहाज़ से JanusGraph, DGraph, Apache AGE, HugeGraph, MemGraph, ArcadeDB उपयुक्त हैं
    • मैं TypeDB के development का नेतृत्व करता हूँ। यह Cypher का उपयोग नहीं करता, लेकिन large-scale production में अच्छी तरह काम करता है
      अधिकांश OSS DBs किसी न किसी रूप में open-core model का पालन करते हैं
    • Facebook का graph system सिर्फ TAO नहीं, बल्कि उससे बड़ा एक ecosystem है
      संबंधित लेख: A brief history of graphs at Facebook
    • मैंने gdotv.com पर दर्जनों graph DBs integrate किए हैं, और उनमें से अधिकांश production-level हैं
      खासकर JanusGraph जैसी पुरानी technologies आज भी enterprises में लगातार उपयोग हो रही हैं
  • आजकल AI/LLM boom की लहर पर सवार graph DBs की संख्या 25 तक पहुँच गई है
    Rust में लिखो तो HN पर ध्यान मिलता है, लेकिन LadybugDB ने वैसा न करने का फैसला किया
    इसके बजाय वे incremental improvement और सिर्फ strongly-typed Cypher पर ध्यान देना चाहते हैं
    संबंधित चर्चा: LadybugDB Discussion #141

    • क्या LadybugDB भी उन 25 projects में से एक नहीं है?
    • language से ज्यादा product की maturity ही customers बनाती है, इस लिहाज़ से यह अच्छा फैसला है
    • language debate उबाऊ हो चुकी है, लेकिन DB development में Rust के concurrency और data corruption prevention के लिहाज़ से वास्तविक फायदे हैं
      इसे सिर्फ ‘भावना’ नहीं, बल्कि technical basis पर आँकना चाहिए
  • Grafeo निश्चित रूप से AI-assisted project है
    code की मात्रा बहुत है, लेकिन यह सिर्फ साधारण AI-generated output जैसा नहीं लगता, और design भी अनोखा है
    JS tests पूरी तरह AI-generated लगते हैं, और कुछ sub-repos की quality असमान है
    Apache 2.0 license और features के लिहाज़ से यह दिलचस्प है, लेकिन लगता है कि इसे और अधिक maintainers की ज़रूरत है

  • Helix DB की तुलना में इसमें क्या अंतर है, यह जानना चाहूँगा
    और यह भी सवाल है कि आखिर GraphQL से DB query क्यों करनी चाहिए

  • “graph-bench से LDBC benchmark टेस्ट किया” यह वाक्य ऐसे लगता है मानो वह कोई independent benchmark हो
    अगर यह self-made tool है, तो इसे स्पष्ट बताना चाहिए, और feedback लेकर ऐसा बनाना चाहिए कि दूसरे projects की भी fair comparison हो सके

    • शायद वह वाक्य भी AI ने अपने-आप लिखा होगा
      हाल में HN पर बार-बार दिखने वाले AI-generated codebases का यह एक typical pattern है
      अगर हर हफ्ते 100k lines से अधिक commit हो रही हैं, तो यह संभावना कम है कि इंसान code की सामग्री को ठीक से समझ रहा हो
  • मैंने Grafeo और इसकी related library grafeo_langchain को local Ollama model के साथ इस्तेमाल करके देखा
    नतीजा लगभग आधी सफलता जैसा रहा
    फिर भी मैं Python-आधारित Kuzu graph DB को पसंद करता हूँ और इस्तेमाल कर रहा हूँ

    • क्या gdotv.com पर Kuzu इस्तेमाल किया गया है?
      Kuzu अब और develop नहीं हो रहा, लेकिन यह stable है, इसलिए support बनाए रखा गया है
      LadybugDB (main fork) में migration भी आसान है, इसलिए इस पर विचार किया जा सकता है