HugeGraph

維基百科,自由的百科全書
HugeGraph
首次發佈2017年8月15日,​6年前​(2017-08-15
程式語言JavaGremlin
類型圖數據庫
許可協議Apache許可證
網站hugegraph.github.io/hugegraph-doc/

HugeGraph是百度自主研發的一款圖數據庫,初用於百度安全事業部的反欺詐、黑產打擊業務,後逐步擴展完善,成為可以支持廣泛需求場景的通用圖數據庫,於2018年開源[1],是百度七大開源技術之一[2],百度人工智能產業鏈的一環[3]

HugeGraph簡介

HugeGraph是開源的分佈式圖數據庫(Graph Database)。[4] 支持關聯關係的在線查詢(OLTP)和離線分析(OLAP)。
HugeGraph圖數據庫的典型應用場景包括:深度關係探索、複雜關聯分析、路徑搜索、特徵抽取、數據聚類、社區檢測、知識圖譜等。

HugeGraph主要功能

HugeGraph圖數據庫支持主要功能包括:[5]

  • 支持標準的Apache Tinkerpop Gremlin圖查詢語言,支持屬性圖,可支持千億級規模關係數據;
  • 支持多種後端存儲(CassandraHBaseRocksDBMySQLPostgreSQLScyllaDB);
  • 支持多種索引(二級索引、範圍索引、全文索引、聯合索引,均無需依賴第三方索引庫);
  • 提供可視化的Web界面,可用於圖建模、數據導入、圖分析;
  • 提供導入工具支持從多種數據源中導入數據到圖中,支持的數據源包括:CSV、HDFS、關係型數據庫(MySQL、Oracle、SQL Server、PostgreSQL);
  • 支持REST接口,並提供10+種通用的圖算法;
  • 支持與Hadoop、Spark GraphX等大數據系統集成。

參考文獻