树结构数据的图形数据库或关系数据库

Graph database or relational database for tree structure data

我有公司按年持有分层结构的数据。例如A公司持有B公司50%的股份,B公司持有C公司50%的股份,D公司持有C公司50%的股份。每个公司都有自己的属性,比如行业。

写操作很少,读操作居多。具体地,从一组节点(根)开始,通过一定百分比的份额阈值向下追踪来提取家谱。家谱中有几个有趣的指标。

对于每个节点:

  1. 距根的深度
  2. 从根开始逐层分享的产品,例如A持有C的0.5*0.5 = 25%

每个级别:

  1. 每个根的份额分配
  2. 行业分布

请注意,每个节点可能有多个根,我们对所有节点都感兴趣。

目前,数据存储在关系数据库中,上述任务是通过连接完成的。像 neo4j 这样的图形数据库是否更适合数据和这项任务?问题的关键是要有一个合适的索引,这样就不用每次都加入。任何建议和指示将不胜感激。

Neo4j 很适合这里。

Neo4j 确实使用索引来查找图中的起点,例如您的根节点。如果您只是使用它来获取根节点,那么这就是整个查询的单个索引查找。

从那里开始,遍历树只是遍历关系,这只是指针跳跃节点引用 -> 关系引用 -> 节点引用等。不涉及连接。然后,您只需计算每条路径的节点中的数字即可获得百分比。

几乎任何图形数据库都可以为您描述的信息建模。构建查询以获得所需内容的方式在每个产品中都会有所不同。

在 InfiniteGraph 中,我们可以使用以下模式对信息进行建模:

UPDATE SCHEMA {
    CREATE CLASS Company {
        name        : String,
        industry    : String, 
        
        owns        : LIST {
                        element: Reference {
                            edgeClass       : Owns,
                            edgeAttribute   : owns
                        },
                        CollectionTypeName  : SegmentedArray
                    },
        ownedBy     : LIST {
                        element: Reference {
                            edgeClass       : Owns,
                            edgeAttribute   : ownedBy
                        },
                        CollectionTypeName  : SegmentedArray
                    }
        
    }
    
    CREATE CLASS Owns
    {
        percentage  : Real { Storage: B32 },
        owns        : Reference {referenced: Company, inverse: ownedBy },
        ownedBy     : Reference {referenced: Company,  inverse: owns }
    }
};

然后我们可以加载您在问题中提到的数据:

LET coA = CREATE Company { name: "A", industry: "Manufacturing" };
LET coB = CREATE Company { name: "B", industry: "Manufacturing" };
LET coC = CREATE Company { name: "C", industry: "Retail" };
LET coD = CREATE Company { name: "D", industry: "Construction" };

CREATE Owns { owns: $coB, ownedBy: $coA, percentage: 50.00 };
CREATE Owns { owns: $coC, ownedBy: $coB, percentage: 50.00 };
CREATE Owns { owns: $coC, ownedBy: $coD, percentage: 50.00 };

最后,我们可以定义一个权重计算器运算符,它可以有效地将沿路径的边权重相乘。在这里,我们将每条边的权重表示为 1/百分比,然后在最后我们再次翻转总和,这为我们提供了您正在寻找的值。

CREATE WEIGHT CALCULATOR wcOwnership {
    minimum:    0,
    default:    0, 
    edges: {
        (:Company)-[ow:Owns]->(:Company): 1/ow.percentage
    }
};

“边缘”部分定义了要匹配的边缘模式以及为计算该边缘的边缘权重而要执行的计算。在 InfiniteGraph 中,边权重不一定是属性;它可以是一个简单的属性,也可以是基于一个或多个对象的内容进行复杂计算的结果。

在给定的数据上,我们可以使用权重计算器从目标公司(C)向上查询层次结构,对于发现的每个根,我们可以显示目标(C)、所有权百分比、长度路径的名称,以及根公司的名称。这个特定的查询只有 1 到 10 度 ([*1..10]),但这个数字可以根据需要扩展。

  DO> Match m = max weight 1000.0 wcOwnership 
                    ((cTarget:Company {name == 'C'})-[*1..10]->(cRoot:Company)) 
                     return cTarget.name, 
                            1/Weight(m) as PercentageOwnership, 
                            Length(m), 
                            cRoot.name;

{
  _Projection
  {
    cTarget.name:'C',
    PercentageOwnership:50.0000,
    Length(m):1,
    cRoot.name:'B'
  },
  _Projection
  {
    cTarget.name:'C',
    PercentageOwnership:50.0000,
    Length(m):1,
    cRoot.name:'D'
  },
  _Projection
  {
    cTarget.name:'C',
    PercentageOwnership:25.0000,
    Length(m):2,
    cRoot.name:'A'
  }
}  

此模型将捕获每个相关公司的所有根节点。

#无限图