如何使用 networkx + python 枚举图形中的所有 *maximal* cliques?
How do I enumerate all *maximal* cliques in a graph using networkx + python?
如果您查看 https://en.wikipedia.org/wiki/Clique_problem,您会注意到派系和最大派系之间存在区别。一个最大的团只包含在它自己之外的任何其他团中。所以我想要那些小团体,但 networkx 似乎只提供:
networkx.algorithms.clique.enumerate_all_cliques(G)
所以我尝试了一个简单的循环过滤机制(见下文)。
def filter_cliques(self, cliques):
# TODO: why do we need this? Post in forum...
res = []
for C in cliques:
C = set(C)
for D in res:
if C.issuperset(D) and len(C) != len(D):
res.remove(D)
res.append(C)
break
elif D.issuperset(C):
break
else:
res.append(C)
res1 = []
for C in res:
for D in res1:
if C.issuperset(D) and len(C) != len(D):
res1.remove(D)
res1.append(C)
elif D.issuperset(C):
break
else:
res1.append(C)
return res1
我想过滤掉所有合适的子集团。但正如你所看到的那样,它很糟糕,因为我不得不过滤它两次。这不是很优雅。因此,问题是,给定对象列表(整数、字符串)的列表,它们是图中的节点标签; enumerate_all_cliques(G)
returns 正是这个标签列表列表。现在,给定这个列表列表,过滤掉所有适当的子集团。例如:
[[a, b, c], [a, b], [b, c, d]] => [[a, b, c], [b, c, d]]
最快的 pythonic 方法是什么?
有一个函数:networkx.algorithms.clique.find_cliques
,是的,尽管名称中没有 "maximal",但它只 return 最大派系。它应该 运行 比任何过滤方法都快得多。
如果您觉得名称令人困惑(我也是),您可以重命名它:
from networkx.algorithms.clique import find_cliques as maximal_cliques
如果您查看 https://en.wikipedia.org/wiki/Clique_problem,您会注意到派系和最大派系之间存在区别。一个最大的团只包含在它自己之外的任何其他团中。所以我想要那些小团体,但 networkx 似乎只提供:
networkx.algorithms.clique.enumerate_all_cliques(G)
所以我尝试了一个简单的循环过滤机制(见下文)。
def filter_cliques(self, cliques):
# TODO: why do we need this? Post in forum...
res = []
for C in cliques:
C = set(C)
for D in res:
if C.issuperset(D) and len(C) != len(D):
res.remove(D)
res.append(C)
break
elif D.issuperset(C):
break
else:
res.append(C)
res1 = []
for C in res:
for D in res1:
if C.issuperset(D) and len(C) != len(D):
res1.remove(D)
res1.append(C)
elif D.issuperset(C):
break
else:
res1.append(C)
return res1
我想过滤掉所有合适的子集团。但正如你所看到的那样,它很糟糕,因为我不得不过滤它两次。这不是很优雅。因此,问题是,给定对象列表(整数、字符串)的列表,它们是图中的节点标签; enumerate_all_cliques(G)
returns 正是这个标签列表列表。现在,给定这个列表列表,过滤掉所有适当的子集团。例如:
[[a, b, c], [a, b], [b, c, d]] => [[a, b, c], [b, c, d]]
最快的 pythonic 方法是什么?
有一个函数:networkx.algorithms.clique.find_cliques
,是的,尽管名称中没有 "maximal",但它只 return 最大派系。它应该 运行 比任何过滤方法都快得多。
如果您觉得名称令人困惑(我也是),您可以重命名它:
from networkx.algorithms.clique import find_cliques as maximal_cliques