如何使用 networkx + python 枚举图形中的所有 *maximal* cliques?

How do I enumerate all *maximal* cliques in a graph using networkx + python?

如果您查看 https://en.wikipedia.org/wiki/Clique_problem,您会注意到派系和最大派系之间存在区别。一个最大的团只包含在它自己之外的任何其他团中。所以我想要那些小团体,但 networkx 似乎只提供:

networkx.algorithms.clique.enumerate_all_cliques(G)

所以我尝试了一个简单的循环过滤机制(见下文)。

def filter_cliques(self, cliques):
    # TODO: why do we need this?  Post in forum...
    res = []
    for C in cliques:
        C = set(C)
        for D in res:
            if C.issuperset(D) and len(C) != len(D):
                res.remove(D)
                res.append(C)
                break
            elif D.issuperset(C):
                break
        else:
            res.append(C)
    res1 = []
    for C in res:
        for D in res1:
            if C.issuperset(D) and len(C) != len(D):
                res1.remove(D)
                res1.append(C)
            elif D.issuperset(C):
                break
        else:
            res1.append(C)     
    return res1

我想过滤掉所有合适的子集团。但正如你所看到的那样,它很糟糕,因为我不得不过滤它两次。这不是很优雅。因此,问题是,给定对象列表(整数、字符串)的列表,它们是图中的节点标签; enumerate_all_cliques(G) returns 正是这个标签列表列表。现在,给定这个列表列表,过滤掉所有适当的子集团。例如:

[[a, b, c], [a, b], [b, c, d]] => [[a, b, c], [b, c, d]]

最快的 pythonic 方法是什么?

有一个函数:networkx.algorithms.clique.find_cliques,是的,尽管名称中没有 "maximal",但它只 return 最大派系。它应该 运行 比任何过滤方法都快得多。

如果您觉得名称令人困惑(我也是),您可以重命名它:

from networkx.algorithms.clique import find_cliques as maximal_cliques