LFR 基准与随机块模型

LFR Benchmark versus Stochastic Block Model

谁能帮我理解 LFR 基准和随机块模型之间的区别。我正在尝试比较人工和真实数据集上的社区检测算法,在人工部分我不知道哪个基准生成器更合理?

LFR 模型旨在重现在真实网络中观察到的某些拓扑特性:社区的大小呈幂律分布,节点度数也呈幂律分布。称为混合系数的参数允许控制节点在其他社区中拥有的邻居的平均比例。

随机块模型更通用,从某种意义上说,它可用于产生其他形式的网络(例如,多部分或核心-外围而不是社区结构)。用户为每对社区(resp。每个社区)指定社区之间(resp。内部)的链接密度。社区的大小不强制为幂律分布。您不直接控制学位分布。

LFR 模型应该更真实,这意味着它被定义为模仿在某些真实世界网络中观察到的特征。它旨在为社区检测生成基准。相比之下,块模型首先用于社会学,作为描述关于现实世界网络结构的一些假设的一种方式。最近,随机块模型被用于获得关于社区检测问题和该问题的一些解决方法的分析结果(例如,识别一种方法理论上可以找到精确分区的参数范围)。

就个人而言,当我需要对社区检测算法进行一些经验比较时,我在工作中使用了 LFR。