检查两个 scipy.sparse.csr_matrix 是否相等

Check if two scipy.sparse.csr_matrix are equal

我想检查两个 csr_matrix 是否相等。

如果我这样做:

x.__eq__(y)

我得到:

raise ValueError("The truth value of an array with more than one "
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all().

但是,这个效果很好:

assert (z in x for z in y)

有更好的方法吗?也许改用一些 scipy 优化函数?

非常感谢

我们可以假设它们的形状相同吗?

In [202]: a=sparse.csr_matrix([[0,1],[1,0]])
In [203]: b=sparse.csr_matrix([[0,1],[1,1]])
In [204]: (a!=b).nnz==0   
Out[204]: False

这会检查不等式数组的稀疏性。

如果您尝试a==b(至少是您第一次使用它),它会给您一个效率警告。那是因为它必须测试所有这些零。它不能充分利用稀疏性。

您需要相对较新的版本才能使用这样的逻辑运算符。您是否尝试在某些 if 表达式中使用 x.__eq__(y),或者您是否仅从该表达式中得到错误?

一般来说,您可能想先检查几个参数。相同 shape,相同 nnz,相同 dtype。你需要小心花车。

对于密集数组 np.allclose 是测试相等性的好方法。如果稀疏数组不是太大,那也可能很好

np.allclose(a.A, b.A)

allclose 使用 all(less_equal(abs(x-y), atol + rtol * abs(y)))。您可以使用 a-b,但我怀疑这也会给出效率警告。

SciPy 和 Numpy 混合方法

最适合我的情况是(使用通用代码示例):

bool_answer = np.arrays_equal(sparse_matrix_1.todense(), sparse_matrix_2.todense())

您可能需要注意 np.arrays_equal

中的 equal_nan 参数

以下文档参考帮助我实现了目标: CSR Sparse Matrix Methods CSC Sparse Matrix Methods Numpy arrays_equal method SciPy todense method