检索 SciPy 稀疏矩阵消耗的字节数
Retrieving the numer of bytes consumed by a SciPy sparse matrix
假设我想监控我的 SciPy 稀疏矩阵 mat
占用的内存。在 NumPy 中我会利用 nbytes
属性,但在 SciPy 中似乎没有那样的东西。
我怎样才能检索到这些信息?
我有稀疏矩阵X
In [605]: X
Out[605]:
<100x100 sparse matrix of type '<class 'numpy.float64'>'
with 1000 stored elements in Compressed Sparse Row format>
getsizeof
没有告诉我任何有用的信息
In [606]: import sys
In [607]: sys.getsizeof(X)
Out[607]: 28
对于存储在 3 个数组中的 csr
矩阵,稀疏数据和索引是:
In [612]: X.data.nbytes
Out[612]: 8000
In [613]: X.indices.nbytes
Out[613]: 4000
In [614]: X.indptr.nbytes
Out[614]: 404
因此,总计 space 是这些值的总和。
对于coo
格式
In [615]: Xc=X.tocoo()
In [616]: Xc.data.nbytes
Out[616]: 8000
In [617]: Xc.row.nbytes
Out[617]: 4000
In [618]: Xc.col.nbytes
Out[618]: 4000
我们可以根据 shape、dtype 和 nnz 计算这些值;例如8字节*1000、4字节*1000、4字节*X.shape[0]等
其他格式需要了解其数据存储方法(例如 lil
、dok
等)。
假设我想监控我的 SciPy 稀疏矩阵 mat
占用的内存。在 NumPy 中我会利用 nbytes
属性,但在 SciPy 中似乎没有那样的东西。
我怎样才能检索到这些信息?
我有稀疏矩阵X
In [605]: X
Out[605]:
<100x100 sparse matrix of type '<class 'numpy.float64'>'
with 1000 stored elements in Compressed Sparse Row format>
getsizeof
没有告诉我任何有用的信息
In [606]: import sys
In [607]: sys.getsizeof(X)
Out[607]: 28
对于存储在 3 个数组中的 csr
矩阵,稀疏数据和索引是:
In [612]: X.data.nbytes
Out[612]: 8000
In [613]: X.indices.nbytes
Out[613]: 4000
In [614]: X.indptr.nbytes
Out[614]: 404
因此,总计 space 是这些值的总和。
对于coo
格式
In [615]: Xc=X.tocoo()
In [616]: Xc.data.nbytes
Out[616]: 8000
In [617]: Xc.row.nbytes
Out[617]: 4000
In [618]: Xc.col.nbytes
Out[618]: 4000
我们可以根据 shape、dtype 和 nnz 计算这些值;例如8字节*1000、4字节*1000、4字节*X.shape[0]等
其他格式需要了解其数据存储方法(例如 lil
、dok
等)。