打印空值的一部分

Print portion of null value

我正在处理泰坦尼克数据集。我想知道如何显示火车集中的部分空值。

这是我的代码:`

train_count_of_missval_by_col = (train.isnull().sum())
print('----- all columns along with count of missing value')
print(train_count_of_missval_by_col)
print('----only columns which has missing values----')
print(train_count_of_missval_by_col[train_count_of_missval_by_col>0])
print('----only columns which has missing data to total observations----')
print(train_count_of_missval_by_col[train_count_of_missval_by_col>0]/train.shape[])`

不幸的是,代码的最后一行产生了错误。在最后一行添加/编辑什么以便代码可以工作?

不知道有没有具体的操作。 info() 显示原始 # 并告诉您总行数,但没有 % 参数。 .info() returns 作为 None 类型的对象,因此您无法访问该对象的任何数据。

我建议遍历列并返回 #null 除以总行数 df[col].isnull().sum() / df.shape[0] * 100 并以格式化字符串打印输出:

d = {'Col1': [np.nan, 6, np.nan, 2, np.nan],
     'Col2': [np.nan, 3, 5, np.nan, 9],
     'Col3': [2, 1, 8, np.nan, 9]}
df = pd.DataFrame(d)
for col in df.columns:
    print(col, f'{df[col].isnull().sum() / df.shape[0] * 100} % NULL')

Col1 60.0 % NULL
Col2 40.0 % NULL
Col3 20.0 % NULL