打印空值的一部分
Print portion of null value
我正在处理泰坦尼克数据集。我想知道如何显示火车集中的部分空值。
这是我的代码:`
train_count_of_missval_by_col = (train.isnull().sum())
print('----- all columns along with count of missing value')
print(train_count_of_missval_by_col)
print('----only columns which has missing values----')
print(train_count_of_missval_by_col[train_count_of_missval_by_col>0])
print('----only columns which has missing data to total observations----')
print(train_count_of_missval_by_col[train_count_of_missval_by_col>0]/train.shape[])`
不幸的是,代码的最后一行产生了错误。在最后一行添加/编辑什么以便代码可以工作?
不知道有没有具体的操作。 info()
显示原始 # 并告诉您总行数,但没有 % 参数。 .info()
returns 作为 None
类型的对象,因此您无法访问该对象的任何数据。
我建议遍历列并返回 #null 除以总行数 df[col].isnull().sum() / df.shape[0] * 100
并以格式化字符串打印输出:
d = {'Col1': [np.nan, 6, np.nan, 2, np.nan],
'Col2': [np.nan, 3, 5, np.nan, 9],
'Col3': [2, 1, 8, np.nan, 9]}
df = pd.DataFrame(d)
for col in df.columns:
print(col, f'{df[col].isnull().sum() / df.shape[0] * 100} % NULL')
Col1 60.0 % NULL
Col2 40.0 % NULL
Col3 20.0 % NULL
我正在处理泰坦尼克数据集。我想知道如何显示火车集中的部分空值。
这是我的代码:`
train_count_of_missval_by_col = (train.isnull().sum())
print('----- all columns along with count of missing value')
print(train_count_of_missval_by_col)
print('----only columns which has missing values----')
print(train_count_of_missval_by_col[train_count_of_missval_by_col>0])
print('----only columns which has missing data to total observations----')
print(train_count_of_missval_by_col[train_count_of_missval_by_col>0]/train.shape[])`
不幸的是,代码的最后一行产生了错误。在最后一行添加/编辑什么以便代码可以工作?
不知道有没有具体的操作。 info()
显示原始 # 并告诉您总行数,但没有 % 参数。 .info()
returns 作为 None
类型的对象,因此您无法访问该对象的任何数据。
我建议遍历列并返回 #null 除以总行数 df[col].isnull().sum() / df.shape[0] * 100
并以格式化字符串打印输出:
d = {'Col1': [np.nan, 6, np.nan, 2, np.nan],
'Col2': [np.nan, 3, 5, np.nan, 9],
'Col3': [2, 1, 8, np.nan, 9]}
df = pd.DataFrame(d)
for col in df.columns:
print(col, f'{df[col].isnull().sum() / df.shape[0] * 100} % NULL')
Col1 60.0 % NULL
Col2 40.0 % NULL
Col3 20.0 % NULL