数据框中有多少行包含问号符号
How many rows in dataframe contain question mark symbol
我有一个由 csv 制作的数据框,其中缺失的数据用 ?象征。我想检查其中有多少行?出现次数。
到目前为止,我做了这个,但它显示了所有行的数量,而不仅仅是其中的行数?发生。
print(sum([True for idx,row in df.iterrows() if
any(row.str.contains('[?]'))]))
您可以使用 apply
+ str.contains
,假设您的所有列都是字符串。
c = np.sum(df.apply(lambda x: x.str.contains('\?')).values)
如果您只需要 select 字符串列,请使用 select_dtypes
-
i = df.select_dtypes(exclude=['number']).apply(lambda x: x.str.contains('\?'))
c = np.sum(i.values)
或者,要查找其中包含 ?
的 行 ,请使用
c = df.apply(lambda x: x.str.contains('\?')).any(axis=1).sum()
演示 -
df
A B
0 aaa ?xyz
1 bbb que!?
2 ? ddd
3 foo? fff
df.apply(lambda x: x.str.contains('\?')).any(1).sum()
4
我有一个由 csv 制作的数据框,其中缺失的数据用 ?象征。我想检查其中有多少行?出现次数。 到目前为止,我做了这个,但它显示了所有行的数量,而不仅仅是其中的行数?发生。
print(sum([True for idx,row in df.iterrows() if
any(row.str.contains('[?]'))]))
您可以使用 apply
+ str.contains
,假设您的所有列都是字符串。
c = np.sum(df.apply(lambda x: x.str.contains('\?')).values)
如果您只需要 select 字符串列,请使用 select_dtypes
-
i = df.select_dtypes(exclude=['number']).apply(lambda x: x.str.contains('\?'))
c = np.sum(i.values)
或者,要查找其中包含 ?
的 行 ,请使用
c = df.apply(lambda x: x.str.contains('\?')).any(axis=1).sum()
演示 -
df
A B
0 aaa ?xyz
1 bbb que!?
2 ? ddd
3 foo? fff
df.apply(lambda x: x.str.contains('\?')).any(1).sum()
4