在数据框中的 json 记录中查找空值
Finding null values in a json record in a dataframe
假设我们有一个具有以下格式的数据框:
col1
{'overall_mean': '93.07', 'overall_median': '91.05'}
{}
{'overall_mean': '91.02', 'overall_median': '95.03'}
原始数据为json格式。我想从每一行中提取一些元素,这是我尝试过的:
df['col1'].apply(lambda col: col['overall_mean'])
如果我们在字典中有那个元素,一切都很好,但如果我们没有,它就会抱怨,这是有道理的。然后我改成了这个:
df['col1'].apply(lambda col: None if len(col['overall_mean']) == 1 else col['overall_mean'])
之所以选择这个条件 len(col['overall_mean']) == 1
是因为这是 returns True
的唯一条件。但是它仍然找不到那些空值。
为什么不直接使用字典的 get 方法呢?如果键不在字典中,它将 return None
:
df.col1.map(lambda x: x.get('overall_mean'))
#0 93.07
#1 None
#2 91.02
#Name: col1, dtype: object
或者:df.col1.apply(lambda x: x.get('overall_mean'))
来自@Psidom 的不错的解决方案。只需从评论中复制一个使用列表推导的替代方法
df['col1'].apply(lambda col: col['overall_mean'] if 'overall_mean' in col else None)
假设我们有一个具有以下格式的数据框:
col1
{'overall_mean': '93.07', 'overall_median': '91.05'}
{}
{'overall_mean': '91.02', 'overall_median': '95.03'}
原始数据为json格式。我想从每一行中提取一些元素,这是我尝试过的:
df['col1'].apply(lambda col: col['overall_mean'])
如果我们在字典中有那个元素,一切都很好,但如果我们没有,它就会抱怨,这是有道理的。然后我改成了这个:
df['col1'].apply(lambda col: None if len(col['overall_mean']) == 1 else col['overall_mean'])
之所以选择这个条件 len(col['overall_mean']) == 1
是因为这是 returns True
的唯一条件。但是它仍然找不到那些空值。
为什么不直接使用字典的 get 方法呢?如果键不在字典中,它将 return None
:
df.col1.map(lambda x: x.get('overall_mean'))
#0 93.07
#1 None
#2 91.02
#Name: col1, dtype: object
或者:df.col1.apply(lambda x: x.get('overall_mean'))
来自@Psidom 的不错的解决方案。只需从评论中复制一个使用列表推导的替代方法
df['col1'].apply(lambda col: col['overall_mean'] if 'overall_mean' in col else None)