在数据框中的 json 记录中查找空值

Finding null values in a json record in a dataframe

假设我们有一个具有以下格式的数据框:

col1
{'overall_mean': '93.07', 'overall_median': '91.05'}
{}
{'overall_mean': '91.02', 'overall_median': '95.03'}

原始数据为json格式。我想从每一行中提取一些元素,这是我尝试过的:

 df['col1'].apply(lambda col: col['overall_mean'])

如果我们在字典中有那个元素,一切都很好,但如果我们没有,它就会抱怨,这是有道理的。然后我改成了这个:

 df['col1'].apply(lambda col: None if len(col['overall_mean']) == 1 else col['overall_mean'])

之所以选择这个条件 len(col['overall_mean']) == 1 是因为这是 returns True 的唯一条件。但是它仍然找不到那些空值。

为什么不直接使用字典的 get 方法呢?如果键不在字典中,它将 return None:

df.col1.map(lambda x: x.get('overall_mean'))

#0    93.07
#1     None
#2    91.02
#Name: col1, dtype: object

或者:df.col1.apply(lambda x: x.get('overall_mean'))

来自@Psidom 的不错的解决方案。只需从评论中复制一个使用列表推导的替代方法

df['col1'].apply(lambda col: col['overall_mean'] if 'overall_mean' in col else None)