如何 explode/split 嵌套列表，在 pandas 数据框列内的列表中，并从中创建单独的列？

Question

我有一个数据框。我想将 Options 列拆分为 id、AUD、ud。

id col1 col2  Options
1  A    B   [{'id':25,'X': {'AUD': None, 'ud':0}}] 
2  C    D   [{'id':27,'X': {'AUD': None, 'ud':0}}] 
3  E    F   [{'id':28,'X': {'AUD': None, 'ud':0}}] 
4  G    H   [{'id':29,'X': {'AUD': None, 'ud':0}}]

预期输出数据帧：

id col1 col2 id   Aud   ud
1  A      B   25  None  0
2  C      D   27  None  0
3  E      F   28  None  0
4  G      H   29  None  0

你如何使用 python3.6 和 pandas 数据框来实现它？

Answer 1

将列表理解与 json_normalize 一起使用以获得 DataFrames 并通过 concat, also added DataFrame.add_prefix 连接在一起以避免重复的列名称：

from pandas.io.json import json_normalize
import ast

L = [json_normalize(x) for x in df.pop('Options')]
#if strings instead dicts
#L = [json_normalize(ast.literal_eval(x)) for x in df.pop('Options')]

df = df.join(pd.concat(L, ignore_index=True, sort=False).add_prefix('opt_'))
print (df)
   id col1 col2  opt_id opt_X.AUD  opt_X.ud
0   1    A    B      25      None         0
1   2    C    D      27      None         0
2   3    E    F      28      None         0
3   4    G    H      29      None         0

另一种提取嵌套字典 X 值的解决方案：

L = [{k: v for y in ast.literal_eval(x) for k, v in {**y.pop('X'), **y}.items()} 
           for x in df.pop('Options')]

df = df.join(pd.DataFrame(L, index=df.index).add_prefix('opt_'))
print (df)
   id col1 col2 opt_AUD  opt_ud  opt_id
0   1    A    B    None       0      25
1   2    C    D    None       0      27
2   3    E    F    None       0      28
3   4    G    H    None       0      29

Answer 2

试试这个：

for dit in df['Options'].iteritems():
    df.loc[dit[0],'id'] = dit[1][0]['id']
    df.loc[dit[0],'Aud'] = dit[1][0]['X']['AUD']
    df.loc[dit[0],'ud'] = dit[1][0]['X']['ud']

如何 explode/split 嵌套列表，在 pandas 数据框列内的列表中，并从中创建单独的列？

How to explode/split a nested list, inside a list inside a pandas dataframe column and make separate columns out of them?

nested-lists

dataframe

python-3.x

pandas