如何将单元格中的值转换为 Pandas 中的新列?

How to transform values from a cell into new columns in Pandas?

我的数据框如下所示:

+-------+-----------------------------------------+
| Image | Bounding Boxes                          |
+-------+-----------------------------------------+
| a.jpg | xyz 0.1 0.2 0.3 0.4                     |
| b.jpg | xyz 0.1 0.2 0.3 0.4 ijk 0.4 0.3 0.2 0.1 |
+-------+-----------------------------------------+

这些边界框的值总是以五个为一组,其中值的意思是(按顺序)

由于每行最多只有 5 个这样的对(并且至少为 0 个),我想将数据框转换为如下所示:

+-------+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+----+
| Image | L1  | x1  | y1  | w1  | h1  | L2  | x2  | y2  | w2  | h2  | ... | h5 |
+-------+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+----+
| a.jpg | xyz | 0.1 | 0.2 | 0.3 | 0.4 |     |     |     |     |     |     |    |
| b.jpg | xyz | 0.1 | 0.2 | 0.3 | 0.4 | ijk | 0.4 | 0.3 | 0.2 | 0.1 | ... |    |
+-------+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+----+

换句话说,每个 space 分隔值曾经在一列中,我希望它们拆分成一个新列。

问题

如何在 Pandas 中完成?

您可以只使用 str.split(' ', expand=True) 在 space 上拆分,然后与 Image 列合并:

new_df = df[['Image']].join(df['Bounding Boxes'].str.split(' ', expand=True))

>>> new_df
   Image    0    1    2    3    4     5     6     7     8     9
0  a.jpg  xyz  0.1  0.2  0.3  0.4  None  None  None  None  None
1  b.jpg  xyz  0.1  0.2  0.3  0.4   ijk   0.4   0.3   0.2   0.1

之后您可以使用 new_df.columns = ['my', 'list', 'of', 'column', 'names']new_df.rename(columns={'old column name':'desired column name'})

重命名您认为合适的列