如何将单元格中的值转换为 Pandas 中的新列?
How to transform values from a cell into new columns in Pandas?
我的数据框如下所示:
+-------+-----------------------------------------+
| Image | Bounding Boxes |
+-------+-----------------------------------------+
| a.jpg | xyz 0.1 0.2 0.3 0.4 |
| b.jpg | xyz 0.1 0.2 0.3 0.4 ijk 0.4 0.3 0.2 0.1 |
+-------+-----------------------------------------+
这些边界框的值总是以五个为一组,其中值的意思是(按顺序)
- 边界框表示的标签的ID
- 边界框的 X 坐标(占图像宽度的百分比)
- 边界框的 Y 坐标(占图像高度的百分比)
- 图像的宽度(占整个图像的百分比)
- 图像的高度(占整个图像的百分比)
由于每行最多只有 5 个这样的对(并且至少为 0 个),我想将数据框转换为如下所示:
+-------+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+----+
| Image | L1 | x1 | y1 | w1 | h1 | L2 | x2 | y2 | w2 | h2 | ... | h5 |
+-------+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+----+
| a.jpg | xyz | 0.1 | 0.2 | 0.3 | 0.4 | | | | | | | |
| b.jpg | xyz | 0.1 | 0.2 | 0.3 | 0.4 | ijk | 0.4 | 0.3 | 0.2 | 0.1 | ... | |
+-------+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+----+
换句话说,每个 space 分隔值曾经在一列中,我希望它们拆分成一个新列。
问题
如何在 Pandas 中完成?
您可以只使用 str.split(' ', expand=True)
在 space 上拆分,然后与 Image
列合并:
new_df = df[['Image']].join(df['Bounding Boxes'].str.split(' ', expand=True))
>>> new_df
Image 0 1 2 3 4 5 6 7 8 9
0 a.jpg xyz 0.1 0.2 0.3 0.4 None None None None None
1 b.jpg xyz 0.1 0.2 0.3 0.4 ijk 0.4 0.3 0.2 0.1
之后您可以使用 new_df.columns = ['my', 'list', 'of', 'column', 'names']
或 new_df.rename(columns={'old column name':'desired column name'})
重命名您认为合适的列
我的数据框如下所示:
+-------+-----------------------------------------+
| Image | Bounding Boxes |
+-------+-----------------------------------------+
| a.jpg | xyz 0.1 0.2 0.3 0.4 |
| b.jpg | xyz 0.1 0.2 0.3 0.4 ijk 0.4 0.3 0.2 0.1 |
+-------+-----------------------------------------+
这些边界框的值总是以五个为一组,其中值的意思是(按顺序)
- 边界框表示的标签的ID
- 边界框的 X 坐标(占图像宽度的百分比)
- 边界框的 Y 坐标(占图像高度的百分比)
- 图像的宽度(占整个图像的百分比)
- 图像的高度(占整个图像的百分比)
由于每行最多只有 5 个这样的对(并且至少为 0 个),我想将数据框转换为如下所示:
+-------+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+----+
| Image | L1 | x1 | y1 | w1 | h1 | L2 | x2 | y2 | w2 | h2 | ... | h5 |
+-------+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+----+
| a.jpg | xyz | 0.1 | 0.2 | 0.3 | 0.4 | | | | | | | |
| b.jpg | xyz | 0.1 | 0.2 | 0.3 | 0.4 | ijk | 0.4 | 0.3 | 0.2 | 0.1 | ... | |
+-------+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+----+
换句话说,每个 space 分隔值曾经在一列中,我希望它们拆分成一个新列。
问题
如何在 Pandas 中完成?
您可以只使用 str.split(' ', expand=True)
在 space 上拆分,然后与 Image
列合并:
new_df = df[['Image']].join(df['Bounding Boxes'].str.split(' ', expand=True))
>>> new_df
Image 0 1 2 3 4 5 6 7 8 9
0 a.jpg xyz 0.1 0.2 0.3 0.4 None None None None None
1 b.jpg xyz 0.1 0.2 0.3 0.4 ijk 0.4 0.3 0.2 0.1
之后您可以使用 new_df.columns = ['my', 'list', 'of', 'column', 'names']
或 new_df.rename(columns={'old column name':'desired column name'})