将 Excel 电子表格导入 Pandas DataFrame 后单元格中缺少换行符
Missing line breaks in cells after importing Excel spreadsheet into Pandas DataFrame
我正在使用 Python Pandas 将 Excel 电子表格 (xlsx) 导入数据框。 Excel 电子表格的某些列中包含文本。下面给出了一个包含多行文本的示例单元格:
document belongs to family 13:
claims are important.
description discloses a bycicle with 3 wheels.
assigne is well known Trudi Bikes Inc.
单元格包含换行符。该示例有 4 行。问题是在将跨页导入数据框时换行符丢失了。所有行合并为一行。
据我所知Excel添加带有特殊字符CHR(10)等的换行符。
因此我的问题是:在将电子表格(或换行符)导入 pandas 数据框时,有没有办法保留这些特殊字符? 我会'介意在数据框单元格的字符串中有类似转义序列的东西。
此致,
文茨
通过这种方式,我将 \n
保留在 df:
df = pd.read_excel(yourfile, 'Sheet1')
输出:
col1 col2 col3
0 hello\ncome in\ngo hello hi
1 bye bye bye bye\nbye
我正在使用 Python Pandas 将 Excel 电子表格 (xlsx) 导入数据框。 Excel 电子表格的某些列中包含文本。下面给出了一个包含多行文本的示例单元格:
document belongs to family 13:
claims are important.
description discloses a bycicle with 3 wheels.
assigne is well known Trudi Bikes Inc.
单元格包含换行符。该示例有 4 行。问题是在将跨页导入数据框时换行符丢失了。所有行合并为一行。
据我所知Excel添加带有特殊字符CHR(10)等的换行符。
因此我的问题是:在将电子表格(或换行符)导入 pandas 数据框时,有没有办法保留这些特殊字符? 我会'介意在数据框单元格的字符串中有类似转义序列的东西。
此致,
文茨
通过这种方式,我将 \n
保留在 df:
df = pd.read_excel(yourfile, 'Sheet1')
输出:
col1 col2 col3
0 hello\ncome in\ngo hello hi
1 bye bye bye bye\nbye