pandas 中的错误处理 ñ

Question

我正在编写一个读取 csv 文件并使用 pandas 库创建数据透视表的脚本 table。

我一直收到一个错误（'utf-8' 编解码器无法解码位置 6 中的字节 0xf1：无效的连续字节），我已链接回在其中一个名称中使用“ñ” csv 文件。

我已经搜索了几个小时试图找到一种方法来处理这个问题。我已经尝试在 pandas.read_csv 中包含编码类型，但没有成功。

这是我的代码：

df = pandas.read_csv(
            os.path.join(wd,'Birthday_%s.csv' % datesuffix),
            encoding='utf-8')
pivot = pandas.pivot_table(df,
            index=['ClientID','ClientName','Branch'],
            values=['EmailAddress'],
            aggfunc='count',
            margins=True)
pivotlocation = os.path.join(wd,'BirthdayPivot.csv')
pivot.to_csv(pivotlocation)

如有任何帮助，我们将不胜感激。

编辑：这是导致问题的相关行。

ClientID | ClientName    | Branch        | Name     | EmailAddress
5555     | ExampleClient | ExampleBranch | Avendaño | email@email.com

似乎是名称列（包含 'Avendaño'）导致了问题。

Answer 1

正确的编码可能是 'latin-1'，因此您可能需要考虑：

df = pandas.read_csv(
            os.path.join(wd,'Birthday_%s.csv' % datesuffix),
            encoding='latin-1')

pandas 中的错误处理 ñ

Error handling ñ in pandas

python

csv

pandas