如何转换或解码pandas DataFrame中的Unicode字符?

How to convert or decode the Unicode characters in pandas DataFrame?

我正在使用 pandas 从 excel 文件中读取一些数据,并进行了一些行遍历以生成 python 字典,然后将其放入 json 文件中.

问题是我在 json 文件本身中获取了 Unicode 字符:

"C V M College of Fine Arts,\u00a0 Vallabh Vidyanagar"

如上所示,我不想要 Unicode '\u00a0',而是想要它在我的 json 文件中的解码字符表示。

有什么方法可以在从 pandas 本身读取 excel 文件的同时进行这种转换(或过滤或其他任何调用)?或者在使用 json.dump() 写入 json 文件时有什么方法可以做到这一点?

使用json.dumps(..., ensure_ascii=False):

foo = "C V M College of Fine Arts,\u00a0 Vallabh Vidyanagar"

import json
print(json.dumps({'foo':foo}, ensure_ascii=False))

returns:

{"foo": "C V M College of Fine Arts,  Vallabh Vidyanagar"}