Pandas 导入 csv - Probl.m 带单引号
Pandas import csv - Probl.m with a single quote
我正在尝试使用 pandas
读取 csv 文件:
pd.read_csv(path, sep=";", quoting=3)
但我得到一个错误:
CParserError: Error tokenizing data. C error: Expected 8 fields in line 442069, saw 9
如何将此文件读入 pandas
' DataFrame
?
在第一条评论后编辑:查看正确的行:
$ more +442065 contacts.txt
001-NM-001440;001-NM-368564;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;1
001-NPB-000649;001-NPB-440850; ;;N;N;N;0
001-NPB-000666;001-NPB-453937;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;0
001-NS-001217;001-CRM-469397;ASSISTANT(E);ASSISTANT(E);N;N;N;0
001-NS-001259;001-CRM-172012;ASSISTANT CHEF DE SECTEUR;;SECRETAIRE;N;N;N;0
001-MM-000288;001-MM-042968; ;;N;N;N;1
001-NYB-000005;286-INITOSM-33223; ;;N;N;N;0
001-NYB-000006;286-INITOSM-33230; ;;N;N;N;0
001-NYB-000011;001-NYB-312184;CONDUCTEUR DE TRAVAUX;CONDUCTEUR DE TRAVAUX;N;N;N;0
001-NYB-000011;001-NYB-1598768;CHEF DE CHANTIER;CHEF DE CHANTIER;N;N;N;0
001-NYB-000416;001-NYB-226960; ;;N;N;N;0
001-OLO-000171;286-INITOSM-33683;DIRECTEUR FINANCIER;DIRECTEUR FINANCIER;N;N;N;0
001-OLO-000192;001-OLO-033801;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;1
001-OLO-000259;286-INITOSM-33727;CONDUCTEUR DE TRAVAUX;CONDUCTEUR DE TRAVAUX;N;N;N;0
答:您的数据需要完整性检查和一些策略来检测 + 解决冲突案例
当然,这不是一件容易的事,但是 Pandas 可以轻松导入格式正确的正交数据。让你的输入进入一个可行的状态(通过句法解析器或理智预包装 suspicious 段到 "..." 等)& pandas
将它们加载到 DataFrame
.
Expected: 8-fields
Present: 1. 001-NS-001259;
2. 001-CRM-172012;
3. ASSISTANT CHEF DE SECTEUR;
4. ;
5. SECRETAIRE;
6. N;
7. N;
8. N;
9. 0
我正在尝试使用 pandas
读取 csv 文件:
pd.read_csv(path, sep=";", quoting=3)
但我得到一个错误:
CParserError: Error tokenizing data. C error: Expected 8 fields in line 442069, saw 9
如何将此文件读入 pandas
' DataFrame
?
在第一条评论后编辑:查看正确的行:
$ more +442065 contacts.txt
001-NM-001440;001-NM-368564;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;1
001-NPB-000649;001-NPB-440850; ;;N;N;N;0
001-NPB-000666;001-NPB-453937;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;0
001-NS-001217;001-CRM-469397;ASSISTANT(E);ASSISTANT(E);N;N;N;0
001-NS-001259;001-CRM-172012;ASSISTANT CHEF DE SECTEUR;;SECRETAIRE;N;N;N;0
001-MM-000288;001-MM-042968; ;;N;N;N;1
001-NYB-000005;286-INITOSM-33223; ;;N;N;N;0
001-NYB-000006;286-INITOSM-33230; ;;N;N;N;0
001-NYB-000011;001-NYB-312184;CONDUCTEUR DE TRAVAUX;CONDUCTEUR DE TRAVAUX;N;N;N;0
001-NYB-000011;001-NYB-1598768;CHEF DE CHANTIER;CHEF DE CHANTIER;N;N;N;0
001-NYB-000416;001-NYB-226960; ;;N;N;N;0
001-OLO-000171;286-INITOSM-33683;DIRECTEUR FINANCIER;DIRECTEUR FINANCIER;N;N;N;0
001-OLO-000192;001-OLO-033801;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;1
001-OLO-000259;286-INITOSM-33727;CONDUCTEUR DE TRAVAUX;CONDUCTEUR DE TRAVAUX;N;N;N;0
答:您的数据需要完整性检查和一些策略来检测 + 解决冲突案例
当然,这不是一件容易的事,但是 Pandas 可以轻松导入格式正确的正交数据。让你的输入进入一个可行的状态(通过句法解析器或理智预包装 suspicious 段到 "..." 等)& pandas
将它们加载到 DataFrame
.
Expected: 8-fields
Present: 1. 001-NS-001259;
2. 001-CRM-172012;
3. ASSISTANT CHEF DE SECTEUR;
4. ;
5. SECRETAIRE;
6. N;
7. N;
8. N;
9. 0