[Python]; Parser error: Too many columns specified
[Python]; Parser error: Too many columns specified
我只想读取一个简单的 .csv 文件,其中 header 指定了列类型。
以下是代码:
import pandas as pd
url="https://www.dropbox.com/s/n6yt908tgetuq63/LasVegasTripAdvisorReviews-Dataset.csv?dl=0"
names=['User country','Nr. reviews','Nr. hotel reviews','Helpful
votes','Score','Period of stay','Traveler Type','Pool','Gym','Tennis
court','Spa','Casino','Free internet','Hotel name','Hotel stars','Nr.
rooms','User continent','Member years','Review month','Review weekday']
data=pd.read_csv(url, names=names, header=0, delimiter=';',
error_bad_lines=False)
print(data.shape)
输出:-
ParserError: Too many columns specified: expected 20 and found 2
P.S:URL是public可以访问
问题是 URL 没有直接指向 .csv
文件。它通向整个 html 页面。
您可以通过删除 names
参数看到这一点
pd.read_csv(url, header=0, delimiter=';', error_bad_lines=False)
这会成功执行,但在检查返回值时,您会看到 html 代码和 JavaScript 脚本。
您需要做的是确保提供实际的 csv 作为输入(尝试 .csv
文件的其他来源)
在 dropbox url 中只需将 0 替换为 1,如下所示
https://www.dropbox.com/s/n6yt908tgetuq63/LasVegasTripAdvisorReviews-Dataset.csv?dl=1
这使得文件可以直接下载
我只想读取一个简单的 .csv 文件,其中 header 指定了列类型。 以下是代码:
import pandas as pd
url="https://www.dropbox.com/s/n6yt908tgetuq63/LasVegasTripAdvisorReviews-Dataset.csv?dl=0"
names=['User country','Nr. reviews','Nr. hotel reviews','Helpful
votes','Score','Period of stay','Traveler Type','Pool','Gym','Tennis
court','Spa','Casino','Free internet','Hotel name','Hotel stars','Nr.
rooms','User continent','Member years','Review month','Review weekday']
data=pd.read_csv(url, names=names, header=0, delimiter=';',
error_bad_lines=False)
print(data.shape)
输出:-
ParserError: Too many columns specified: expected 20 and found 2
P.S:URL是public可以访问
问题是 URL 没有直接指向 .csv
文件。它通向整个 html 页面。
您可以通过删除 names
参数看到这一点
pd.read_csv(url, header=0, delimiter=';', error_bad_lines=False)
这会成功执行,但在检查返回值时,您会看到 html 代码和 JavaScript 脚本。
您需要做的是确保提供实际的 csv 作为输入(尝试 .csv
文件的其他来源)
在 dropbox url 中只需将 0 替换为 1,如下所示 https://www.dropbox.com/s/n6yt908tgetuq63/LasVegasTripAdvisorReviews-Dataset.csv?dl=1
这使得文件可以直接下载