无法在 weka 中加载 CSV 文件
Not able to load CSV file in weka
我无法使用 weka 加载 csv 文件,我已经删除了每个特殊符号,甚至使用文本编辑器,仍然没有成功。我附上文件,如果能解决这个问题,我将不胜感激。
显示"Wrong number of values, Read 31, expected 27, read token[EOL], line 3"
link : https://drive.google.com/open?id=0By7zyIPDD6HJMmthWnZLSUk5aFE
您的文件中有许多空白字段,如果您将其下载为 .csv,即使 header 的末尾也有三个逗号。
例如你的第 6 行:
,Doug Walker,,,131,,Rob Walker,131,,Documentary,Doug Walker,Star Wars: Episode VII The Force Awakens ,8,143,,0,,,,,,,,,12,7.1,,0,,,
与此post中的建议类似,您可以尝试s.th。像 notepad++ 或其他文本编辑器一样,将“,”替换为“,?,”以填补您的空白。
Convert NA values to ? automatically while loading
我这样做了,然后你在第一行得到了两个问号作为列名,这显然不起作用,所以将第一行更改为如下所示:
color,director_name,num_critic_for_reviews,duration,director_facebook_likes,actor_3_facebook_likes,actor_2_name,actor_1_facebook_likes,gross,genres,actor_1_name,movie_title,num_voted_users,cast_total_facebook_likes,actor_3_name,facenumber_in_poster,plot_keywords,?,num_user_for_reviews,language,country,content_rating,budget,title_year,actor_2_facebook_likes,imdb_score,aspect_ratio,movie_facebook_likes,additionalColName1,additionalColName2,additionalColName3
如果您现在尝试导入数据,weka 会开始告诉您它不喜欢哪些行以及原因。顺便提一句。你没有"removed each and every special symbol"!
使用例如删除 fiew 行后它起作用的 Ç 字符。
这只是一个丑陋的解决方法,尝试填充空值并找到一个正则表达式或更好的方法来保存您的文件以删除每行的最后三个逗号,我现在太懒了。但我可以将它加载到 weka 中,这就是你想要的 (:
我无法使用 weka 加载 csv 文件,我已经删除了每个特殊符号,甚至使用文本编辑器,仍然没有成功。我附上文件,如果能解决这个问题,我将不胜感激。
显示"Wrong number of values, Read 31, expected 27, read token[EOL], line 3"
link : https://drive.google.com/open?id=0By7zyIPDD6HJMmthWnZLSUk5aFE
您的文件中有许多空白字段,如果您将其下载为 .csv,即使 header 的末尾也有三个逗号。 例如你的第 6 行:
,Doug Walker,,,131,,Rob Walker,131,,Documentary,Doug Walker,Star Wars: Episode VII The Force Awakens ,8,143,,0,,,,,,,,,12,7.1,,0,,,
与此post中的建议类似,您可以尝试s.th。像 notepad++ 或其他文本编辑器一样,将“,”替换为“,?,”以填补您的空白。
Convert NA values to ? automatically while loading
我这样做了,然后你在第一行得到了两个问号作为列名,这显然不起作用,所以将第一行更改为如下所示:
color,director_name,num_critic_for_reviews,duration,director_facebook_likes,actor_3_facebook_likes,actor_2_name,actor_1_facebook_likes,gross,genres,actor_1_name,movie_title,num_voted_users,cast_total_facebook_likes,actor_3_name,facenumber_in_poster,plot_keywords,?,num_user_for_reviews,language,country,content_rating,budget,title_year,actor_2_facebook_likes,imdb_score,aspect_ratio,movie_facebook_likes,additionalColName1,additionalColName2,additionalColName3
如果您现在尝试导入数据,weka 会开始告诉您它不喜欢哪些行以及原因。顺便提一句。你没有"removed each and every special symbol"! 使用例如删除 fiew 行后它起作用的 Ç 字符。
这只是一个丑陋的解决方法,尝试填充空值并找到一个正则表达式或更好的方法来保存您的文件以删除每行的最后三个逗号,我现在太懒了。但我可以将它加载到 weka 中,这就是你想要的 (: