将日期添加到新列 returns 错误
Adding date to new columns returns error
我正在尝试向我的文件中添加一个新列。我想将日期添加到文件的每一行。
文件名为:2016-06-15.txt
我的文件的架构是:
A B C
7 8 13
我要获取:
Date A B C
2016-06-15 7 8 13
为此,我使用 Pig 和以下脚本:
A = LOAD 'user/cloudera/Analytics/source/file.txt' using PigStorage(' ','-tagPath');
DUMP A ; ****--> ERROR****
STORE A INTO 'user/cloudera/Analytics/source/file.txt' USING PigStorage(' '); ****--> ERROR****
但是我遇到了一个错误,而且我没有任何可用的日志 :( 谁能帮忙?非常感谢!
您必须使用 -tagFile 选项来获取文件名作为第一个字段。
在检查以确保文件路径是 correct.Looks 之前,就像文件开头缺少正斜杠一样 path.Ensure 您在 PigStorage.Seems 中使用了正确的分隔符,例如列由一个选项卡或多个选项卡 spaces.Lastly 选择不同的文件夹来存储新文件,否则您将收到文件存在错误。
A = LOAD '/user/cloudera/Analytics/source/2016-06-15.txt' using PigStorage(' ','-tagFile');
STORE A INTO '/user/cloudera/Analytics/NEW_source/2016-06-15.txt' USING PigStorage(' ');
我正在尝试向我的文件中添加一个新列。我想将日期添加到文件的每一行。
文件名为:2016-06-15.txt
我的文件的架构是:
A B C
7 8 13
我要获取:
Date A B C
2016-06-15 7 8 13
为此,我使用 Pig 和以下脚本:
A = LOAD 'user/cloudera/Analytics/source/file.txt' using PigStorage(' ','-tagPath');
DUMP A ; ****--> ERROR****
STORE A INTO 'user/cloudera/Analytics/source/file.txt' USING PigStorage(' '); ****--> ERROR****
但是我遇到了一个错误,而且我没有任何可用的日志 :( 谁能帮忙?非常感谢!
您必须使用 -tagFile 选项来获取文件名作为第一个字段。 在检查以确保文件路径是 correct.Looks 之前,就像文件开头缺少正斜杠一样 path.Ensure 您在 PigStorage.Seems 中使用了正确的分隔符,例如列由一个选项卡或多个选项卡 spaces.Lastly 选择不同的文件夹来存储新文件,否则您将收到文件存在错误。
A = LOAD '/user/cloudera/Analytics/source/2016-06-15.txt' using PigStorage(' ','-tagFile');
STORE A INTO '/user/cloudera/Analytics/NEW_source/2016-06-15.txt' USING PigStorage(' ');