将日期添加到新列 returns 错误

Adding date to new columns returns error

我正在尝试向我的文件中添加一个新列。我想将日期添加到文件的每一行。

文件名为:2016-06-15.txt

我的文件的架构是:

A  B  C
7  8  13

我要获取:

Date        A  B  C
2016-06-15  7  8  13

为此,我使用 Pig 和以下脚本:

A = LOAD 'user/cloudera/Analytics/source/file.txt' using PigStorage(' ','-tagPath');
DUMP A ;   ****--> ERROR****
STORE A INTO 'user/cloudera/Analytics/source/file.txt' USING PigStorage(' ');  ****--> ERROR****

但是我遇到了一个错误,而且我没有任何可用的日志 :( 谁能帮忙?非常感谢!

您必须使用 -tagFile 选项来获取文件名作为第一个字段。 在检查以确保文件路径是 correct.Looks 之前,就像文件开头缺少正斜杠一样 path.Ensure 您在 PigStorage.Seems 中使用了正确的分隔符,例如列由一个选项卡或多个选项卡 spaces.Lastly 选择不同的文件夹来存储新文件,否则您将收到文件存在错误。

A = LOAD '/user/cloudera/Analytics/source/2016-06-15.txt' using PigStorage(' ','-tagFile');
STORE A INTO '/user/cloudera/Analytics/NEW_source/2016-06-15.txt' USING PigStorage(' ');