Apache Pig - 在猪关系中加载时缺少数字数据
Apache Pig - Numeric data missing while loading in a pig relation
我正在学习 Apache Pig。我正在尝试将一些数据加载到猪中。当我在 vi 编辑器中看到 txt 文件时,我找到了以下(示例)行。
[ABBOTT,DEEDEE W GRADES 9-12 TEACHER 52,122.10 0 LBOE
ATLANTA INDEPENDENT SCHOOL SYSTEM 2010].
我使用以下命令将数据加载到猪关系中。
A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);
然而,当我在分布式环境中对 pig 进行转储时,我发现以下结果(针对上述行):
(ABBOTT,DEEDEE W,GRADES 9-12 TEACHER,,0.0,LBOE,ATLANTA INDEPENDENT
SCHOOL SYSTEM,2010).
数字数据 "52,122.10 "
似乎丢失了。
请帮忙。
PigStorage() 是 pig 中的内置函数,它以记录分隔符作为参数。这是它的选项卡 --> \t
A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage('\t') as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);
我正在学习 Apache Pig。我正在尝试将一些数据加载到猪中。当我在 vi 编辑器中看到 txt 文件时,我找到了以下(示例)行。
[ABBOTT,DEEDEE W GRADES 9-12 TEACHER 52,122.10 0 LBOE ATLANTA INDEPENDENT SCHOOL SYSTEM 2010].
我使用以下命令将数据加载到猪关系中。
A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);
然而,当我在分布式环境中对 pig 进行转储时,我发现以下结果(针对上述行):
(ABBOTT,DEEDEE W,GRADES 9-12 TEACHER,,0.0,LBOE,ATLANTA INDEPENDENT SCHOOL SYSTEM,2010).
数字数据 "52,122.10 "
似乎丢失了。
请帮忙。
PigStorage() 是 pig 中的内置函数,它以记录分隔符作为参数。这是它的选项卡 --> \t
A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage('\t') as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);