蜂巢数据加载
Hive data loading
我有一个数据集,它是制表符分隔的,并且行以换行符终止。每行包含 5 个制表符分隔的数据。
例如数据集,
XXXX1 XXXX2 XXXX3 XXXX4 XXXX5
现在我必须创建一个包含 3 列的 table,前两列将分别存储值 XXXX1
和 XXXX2
,第一行和第三列应包含剩余值 XXXX3 XXXX4 XXXX5
.
我使用以下查询创建了 table,但在第三列中仅保留 XXXX3
,其余两个数据未加载到 table。
create table x(
id string, name string,country string, emails string
) row format delimited fields terminated by '\t';
求推荐。
tblproperties ('serialization.last.column.takes.rest'='true')
create table x
(
id string, name string,country string, emails string
)
row format delimited
fields terminated by '\t'
stored as textfile
tblproperties ('serialization.last.column.takes.rest'='true')
;
我有一个数据集,它是制表符分隔的,并且行以换行符终止。每行包含 5 个制表符分隔的数据。 例如数据集,
XXXX1 XXXX2 XXXX3 XXXX4 XXXX5
现在我必须创建一个包含 3 列的 table,前两列将分别存储值 XXXX1
和 XXXX2
,第一行和第三列应包含剩余值 XXXX3 XXXX4 XXXX5
.
我使用以下查询创建了 table,但在第三列中仅保留 XXXX3
,其余两个数据未加载到 table。
create table x(
id string, name string,country string, emails string
) row format delimited fields terminated by '\t';
求推荐。
tblproperties ('serialization.last.column.takes.rest'='true')
create table x
(
id string, name string,country string, emails string
)
row format delimited
fields terminated by '\t'
stored as textfile
tblproperties ('serialization.last.column.takes.rest'='true')
;