Hive - 删除 DDL Table 创建中的“”引号
Hive - remove " " quotes in DDL Table creation
我有一个包含 400 列的 CSV,其中一些列的值中包含“ ”。例如:
Field_A
"123"
""
"21111"
我的问题是:当我在 Hive 中创建 table 时,是否可以自动从数据中删除这些引号?或者我需要在每个字段中添加 regexp_replace()
来删除它?
谢谢!
我相信以下来自 hortonworks 的 post 回答了您的问题。
https://community.hortonworks.com/questions/66603/how-to-remove-double-quote-from-csv-file-at-time-o.html
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
"separatorChar" = ",",
"quoteChar" = "\""
)
我有一个包含 400 列的 CSV,其中一些列的值中包含“ ”。例如:
Field_A
"123"
""
"21111"
我的问题是:当我在 Hive 中创建 table 时,是否可以自动从数据中删除这些引号?或者我需要在每个字段中添加 regexp_replace()
来删除它?
谢谢!
我相信以下来自 hortonworks 的 post 回答了您的问题。 https://community.hortonworks.com/questions/66603/how-to-remove-double-quote-from-csv-file-at-time-o.html
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
"separatorChar" = ",",
"quoteChar" = "\""
)