我正在尝试在 TDCH jar 1.6 版本的帮助下将 teradata 中的镶木地板文件存储在 HDFS 中
I am trying to store in HDFS as parquet file from teradata with help of TDCH jar 1.6 version
我正在尝试借助 TDCH jar 从 teradata 将 parquet 文件存储在 HDFS 中
我收到连接异常:未找到插件"hdfs-parquet"
我该如何解决这个问题?
您将无法执行此操作,因为 TDCH 不提供该功能。 Parquet 支持用于 Hive,因此您需要有一个存储为 parquet 的配置单元 table,然后使用 TDCH,作业类型为 hive,文件格式为 parquet。
如果你想将数据从 TD 存储到 HDFS 作为镶木地板,那么你需要使用带有 jdbc 连接的 sqoop 并使用 --as-parquetfile 选项,而不是使用 CLDR 或 HWX TD 包装器.
我正在尝试借助 TDCH jar 从 teradata 将 parquet 文件存储在 HDFS 中
我收到连接异常:未找到插件"hdfs-parquet"
我该如何解决这个问题?
您将无法执行此操作,因为 TDCH 不提供该功能。 Parquet 支持用于 Hive,因此您需要有一个存储为 parquet 的配置单元 table,然后使用 TDCH,作业类型为 hive,文件格式为 parquet。
如果你想将数据从 TD 存储到 HDFS 作为镶木地板,那么你需要使用带有 jdbc 连接的 sqoop 并使用 --as-parquetfile 选项,而不是使用 CLDR 或 HWX TD 包装器.