首页
标签

parquet

读取拼花文件时如何将小数点格式从点更改为逗号？
数据中的单个与多个 ID 列 warehouse/lake
使用 Apache Beam 和 ParquetIO 读取多个镶木地板文件
为什么在使用 spark sql 过滤特定聚合的行时出现类型不匹配？
如何在不使用 Pandas 的情况下将 Numpy 转换为 Parquet？
python 使用 snappy 和 thiftpy 在 macOS 上安装 parquet 失败
spark 是否只能从 parquet 文件中读取满足某些条件的列值？
将数据帧写入 parquet 文件失败并出现空模式或嵌套空模式
Parquet 文件在哪些级别存储 min/max/distinct（等）统计信息？
如何找到 Parquet 文件在生成时使用的 COMPRESSION_CODEC？
我们可以在同一个镶木地板文件中为每个行组设置不同的模式吗？
检查 parquet scala spark 上是否存在嵌套数据？
按时间戳分区好还是按年月日小时分区好
Apache Beam Java SDK SparkRunner 写入镶木地板错误
如何理解镶木地板文件名称的每个部分
如何用pandas读取Spark写的文件？
Apache-Drill 不理解 Pandas datetime64[ns]
将数据框投射到数据集后 select 是否优化？
高效读取 Spark 中的嵌套镶木地板列
将 Spark Schema 转换为 Redshift Spectrum 嵌套模式

1 2 ... 22 23 24 ... 53 54

©2023 WhoseBug