首页
标签

parquet

将 Parquet/Avro GenericRecord 写入 JSON，同时维护 LogicalTypes
pyspark write.parquet() 创建文件夹而不是镶木地板文件
Spark 无法读取由 AvroParquetWriter 编写的 Parquet 文件中的 DECIMAL 列
使用 Dask 的 Parquet 谓词下推过滤
具有字典列表的列的 pyarrow 数据类型？
如何在Impala中显示复杂数据列（地图类型）中的所有字段？
将多个 CSV 转换为单个分区的镶木地板数据集
在 DBT 管道中使用外部镶木地板表
使用 SparkR 创建的数据框和使用 Sparklyr 创建的数据框有什么区别？
如果值在 pandas paquet 格式的列中是唯一的，那么搜索的最佳方法是什么？
Pyspark 格式日期
如何在 Python 中读取 gzipped parquet 文件
如何使用 Pyarrow 更改镶木地板文件中列的名称？
NIFI - 使用一个 ReplaceText 处理器如何在每行的开头和结尾添加括号
使用 Parquet.NET 写入 Parquet 文件适用于本地文件，但会导致 blob 存储中的文件为空
具有多个条件的pyarrow数据集过滤
我可以存储一个 Parquet 文件，其中的字典列的值具有混合类型吗？
AWS lambda 函数和 Athena 创建分区 table
Spark 无法识别 String 中的新行、&amp 等
Athena returns 拼花文件中时间戳字段的错误值

1 2 ... 13 14 15 ... 53 54

©2023 WhoseBug