如何在 Julia 中将 CSV 转换为 Parquet
How to convert CSV to Parquet in Julia
我有一个 CSV 文件,我想在 Julia 中将其转换为 Parquet。我在论坛和有关此转换的文档中找不到任何相关信息。在 Julia 中是否可以进行这种转换,或者我只是简单地将 CSV 读取为 Parquet?如果是这样?我该怎么做呢?
这是我目前所掌握的。
begin
using Pkg
Pkg.add("PlutoUI")
Pkg.add("HTTP")
Pkg.add("StatsModels")
Pkg.activate(".")
import CSV, DataFrames, Dates, StatsPlots, StatsModels
import DataFrames.DataFrame
using Plots, PlutoUI, HTTP, DelimitedFiles, Parquet
end
begin
df = CSV.read("/home/onur/julia-assignment/temp.csv", DataFrame)
end
在下面的代码中使用 Parquet.jl
:
using CSV,DataFrames,Parquet
c = CSV.read(IOBuffer("a;b;c\n1;2.5;a\n2;3.5;b"), DataFrame, delim=";")
Parquet.write_parquet("dat.parquet", c)
至于测试,让我们试着回读一下:
julia> Parquet.read_parquet("dat.parquet") |> DataFrame
2×3 DataFrame
Row │ a b c
│ Int64? Float64? String?
─────┼───────────────────────────
1 │ 1 2.5 a
2 │ 2 3.5 b
我有一个 CSV 文件,我想在 Julia 中将其转换为 Parquet。我在论坛和有关此转换的文档中找不到任何相关信息。在 Julia 中是否可以进行这种转换,或者我只是简单地将 CSV 读取为 Parquet?如果是这样?我该怎么做呢?
这是我目前所掌握的。
begin
using Pkg
Pkg.add("PlutoUI")
Pkg.add("HTTP")
Pkg.add("StatsModels")
Pkg.activate(".")
import CSV, DataFrames, Dates, StatsPlots, StatsModels
import DataFrames.DataFrame
using Plots, PlutoUI, HTTP, DelimitedFiles, Parquet
end
begin
df = CSV.read("/home/onur/julia-assignment/temp.csv", DataFrame)
end
在下面的代码中使用 Parquet.jl
:
using CSV,DataFrames,Parquet
c = CSV.read(IOBuffer("a;b;c\n1;2.5;a\n2;3.5;b"), DataFrame, delim=";")
Parquet.write_parquet("dat.parquet", c)
至于测试,让我们试着回读一下:
julia> Parquet.read_parquet("dat.parquet") |> DataFrame
2×3 DataFrame
Row │ a b c
│ Int64? Float64? String?
─────┼───────────────────────────
1 │ 1 2.5 a
2 │ 2 3.5 b