F# - 将 Deedle FrameData 写入 CSV

F# - Write Deedle FrameData To CSV

我需要写一个 Deedle FrameData(包括 "ID" 列和附加的 "Delta" 列空白条目)到 CSV。虽然我可以生成 FrameData 的二维数组,但我无法将其正确写入 CSV 文件。

module SOQN = 

    open System
    open Deedle
    open FSharp.Data

    //  TestInput.csv
    //  ID,Alpha,Beta,Gamma
    //  1,no,1,hi
    //  ...

    //  TestOutput.csv
    //  ID,Alpha,Beta,Gamma,Delta
    //  1,"no","1","hi",""
    //  ...

    let inputCsv = @"D:\TestInput.csv"
    let outputCsv = @"D:\TestOutput.csv"
    let (df:Frame<obj,string>) = Frame.ReadCsv(inputCsv, hasHeaders=true, inferTypes=false, separators=",", indexCol="ID")

    // See http://www.fssnip.net/sj/title/Insert-Deedle-frame-into-Excel
    let data4Frame (frame:Frame<_,_>) = frame.GetFrameData()

    // See http://www.fssnip.net/sj/title/Insert-Deedle-frame-into-Excel
    let boxOptional obj =
        match obj with
        | Deedle.OptionalValue.Present obj -> box (obj.ToString()) 
        | _ -> box ""

    // See http://www.fssnip.net/sj/title/Insert-Deedle-frame-into-Excel
    let frameToArray (data:FrameData) =
        let transpose (array:'T[,]) =
          Array2D.init (array.GetLength(1)) (array.GetLength(0)) (fun i j -> array.[j, i])
        data.Columns
        |> Seq.map (fun (typ, vctr) -> vctr.ObjectSequence |> Seq.map boxOptional |> Array.ofSeq)
        |> array2D
        |> transpose

    let main = 
        printfn ""
        printfn "Output Deedle FrameData To CSV"
        printfn ""
        let dff = data4Frame df
        let rzlt = frameToArray dff     
        printfn "rzlt: %A" rzlt     
        do 
            use writer = new StreamWriter(outputCsv)
            writer.WriteLine("ID,Alpha,Beta,Gamma,Delta")
            // writer.WriteLine rzlt
        0

    [<EntryPoint>]
    main
    |> ignore

我错过了什么?

您可以从库的 source 中获取写入 csv 的示例(它在那里使用 FrameData

添加包装器后:

type FrameData with 
    member frameData.SaveCsv(path:string, ?includeRowKeys, ?keyNames, ?separator, ?culture) = 
      use writer = new StreamWriter(path)
      writeCsv writer (Some path) separator culture includeRowKeys keyNames frameData

你可以这样写:

dff.SaveCsv outputCsv 

我不会使用 FrameData 来执行此操作 - 帧数据大部分是内部的,虽然它有一些合法用途,但我认为它对这项任务没有意义。

如果您只想向输入的 CSV 添加一个空的 Delta 列,那么您可以这样做:

let df : Frame<int, _> = Frame.ReadCsv("C:/temp/test-input.csv", indexCol="ID")
df.AddColumn("Delta", [])
df.SaveCsv("C:/temp/test-output.csv", ["ID"])

这几乎可以满足您的所有需求 - 它会写入 ID 列和额外的 Delta 列。

唯一需要注意的是它不会在数据周围添加额外的引号。这不是 CSV 规范所要求的,除非您需要在列中转义逗号,而且我认为没有一种简单的方法可以让 Deedle 执行此操作。

所以,我认为您必须将自己的文章写入 CSV 文件。下面显示了如何执行此操作,但它没有正确转义引号和逗号(这就是为什么你应该使用 SaveCsv 即使它在不需要时没有放入引号):

use writer = new StreamWriter("C:/temp/test-output.csv")
writer.WriteLine("ID,Alpha,Beta,Gamma,Delta")
for key, row in Series.observations df.Rows do
  writer.Write(key)
  for value in Series.valuesAll row do
    writer.Write(",")
    writer.Write(sprintf "\"%O\"" (if value.IsSome then value.Value else box ""))
  writer.WriteLine()