如何在 CSV 下表示 JSON 对象

Question

我想将一个 JSON 对象导出到 CSV 文件，其中的子字段可能由对象数组填充，但我不知道如何表示CSV 中的嵌入数据。

Answer 1

csv 的表现力不如 json。但是有很多方法可以在 csv 中伪造一个 json 结构。例如：

https://konklone.io/json/?id=a624ffaa84db538b4a10465c72bf393d

更多相关信息： http://blog.appliedinformaticsinc.com/how-to-parse-and-convert-json-to-csv-using-python/

Answer 2

这归结为将 semi-structured (tree-like) 数据映射到表格数据。由于阻抗不匹配，这根本不是微不足道的。

在实践中有几种常用（和教授）的方法，并且经过广泛的学术研究，主要是为 XML 建立的，但原则上也可以应用于 JSON。方法或多或少归结为：

Ad-hoc (schema-based) 映射
切边
树编码

首先，如果您的数据遵循规则模式（如架构），您可以设计一个 ad-hoc 映射，例如，可以将每个叶（值）映射到 CSV 中的列。您可以使用点保留有关结构的信息，前提是字段中尚未使用点。

例如：

{
  "foo" : {
    "bar" : 10
  },
  "foobar" : "foo"
}

可以映射到：

| foo.bar | foobar |
|---------|--------|
|  10     |  foo   |

棘手的部分是当游戏中有数组时。如果你有一大堆相似的对象，你可以让它们成为输出 CSV 中的所有行：

{
  "objects" : [
    {
      "foo" : {
        "bar" : 10
      },
      "foobar" : "foo"
    },
    {
      "foo" : {
        "bar" : 40
      },
      "foobar" : "bar"
    },
    {
      "foo" : {
        "bar" : 50
      },
      "foobar" : "bar"
    }
  ]
}

可以映射到：

| objects.pos | objects.foo.bar | objects.foobar |
|-------------|-----------------|----------------|
|       1     |      10         |     foo        |
|       2     |      40         |     bar        |
|       3     |      50         |     bar        |

这是最简单的方法，因为输出 CSV 仍然很容易理解，但它需要为每个用例重新设计它以使其适应您的数据，特别是对于数组中的不同排列。

从理论的角度来看，这第一种 ad-hoc 方法称为 规范化 数据，即将其转化为第一范式或更高范式。

还有其他更通用的方法，例如边缘分解和树编码。对于您的用例，它们可能做得过头了，因为解码它们需要相当多的工作，因此它们更适合在关系数据库之上实现复杂的 XML 查询。

简而言之，通过边缘切碎，您可以为存储叶子的每种类型（在 JSON 中为数字、字符串、布尔值等）创建一个 table（CSV 文件），并有一个 table 用于存储原始 JSON 树的边缘。

使用 tree encoding，您只需使用一个 table（CSV 文件）即可巧妙地存储树的所有节点和叶子。同样，它针对 XML 进行了调整，但可能会进行调整。

JSON 比 XML 年轻一点，所以我不确定在映射到 table 方面已经做了多少研究——可能还有专门针对 JSON 而不是 XML 的一般映射，即使一般原则相似。

如何在 CSV 下表示 JSON 对象

How to represent JSON object under CSV

javascript

python

csv

json

export-to-csv