在 Hadoop 中解析 XML 的工具
Tool for parsing XML in Hadoop
我想知道在 hadoop 环境中是否有任何工具可以用来解析 XML 文件。我知道使用 map reduce 我们可以解析 XML 文件,如果没有可用的工具比解析哪种语言 scala,java 或 pig 更好?
请帮忙。
hadoop 环境通常有 Java 可用。所以我会使用 "Java Architecture for XML Binding" 或 JAXB。
相对简单易用,开发策略主要有:
- 您有 XML 其他人已定义您想要在 Java 内访问。
- 您有 Java 个数据结构要在 XML 中表示。
它有很多功能,但除非您需要,否则不要担心添加所有花里胡哨的东西。它也相当快。
You can find the learning path for it here.
Scala 也是一个很好的选择,但它的学习曲线有点高(如果您已经了解 Java 并且接触过基于 Lambda 的语言,学习曲线就不会那么高)。该文档是合理的,但有时它与 Java.
可用的文档相差无几
对于没有使用 Scala 进行交付的记录的团队,Scala 将是我的第二选择。它并不难,对于某些问题,Scala 更容易,但如果没有一点 Scala 经验,人们往往会利用非 Scala 方法解决 Scala 中的问题。
Pig 是我经验有限的语言,所以我会保留评论。
我想知道在 hadoop 环境中是否有任何工具可以用来解析 XML 文件。我知道使用 map reduce 我们可以解析 XML 文件,如果没有可用的工具比解析哪种语言 scala,java 或 pig 更好? 请帮忙。
hadoop 环境通常有 Java 可用。所以我会使用 "Java Architecture for XML Binding" 或 JAXB。
相对简单易用,开发策略主要有:
- 您有 XML 其他人已定义您想要在 Java 内访问。
- 您有 Java 个数据结构要在 XML 中表示。
它有很多功能,但除非您需要,否则不要担心添加所有花里胡哨的东西。它也相当快。
You can find the learning path for it here.
Scala 也是一个很好的选择,但它的学习曲线有点高(如果您已经了解 Java 并且接触过基于 Lambda 的语言,学习曲线就不会那么高)。该文档是合理的,但有时它与 Java.
可用的文档相差无几对于没有使用 Scala 进行交付的记录的团队,Scala 将是我的第二选择。它并不难,对于某些问题,Scala 更容易,但如果没有一点 Scala 经验,人们往往会利用非 Scala 方法解决 Scala 中的问题。
Pig 是我经验有限的语言,所以我会保留评论。