Apache Spark 和 Oracle 可以共存吗

Can Apache Spark and Oracle co exist

我想获取一些存储在 Oracle 数据库中的 XML 数据,并使用 Apache Spark 解析某些值并存储在同一台机器中的另一个 table 中。

如果是这样, 我需要设置哪些参数和配置才能使 SPARK 和 ORacle 在单个 LINUX 框中共存。

是的,您绝对可以在一台机器上安装 Apache Spark 和 Oracle。

What parameters and configurations do I need to set

假设您使用 oracle-jdbc 通过 Spark 连接到 Oracle:

  • 只是 install/start oracle 作为一个独立的数据库(它不需要任何额外的配置)
  • Spark 也不需要额外的配置(基本配置除外)

只需要在Spark的Cla​​sspath中添加oracle-jdbc.jar,就可以通过spark查询oracle了。