使用 spark 和 scala 将数据框合并到 Google bigquery

Merge dataframe into Google bigquery using spark and scala

我正在尝试使用 spark 和 scala 实现类似的东西

使用 Java 更新 BigQuery 数据 https://cloud.google.com/bigquery/docs/updating-data

我想更新现有数据并将新数据插入 Bigquery table。如果我们可以在 spark 中使用某种 DML 对 BigQuery 执行 upsert 操作,有什么想法吗??

我发现 BigQuery 支持 merge 但我不确定我们是否可以使用 spark 和 scala 做类似的事情

spark API 还不支持 upsert。目前最好的解决方法是将数据帧写入临时 table、运行 一个 MERGE 作业,然后删除临时 table.