如何使用 Spark 和 Scala 将数据写入 CouchBase?
How to write data into CouchBase using Spark & Scala?
我是 CouchBase.I 的新手,我正在尝试将数据写入本地的 CouchBase mode.My 下面是示例代码,
val cfg = new SparkConf()
.setAppName("couchbaseQuickstart")
.setMaster("local[*]")
.set("com.couchbase.bucket.MyBucket","pwd")
val sc = new SparkContext(cfg)
val doc1 = JsonDocument.create("doc1", JsonObject.create().put("some","content"))
val doc2 = JsonArrayDocument.create("doc2", JsonArray.from("more", "content", "in", "here"))
val data = sc.parallelize(Seq(doc1, doc2))
但是我无法访问 data.saveToCouchbase()。
我正在使用 Spark 1.6.1 和 Scala 2.11.8
我在 built.sbt
中给出了以下依赖项
libraryDependencies += "org.apache.spark" % "spark-core_2.11" % "1.6.1"
libraryDependencies += "com.couchbase.client" % "spark-connector_2.11" % "1.2.1"
如何使用 Spark 和 Scala 将数据写入 CouchBase?
看起来您只是缺少一个导入语句,该语句使您能够在 RDD 和数据帧上使用 Couchbase 函数:
import com.couchbase.spark._
val cfg = new SparkConf()
.setAppName("couchbaseQuickstart")
.setMaster("local[*]")
.set("com.couchbase.bucket.MyBucket","pwd")
val sc = new SparkContext(cfg)
val doc1 = JsonDocument.create("doc1",
JsonObject.create().put("some","content"))
val doc2 = JsonArrayDocument.create("doc2", JsonArray.from("more", "content", "in", "here"))
val data = sc.parallelize(Seq(doc1, doc2))
data.saveToCouchbase()
我是 CouchBase.I 的新手,我正在尝试将数据写入本地的 CouchBase mode.My 下面是示例代码,
val cfg = new SparkConf()
.setAppName("couchbaseQuickstart")
.setMaster("local[*]")
.set("com.couchbase.bucket.MyBucket","pwd")
val sc = new SparkContext(cfg)
val doc1 = JsonDocument.create("doc1", JsonObject.create().put("some","content"))
val doc2 = JsonArrayDocument.create("doc2", JsonArray.from("more", "content", "in", "here"))
val data = sc.parallelize(Seq(doc1, doc2))
但是我无法访问 data.saveToCouchbase()。
我正在使用 Spark 1.6.1 和 Scala 2.11.8
我在 built.sbt
中给出了以下依赖项libraryDependencies += "org.apache.spark" % "spark-core_2.11" % "1.6.1"
libraryDependencies += "com.couchbase.client" % "spark-connector_2.11" % "1.2.1"
如何使用 Spark 和 Scala 将数据写入 CouchBase?
看起来您只是缺少一个导入语句,该语句使您能够在 RDD 和数据帧上使用 Couchbase 函数:
import com.couchbase.spark._
val cfg = new SparkConf()
.setAppName("couchbaseQuickstart")
.setMaster("local[*]")
.set("com.couchbase.bucket.MyBucket","pwd")
val sc = new SparkContext(cfg)
val doc1 = JsonDocument.create("doc1",
JsonObject.create().put("some","content"))
val doc2 = JsonArrayDocument.create("doc2", JsonArray.from("more", "content", "in", "here"))
val data = sc.parallelize(Seq(doc1, doc2))
data.saveToCouchbase()