如何在datastax中实现rdd.bulkSaveToCassandra
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在datastax中实现rdd.bulkSaveToCassandra相关的知识,希望对你有一定的参考价值。
- 我正在使用5.0.5的数据集群。 [cqlsh 5.0.1 |卡桑德拉3.0.11.1485 | DSE 5.0.5 | CQL规范3.4.0 |原生原型
使用spark-cassandra-connector 1.6.8
我试着实现下面的代码..导入不起作用。
val rdd:RDD [SomeType] t
rdd.bulkSaveToCassandra(密钥空间,表)
有人可以建议我如何实现此代码。它们是否需要依赖性。
Cassandra Spark Connector有saveToCassandra
方法可以像这样使用(取自documentation):
val collection = sc.parallelize(Seq(("cat", 30), ("fox", 40)))
collection.saveToCassandra("test", "words", SomeColumns("word", "count"))
还有saveAsCassandraTableEx
允许您控制模式创建和其他事情 - 它也在上面引用的文档中描述。
要使用它们,您需要在“import com.datastax.spark.connector._
”文档中描述的Connecting to Cassandra。
并且您需要添加相应的依赖项 - 但这取决于您使用的构建系统。
bulkSaveToCassandra
方法仅在您使用DSE连接器时可用。您需要添加相应的依赖项 - 有关详细信息,请参阅documentation。但即使是primary developer of Spark connector says,最好使用saveToCassandra
而不是它。
以上是关于如何在datastax中实现rdd.bulkSaveToCassandra的主要内容,如果未能解决你的问题,请参考以下文章
cassandra datastax 编写生成的代码时出现意外错误:java.lang.NullPointerException
将单个令牌节点添加到现有的 datastax cassandra 集群和数据传输不起作用
如果结果集较大,则使用 Cassandra 和 DataStax Java 驱动程序时出现 NoHostAvailableException
如何在Castle.Core中实现IProxyGenerationHook的类中实现Equals和GetHashCode的覆盖方法?