我正在学习如何从 Spark the Definitive Guide 一书中将 sqlite 连接到 spark

Posted

技术标签:

【中文标题】我正在学习如何从 Spark the Definitive Guide 一书中将 sqlite 连接到 spark【英文标题】:I'm learning how to connect sqlite to spark from the book Spark the Definitive Guide 【发布时间】:2020-09-25 22:31:19 【问题描述】:

我正在使用 Jupyter Notebook。

下面是提到的用于将pyspark 连接到 sqlite 的代码:

driver = "org.sqlite.JDBC"

path = "/data/flight-data/jdbc/my-sqlite.db"

url = "jdbc:sqlite:" + path

tablename = "flight_info"

dbDataFrame = spark.read.format("jdbc").option("url", url)\
.option("dbtable", tablename).option("driver", driver).load()

这给了我以下错误:

Py4JJavaError: An error occurred while calling o121.load.  
: java.lang.ClassNotFoundException: org.sqlite.JDBC

请帮我解决错误。

【问题讨论】:

欢迎来到 Stack Overflow。请按照建议添加您的搜索/研究工作的简短描述、代码、错误。 【参考方案1】:

问题

使用 JDBC API 的 Spark 无法找到“org.sqlite.JDBC”类,因为它不在 spark 的类路径中。

解决方案

您可以从 --> Maven Online Repository 下载 jar 文件并将其放在 jars 文件夹中。重启你的笔记本/应用程序

参考/资源

来自 maven 的 SQLITE JDBC 下载链接 - https://repo1.maven.org/maven2/org/xerial/sqlite-jdbc/3.28.0/sqlite-jdbc-3.28.0.jar

【讨论】:

太棒了!请将其标记为已接受的答案,以便其他在 *** 上搜索类似问题的人也可能会发现它很有用。

以上是关于我正在学习如何从 Spark the Definitive Guide 一书中将 sqlite 连接到 spark的主要内容,如果未能解决你的问题,请参考以下文章

Spark 从入门到精通学习笔记大纲

如何从 spark sql 访问本地镶木地板文件?

如何在 zeppelin 中将数组从 spark 绑定到 javascript?

如何从 SPARK SCALA 中的 XML 模式中获取列名?

在 Spark 中加入倾斜的数据集?

如何在 Spark2 中实际应用保存的 RF 模型并进行预测?