apache zeppelin 附加存储库导入
Posted
技术标签:
【中文标题】apache zeppelin 附加存储库导入【英文标题】:apache zeppelin additional repository import 【发布时间】:2016-08-13 12:01:39 【问题描述】:如何在 zeppelin 中导入额外的依赖项?
我正在尝试在 apache zeppelin 中导入库(鞍),但是 ...
import org.saddle._
<console>:21: error: object saddle is not a member of package org
import org.saddle._
^
我尝试过像这样使用 %dep 解释器(依赖加载器):
%dep
z.reset()
z.addRepo("Saddle Repo").url("http://mvnrepository.com/artifact/org.scala-saddle/saddle_2.10/1.0.1")
z.load("org.scala-saddle:saddle_2.10:1.3.0")
我还在 GUI 中尝试过 1. 包括解释器依赖项下的 maven 存储库,或 2. 包括 zeppelin.dep.additionalRemoteRepository 下的马鞍网站。
我还尝试下载 jar 文件并将其作为 SPARK_SUBMIT_OPTIONS 包含在 conf/zeppelin-env.sh 中。
然后我将 jar 复制到 zeppelin-zengine/target/lib/,当我从那里看到使用和导入的 jar 时。
到目前为止,我还没有成功。帮助表示赞赏。
【问题讨论】:
你重启了spark解释器,重新运行%dep段落了吗? 是的。我已经尝试了关闭笔记本服务器和从 GUI 内部重新启动解释器的两种选择。 启动Zeppelin的主机能否连接到mvnrepository.com?我认为它可能无法连接到该网站 我的互联网连接没有任何问题。当我使用 %dep 时,我只会收到弃用的警告和“res0: org.apache.zeppelin.dep.Dependency = org.apache.zeppelin.dep.Dependency@246390b2” 你能取得进展吗...我在同一条船上??任何帮助表示赞赏 【参考方案1】:我相信你现在必须解决这个问题。如果其他人遇到问题,请发布它。我尝试了以下方法,它奏效了。 maven 已经添加到 Zeppelin 中,无需添加。
%spark.dep
z.load("org.scala-saddle:saddle-core_2.11:1.3.4")
【讨论】:
【参考方案2】:Zeppelin 中的解释器存储库配置 GUI。 com.typesafe.config.ConfigFactory 或鞍核 » 1.3.4
错误:对象类型安全不是包 com 的成员
1 - 打开站点https://mvnrepository.com/ 并找到“鞍”存储库。
SCALA 版本,然后点击 Buildr
https://mvnrepository.com/artifact/org.scala-saddle/saddle-core
'org.scala-saddle:saddle-core_2.11:jar:1.3.4'
2 - 点击右上角的“匿名”,会弹出一个下拉菜单,点击“口译员”,然后在新页面搜索或向下滚动到“Spark”。在 Spark 解释器磁贴的右上角有三个按钮,“编辑”、“重新启动”、“删除”。单击“编辑”,然后您将看到依赖项和值。向下滚动并找到属性,然后单击添加并完成属性:
然后点击保存。
3- 测试
【讨论】:
以上是关于apache zeppelin 附加存储库导入的主要内容,如果未能解决你的问题,请参考以下文章
Apache Zeppelin:线程“main”中的异常 java.lang.RuntimeException:在 zeppelin 网页中找不到 core-site.xml
如何在 HDP 中的 zeppelin-spark2 中将库安装到 python