在 Apache Zeppelin 上安装 R

Posted

技术标签:

【中文标题】在 Apache Zeppelin 上安装 R【英文标题】:Installing R on Apache Zeppelin 【发布时间】:2016-10-28 08:54:11 【问题描述】:

我正在尝试在运行 Ubuntu 的旧计算机上安装 Apache Zeppelin。到目前为止,我可以通过克隆最新的 0.6.0 快照版本非常轻松地安装 Zeppelin

git clone https://github.com/apache/incubator-zeppelin.git
cd incubator-zeppelin
mvn clean package -DskipTests

但我想在 Zeppelin 上使用 R。据说 0.6.0 的快照有两个 R 解释器,但是当我运行 R 教程(使用 %r 的预制注释)时,I get this list of errors.

我按照几个指南尝试安装 R 作为解释器,但每个都导致了某种错误。我试过这个教学: http://www.r-bloggers.com/interactive-data-science-with-r-in-apache-zeppelin-notebook/,在“R 解释器”上构建失败。错误消息是

"dependency 'evaluate' is not available for package 'rzeppelin' 
* removing '/home/rebecca/Zeppelin-With-R/R/lib/rzeppelin'"

然后再往下一点

Failed to execute goal org.codehaus.mojo:exec-maven-plugin:1.2.1:exec (default) on project zeppelin-zrinterpreter: Command execution failed. Process exited with an error: 1

我还尝试了这个 Stack Overflow 指南:Anyone tried to add R interpreter onto Apache Zeppelin?,虽然我能够运行 incubator-zeppelin,但当我使用 %spark.r 或 %r 解释器标签时收到一个错误,说“解释器不是找到”和“未找到前缀”。在遵循第一个解决方案后,Spark 也不起作用,得到第二个解决方案中提到的相同错误(jar 文件不存在),然后尝试第二个解决方案。

有人有在最新版本的 Zeppelin 上安装 R 的指南吗?我的安装方式非常灵活。我可以在我的计算机上运行其他操作系统,并且我还在我的另一台计算机上安装了 Virtual Box,这是一台 mac。

【问题讨论】:

我也在网上看到了这个指南:gist.github.com/nsabharwal/9163e0adfc66af080145,但不确定它是如何工作的。 【参考方案1】:

最近引入的最新版 zeppelin 的 HEAD 中存在一个错误,导致 R 解释器无法正常启动

有人为此创建了 Zeppelin Jira 问题吗?

对我来说,它正在 Zeppelin branch-0.6 上工作

    使用 r 配置文件构建 Zeppelin:-DskipTests -Pr这将...
      在 git repo root 中创建一个目录'R''zeppelin-rinterpreter*.jar' 复制到 git_repo_root/interpreter/spark 中
    使用构建发行版配置文件构建 Zeppelin:例如-DskipTests -Pbuild-distr -Pspark-1.6 -Phadoop-2.6 使用 zeppelin-distribution/target/zeppelin*.tar.gz 进行安装 确保 zeppelin 安装中同时存在 1.1 和 1.2

【讨论】:

【参考方案2】:

您遇到的错误是您需要安装 R 包 evaluate。您只需启动 R 并键入 install.packages('evaluate') 即可安装它。

也就是说,您的摘录提到了目录Zeppelin-with-R。那是我的 repo,它是 Zeppelin 接受时形式的 R 解释器。那是版本 0.5.6,而不是 0.6.0。目前最新推出的 zeppelin HEAD 中存在一个错误,该错误会阻止 R 解释器干净启动。你现在最好的选择是使用我的 repo 中的一个并安装干净,而不是尝试从 Zeppelin HEAD 中拉入。

【讨论】:

以上是关于在 Apache Zeppelin 上安装 R的主要内容,如果未能解决你的问题,请参考以下文章

Apache - Zeppelin 在 Ubuntu 上构建失败

在 Windows 10 上配置 Apache Zeppelin 时出错

使用 Spark 配置 Apache Zeppelin

Apache Zeppelin - 断开连接状态

安装 Apache Zeppelin 的构建错误

在 Apache Zeppelin 上配置 Hbase 解释器时遇到问题