齐柏林飞艇超越超集

Posted

技术标签:

【中文标题】齐柏林飞艇超越超集【英文标题】:Zeppelin over Superset 【发布时间】:2021-07-14 16:34:40 【问题描述】:

我已经使用 zeppelin 几年了,现在 superset 因更好的可视化功能等而受到更多关注。所以我试图了解确切的差异,如果有人正在寻找 BI 工具,我也会提供帮助。

我根据对 superset 的初步阅读列出了一些独特的功能,如果有人可以为列表做出更多贡献,我将不胜感激。

大多数大数据集群集成支持(Spark、flink 等) 使用段落执行内联代码 多语言支持

由于我不是 superset 的正确用户,我想了解 Zeppelin 的更多独特功能,而这些功能在 Superset 中是不可能或很难做到的。

我还从 apache wiki 获得了以下详细信息,但除了利用笔记本风格之外,我认为这些不是独特的因素

Apache Zeppelin 是一个间接竞争对手,但它解决了不同的用例。

Apache Zeppelin 是一个基于 Web 的笔记本,可以进行交互式数据分析。它支持使用 SQL、Scala 等创建精美的数据驱动、交互式和协作文档。尽管用户可以使用该项目创建数据可视化,但它利用了笔记本风格的用户界面,并且面向 Scala 和 SQL 共存的 Spark 社区

【问题讨论】:

【参考方案1】:

从根本上说,Zeppelin 和 Superset 对数据工作流采取了截然不同的观点。

Zeppelin 以 [计算笔记本界面][1] 为中心,它使您能够编写代码片段、运行它们并内化输出,以及迭代和扩展。 Zeppelin 笔记本然后专注于使用 20 多种编程 [语言和解释器][2]。 Zeppelin 还可以使用 JDBC 连接器查询流行的数据库。

Superset 以 BI 用例为中心,附带 SQL IDE 和无代码图表构建器。这里的重要区别是 Superset 只能从 SQL 数据库中查询数据。与 Zeppelin 不同,Superset 不能让您运行来自各种编程语言的任意代码。

这两种工具的用例、工作流程和设计选择非常不同。 Superset 希望最终用户和分析师以及 SQL 忍者能够创建仪表板(组织中的其他人可能会使用)。 Zeppelin 希望提升数据科学家和程序员的水平以分析数据,而不是专注于构建仪表板以供组织的其他人员使用。

[1]: https://en.wikipedia.org/wiki/Notebook_interface#:~:text=A%20notebook%20interface%20(also%20 called, and%20text%20into%20separate%20sections. [2]:https://zeppelin.apache.org/supported_interpreters.html

【讨论】:

以上是关于齐柏林飞艇超越超集的主要内容,如果未能解决你的问题,请参考以下文章

Scala 中如何解析导入的名称? (火花/齐柏林飞艇)

WSL 上的齐柏林飞艇。 java.io.IOException:无法启动解释器进程

Zeppelin 没有口译员

Pyspark Zeppelin - 无法打开 PythonInterpreter

Scala 和 Spark UDF 函数

Apache Livy 0.7.0 无法创建交互式会话