什么技术可以让我为我的 Data Lake 获得 Databricks 风格的界面,但在本地?

Posted

技术标签:

【中文标题】什么技术可以让我为我的 Data Lake 获得 Databricks 风格的界面,但在本地?【英文标题】:What technology can allow me to get a Databricks style interface for my Data Lake, but on-premise? 【发布时间】:2020-10-30 07:52:02 【问题描述】:

我对 Databrick 的“可访问性”非常满意。可以简单地单击所需的数据库并浏览表格并检查它们。然后,可以显示和保存不同的笔记本(Zeppelin 风格的笔记本),在其中可以使用不同的语言(pyspark、python、sql、r、..)查询数据库,甚至可以使用 Python 脚本操作数据并存储结果可以在同一个界面中访问。

这些选项和直观的界面非常适合创建无缝体验以在云中浏览我的数据湖(例如,无需通过代码查询即可查看数据库和表),但我想知道我可以在本地使用哪些类似的技术?

附上两张Databrick界面的截图。 在左侧,Zeppelin 风格的笔记本可通过“工作区”图标访问,DB 可通过“数据”访问:

谢谢

【问题讨论】:

【参考方案1】:

商业版:Cloudera Data Science Workbench

【讨论】:

以上是关于什么技术可以让我为我的 Data Lake 获得 Databricks 风格的界面,但在本地?的主要内容,如果未能解决你的问题,请参考以下文章

什么是数据湖(Data Lake)?

如果我为我的表命名,为啥 SQL 查询顺序会发生变化? [关闭]

为啥当我为我的 CABasicAnimation 设置低持续时间值时它会跳跃?

让我指定的角色使用命令

为啥有些用户可以在 Synapse 工作区中看到链接的 Azure Data Lake Gen 2 资源,而其他用户却不能?

无法对 Azure Data Lake Gen2 文件使用通配符