Azure Data PlatformETL工具(20)——创建Azure Databricks

Posted 發糞塗牆

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Azure Data PlatformETL工具(20)——创建Azure Databricks相关的知识,希望对你有一定的参考价值。

本文属于【Azure Data Platform】系列。
接上文:【Azure Data Platform】ETL工具(19)——Azure Databricks
本文演示如何创建一个Azure Databricks

创建资源

在Azure Portal上输入Databricks,就会出现对应的服务。然后点击进去。

点击创建:

Azure的资源都属于某个特定的资源组,所以资源组是必填项,这里我使用新建一个:

输入工作区名称,在定价层里面,如果预算有限可以使用试用版,这里我使用标准版(因为我够预算☺)

其他后面的选项,可以保持默认,然后创建:

创建Databricks:

相对于ADF而言,Databricks的创建时间比较久。创建完毕后,会看到如下界面(至发文为止的当前版本),里面有很多信息可见:

点击“启动工作区”可以看到很丰富的界面,


左边导航栏处,可以展开,有很多选项:


比如workspace, 可以创建notebook等等,但是要进入比较深的层级。


如果点击【Data】,会提示你先创建一个集群。


要创建集群,可以点击【Compute】或者主界面的Create Cluster

Databricks的集群实际上是Spark集群,是完全托管的,可以自动升降。下面是创建界面:

本文暂时不展开太多演示,所以我们选择默认选项,快速创建一个集群,下面是创建后的样子:

由于这种集群是完全托管的,所以它有一个独特的资源组 databricks-rg-xxxxx,同时你还可以看到有一个专用的存储账户与之关联。跟很多服务类似(如SQL DW),都有自己专用的存储账户。后续会介绍这些东西的作用。

总结

本文演示如何创建这些资源。接下来会做更多的演示。跟大部分Azure服务不同,Databricks的界面非常丰富,功能也很多,需要花不少时间来研究。

以上是关于Azure Data PlatformETL工具(20)——创建Azure Databricks的主要内容,如果未能解决你的问题,请参考以下文章

Azure Data PlatformETL工具(19)——Azure Databricks

Azure Data PlatformETL工具(20)——创建Azure Databricks

Azure Data PlatformETL工具(20)——创建Azure Databricks

Azure Data PlatformETL工具——重新认识Azure Data Factory

Azure Data PlatformETL工具(11)——ADF 数据流

Azure Data PlatformETL工具——使用Azure Data Factory数据流传输数据