Azure Data PlatformETL工具(20)——创建Azure Databricks
Posted 發糞塗牆
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Azure Data PlatformETL工具(20)——创建Azure Databricks相关的知识,希望对你有一定的参考价值。
本文属于【Azure Data Platform】系列。
接上文:【Azure Data Platform】ETL工具(19)——Azure Databricks
本文演示如何创建一个Azure Databricks
创建资源
在Azure Portal上输入Databricks,就会出现对应的服务。然后点击进去。
点击创建:
Azure的资源都属于某个特定的资源组,所以资源组是必填项,这里我使用新建一个:
输入工作区名称,在定价层里面,如果预算有限可以使用试用版,这里我使用标准版(因为我够预算☺)
其他后面的选项,可以保持默认,然后创建:
创建Databricks:
相对于ADF而言,Databricks的创建时间比较久。创建完毕后,会看到如下界面(至发文为止的当前版本),里面有很多信息可见:
点击“启动工作区”可以看到很丰富的界面,
左边导航栏处,可以展开,有很多选项:
比如workspace, 可以创建notebook等等,但是要进入比较深的层级。
如果点击【Data】,会提示你先创建一个集群。
要创建集群,可以点击【Compute】或者主界面的Create Cluster
Databricks的集群实际上是Spark集群,是完全托管的,可以自动升降。下面是创建界面:
本文暂时不展开太多演示,所以我们选择默认选项,快速创建一个集群,下面是创建后的样子:
由于这种集群是完全托管的,所以它有一个独特的资源组 databricks-rg-xxxxx,同时你还可以看到有一个专用的存储账户与之关联。跟很多服务类似(如SQL DW),都有自己专用的存储账户。后续会介绍这些东西的作用。
总结
本文演示如何创建这些资源。接下来会做更多的演示。跟大部分Azure服务不同,Databricks的界面非常丰富,功能也很多,需要花不少时间来研究。
以上是关于Azure Data PlatformETL工具(20)——创建Azure Databricks的主要内容,如果未能解决你的问题,请参考以下文章
Azure Data PlatformETL工具(19)——Azure Databricks
Azure Data PlatformETL工具(20)——创建Azure Databricks
Azure Data PlatformETL工具(20)——创建Azure Databricks
Azure Data PlatformETL工具——重新认识Azure Data Factory