在天蓝色斑点中保存火花ML模型

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在天蓝色斑点中保存火花ML模型相关的知识,希望对你有一定的参考价值。

我尝试将pyspark中的机器学习模型保存到azure blob。但这是错误的。

lr.save('wasbs:///user/remoteuser/models/')

Illegal Argument Exception: Cannot initialize WASB file system, URI authority not recognized.'

也尝试过,

m = lr.save('wasbs://'+container_name+'@'+storage_account_name+'.blob.core.windows.net/models/')

但无法识别堆栈跟踪中的用户身份。附: :我没有使用Azure HDInsight。我只是使用Databricks和Azure blob存储

答案

要直接从Azure Databricks访问Azure Blob存储(未安装),您必须设置一个帐户访问密钥:

spark.conf.set(
  "fs.azure.account.key.<your-storage-account-name>.blob.core.windows.net",
  "<your-storage-account-access-key>")

或容器的SAS。然后你应该能够访问Blob存储:

val df = spark.read.parquet("wasbs://<your-container-name>@<your-storage-account-name>.blob.core.windows.net/<your-directory-name>")

以上是关于在天蓝色斑点中保存火花ML模型的主要内容,如果未能解决你的问题,请参考以下文章

C#上传IList 到一个天蓝色的斑点

使用.net核心Web API和jquery从天蓝色斑点中上传和检索图像

在火花簇scala中保存随机森林模型时出错

如何加载保存的 KMeans 模型(在 ML Pipeline 中)?

如何在新数据到来时重新训练 pyspark 中保存的线性回归 ML 模型

火花流中的广播变量空指针异常