如何深入了解 AzureML 端点部署的异常和日志记录

Posted

技术标签:

【中文标题】如何深入了解 AzureML 端点部署的异常和日志记录【英文标题】:How to get insights in exceptions and logging of AzureML endpoint deployment 【发布时间】:2020-06-23 14:06:42 【问题描述】:

由于我的 InferenceConfig 中有错误的 score.py 文件,Model.Deploy 无法使用 ACI 进行 Azure 机器学习。我想在云中创建端点,但我在门户中看到的唯一状态是不健康。我用于部署模型的本地脚本(使用 )一直运行,直到超时。 (使用service.wait_for_deployment(show_output=True)statement)。

是否有一个选项可以更深入地了解部署变为“不健康”的实际原因/错误消息?

【问题讨论】:

【参考方案1】:

通常超时是由评分脚本中的 init() 函数中的错误引起的。您可以使用print(service.get_logs())获取详细日志以查找Python错误。

有关更全面的故障排除指南,请参阅:

https://docs.microsoft.com/en-us/azure/machine-learning/how-to-troubleshoot-deployment

【讨论】:

以上是关于如何深入了解 AzureML 端点部署的异常和日志记录的主要内容,如果未能解决你的问题,请参考以下文章

weblogic 9i 启动部署有struts 2的应用,日志异常

weblogicwar包,捕获的异常在哪看

如何查看和解释 Vertex AI 日志

深入了解 Java 中的异常处理 + 面试题

创建 azureml 环境时如何指定 pip extra-index-url?

logback运行时异常怎么记录