如何查看和解释 Vertex AI 日志

Posted

技术标签:

【中文标题】如何查看和解释 Vertex AI 日志【英文标题】:How to view and Interprete Vertex AI Logs 【发布时间】:2021-11-08 10:23:45 【问题描述】:

我们已经在 Vertex AI 端点中部署了模型。 现在我们想知道和解释有关事件的日志 节点创建、POD创建、用户API调用矩阵等。

有什么方法或键可以过滤日志以进行分析吗?

【问题讨论】:

Vertex AI Logs 在文档中有很好的描述。或者,也许您正在寻找有关 Log Explorer 的信息,您能否详细说明您想要实现的目标? 请澄清您的具体问题或提供其他详细信息以准确突出您的需求。正如目前所写的那样,很难准确地说出你在问什么。 我相信 VertexAI 使用 Container 和 Kubernetes。我想查看创建新 Kubernetes pod 的时间。它占用的资源量。正在运行的 pod 数量等。 【参考方案1】:

由于您没有具体说明您的问题,我将提供一个非常笼统的答案,这可能会对其他成员有所帮助。

有一个解释 Vertex AI 日志信息的文档 - Vertex AI audit logging information。

Google Cloud 服务会编写审核日志来帮助您回答以下问题:“谁在何时何地做了什么?”在您的 Google Cloud 资源中。

目前Vertex AI支持2种审计日志:

Admin Activity审核日志

管理员活动审核日志包含 API 调用或修改资源配置或元数据的其他操作的日志条目。例如,这些日志记录用户何时创建 VM 实例或更改身份和访问管理权限。

Data Access 审核日志

数据访问审核日志包含读取资源配置或元数据的 API 调用,以及创建、修改或读取用户提供的资源数据的用户驱动的 API 调用。

Vertex AI 目前不支持其他两个,例如 System Event logsPolicy Denied logs。在指南Google services with audit logs 您可以找到更多信息。

如果要查看审核日志,可以使用Consolegcloud 命令或API。根据您想要获得它们的方式,您应该遵循Viewing audit logs 中提到的步骤。例如,如果您使用Console,您将使用Log Explorer。

可能有帮助的其他线程:

How do we capture all container logs on google Vertex AI? How to structure container logs in Vertex AI?

【讨论】:

【参考方案2】:

对于容器日志(由您的模型创建的日志),您目前不能, 整个日志条目由 Vertex AI 平台捕获,并作为字符串分配给父“jsonPayload”字段中的“message”字段, @PjoterS 的上述答案提出了一种解决该限制的方法,在我看来这并不容易。 如果 Vertex 提供了某种机制,您可以使用它们的 gcloud logging lib 或更好的方式直接从容器登录到端点资源,将捕获的日志字段作为子字段解压缩到“jsonPayload”父字段,或者解压缩到“jsonPayload”父字段,那就更好了“消息”

【讨论】:

以上是关于如何查看和解释 Vertex AI 日志的主要内容,如果未能解决你的问题,请参考以下文章

如何跟踪来自 Vertex AI 管道的参数和指标

如何查看pgsql日志

Google Cloud Platform Vertex AI 日志未显示在自定义作业中

如何在 Vertex AI 表格预测中分配两个或多个时间序列标识符列

如何使用 Vertex AI Endpoint 部署预处理代码

如何在 Vertex AI AutoML 时间序列模型中选择目标列