Azure/Microsoft 认知服务自定义视觉 - 啥是对象检测模型输出张量规范?

Posted

技术标签:

【中文标题】Azure/Microsoft 认知服务自定义视觉 - 啥是对象检测模型输出张量规范?【英文标题】:Azure/Microsoft Cognitive Services Custom Vision - What is the Object Detection model output tensor specification?Azure/Microsoft 认知服务自定义视觉 - 什么是对象检测模型输出张量规范? 【发布时间】:2019-07-22 00:17:33 【问题描述】:

我正在尝试调整示例图像分类 android 项目,可在

https://github.com/Azure-Samples/cognitive-services-android-customvision-sample

对于导出的自定义视觉对象检测模型,但输出张量的结构不是很清楚 - 因为它包括边界框等。

我还尝试转换为 tensorflow lite 并将模型放入“寿司检测器”ios 项目中

https://medium.com/@junjiwatanabe/how-to-build-real-time-object-recognition-ios-app-ca85c193865a

但同样不清楚输出结构是什么,也不清楚它是否符合 tf API:

https://www.tensorflow.org/lite/demo_ios

导出 tf 包时有一些 python 示例,但我不确定如何转换为 Java/swift/Objective C - 参见例如

https://***.com/a/54886689/1021819

感谢大家的帮助。

【问题讨论】:

PS 版主:我知道这是特定于服务的,但 Azure 正在使用 *** 来解决技术问题。另外:如果问题(在标题中)不清楚,请提出建设性的改进,而不是简单地投反对票。谢谢! 【参考方案1】:

如果您解压缩导出的模型 zip 文件,您可以在其中找到一个 python 文件夹。它包含 Python 中的示例代码,展示了如何解析模型输出。

【讨论】:

【参考方案2】:

有点晚了,不过。这是来自 Custom Vision 的对象检测 .tflite 模型的输出。它有一个输出张量。

【讨论】:

以上是关于Azure/Microsoft 认知服务自定义视觉 - 啥是对象检测模型输出张量规范?的主要内容,如果未能解决你的问题,请参考以下文章

微软认知服务应用秘籍 – 搭建基于云端的中间层以支持跨平台的智能视觉服务

Microsoft 认知服务视觉 API ClientException 错误

认知服务 - 自定义语音 C++

Azure 认知服务 TTS 自定义语音终结点测试

是否有可能为 Azure 托管的 API 管理创建自定义小部件?

Azure 认知服务 - 使用 python 和 websockets 自定义语音