创建检测卡片值的 ML 模型

Posted

技术标签:

【中文标题】创建检测卡片值的 ML 模型【英文标题】:Creating an ML-Model that detects card-values 【发布时间】:2020-12-05 05:16:07 【问题描述】:

这是一个关于训练 ML-Model 来检测卡片的更通用的问题。

这些卡片是儿童游戏,有 4 种不同的颜色、数字和符号。我不需要检测颜色,只需检测卡片的值(即符号)。

我尝试用我的 iPhone 为每张卡片拍照,使用 RectLabel 在左上角的符号周围绘制矩形(卡片的右下角也有一个倒置的符号,我没有标记这些,因为它们在检测过程中会被隐藏)。 我裁剪了图像,因此只有卡片可见,没有周围环境。

然后我将我的图像上传到 app.roboflow.ai 并让它们发挥作用(使用自动定向、调整为 416x416、灰度、自动调整对比度、旋转、剪切、模糊和噪点)。

这给了我另一组图像,我用这些图像用 Apple 的 CreateML 训练我的模型。

但是,当我在我的应用程序中使用该模型时(我正在使用 Apple 的早餐查找器演示),未检测到卡片值 - 嗯,有时它可以工作,但仅在与手机有一定距离的情况下,并且标签要么是倒置的,要么是横向的。

我猜这是因为我的图像没有按应有的方式拍摄?

关于我必须如何设置整个事情以便我的模型得到良好训练的任何提示?

【问题讨论】:

【参考方案1】:

我敢打赌这就是问题所在:

我裁剪了图像,因此只有卡片可见,没有周围环境

您希望您的训练图像与您的模型在野外看到的图像尽可能相似。如果它只在没有环境的卡片图像上进行训练,然后你向它展示带有周围事物的卡片图像,它将不知道该怎么做。

此UNO scoring example 与您的问题极为相似,可能会提供一些想法和指导。

【讨论】:

太棒了!万分感谢!这正是我想要的!

以上是关于创建检测卡片值的 ML 模型的主要内容,如果未能解决你的问题,请参考以下文章

Core ML简介及实时目标检测及Caffe TensorFlow coremltools模型转换

Core ML简介及实时目标检测及Caffe TensorFlow coremltools模型转换

创建 ML - 是不是可以找到检测到的对象的位置?

不确定如何训练 ML 模型来识别静态图像

如何顺序链接 ML 模型/管道模型?

OpenFace CoreML 模型。没有人脸检测