再聊图像识别

Posted 803教研室

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了再聊图像识别相关的知识,希望对你有一定的参考价值。



好久没写了,主要是忙。


回南京工作近两个月。这两个月做的技术工作,相当于以前的4个月。无他,不用应对繁琐的事(che)务(d)性(dan)工作,每天就是写代码,写报告,做仿真。


当然,喝酒的量也是以前的两倍,不然怎么说能喝多少酒,就能干多少活()。抽烟的量亦然。。。


现在的主业变成了有限元软件开发。也算兴趣所在,干的比较起劲,就是太耗脑细胞,两个月里从前处理到求解器,到后处理,再到各种转换工具,不亦乐乎。每天两杯远古花纹杯冲泡的速溶雀巢,激情,刺激。


再聊图像识别


五月初的时候,应以前合作过的科普期刊编辑之邀,写了篇复合材料的科普文,算是近期最有成就感的事情,没有所谓的央企超大研究单位做平台,人家依旧相信能拿到有质量的稿子。年轻真好呀,可以做很多单纯不挣钱,又耗时耗力只图个虚荣心的,益事。估计7月能刊出来,到时候再po出来炫一下。


剩下的时间,一大部分在图像识别上。今天就再聊聊这个话题。

                                                                                                                      

     难搞的DCM图     


委托方的需求是,对X光拍摄的结构件图像,进行缺陷识别。这个在上一篇讲的比较多()。X光设备出来的源文件是DCM数据。一般来说,用MATLAB是可以直接读取的,然后就正常去识别就完了。


几十个项目的经验告诉我,事情不会这么简单。本来缺陷识别,核心应该是图像识别,实际上这个问题确实我最容易解决的。


我遇到的问题是,DCM图像打不开!!!我这边50米的大刀饥渴难耐,誓将对方斩于马下。结果人家压根没来,不跟你约。


我尝试着开网上搜索的dcm数据,以及MATLAB自带的dcm图,都ok。就是委托方的dcm不行。


邪性就对了,这么多项目,没一个顺风顺水的。相信我,项目做多了,你会很想在每个项目开工的时候,杀猪宰羊放鞭炮,最好再加上一段癫痫舞蹈,祈求漫天神佛的保佑。意外,会迟到,但一定会来。


     越笨的方法越好用     


我不停的在网上冲浪,找到一些专门用来打开DCM的软件。结果图是可以开,就是。。。。一片漆黑。



试遍了所有的软件,都是黑屏。这可愁死我了。我心说要不直接摇色子猜它有没有缺陷得了。


纠结了几天,多了解了一下dcm。我才发现,原来好多dcm图需要专门去调节窗值,简单理解就是对比度、亮度这些值。我赶紧试了下,果然,能看到影子了。老泪纵横,傲慢不是生存的障碍,无知才是。


接下来的问题就变成了,几百张上千张图,我难道要一个个去调窗值吗?



于是我就写了调用第三方软件,鼠键宏批量调节dcm窗值的代码。程序的优势就是这样,搞懂了小样本,来再多的兵,也是送人头。


于是,搞定。


怎么可能呢?还记得吗,意外,它无处不在。图像转换后,发现将近一半的图对比度效果很差,要么太白,要么太黑。这就是因为,不同批次试验件,当时拍摄的状态不一样,所有需要的窗值设定也是不一样的。所以妄图用同一组窗值,配合鼠键宏操作,解决所有的对比度也是不行滴。


     “人工智能”加一点     


新的问题变成了,如何不同的dcm,设定合适的窗值。这个时候说到底,就要让计算机判断,在一个窗值下,图像的灰度是否均匀,灰度值是否合适?不合适的话,按照一定的规则去调节。


是不是有点熟悉了?判断灰度,这不就是图像识别嘛!问题又串起来了。如何让它一直调节到合适的状态呢?是不是很容易想到“收敛”、“迭代”这些词,这个时候数值的方法又进来了。


当然还是要把“合适”的标准定好,这个需要多试几次摸索下。所以最后的程序结构变成了:


(1)鼠键宏批量读取图像;

(2)判断图像灰度;

(3)合适就输出;

(4)不合适就继续调节,知道满足判据。


为了加快速度,需要加点:防误触操作、自动记忆和继承窗值等等佐料。调试完备以后,你的工作就变成了,点一下鼠标,喝着远古花纹杯冲泡的速溶雀巢,静静看着屏幕上鼠标不停自动移动,调节,一张一张给你处理好每一张图。再点上一根利群,“人生就像一场旅行 不必在意目的地 在乎的是沿途的风景和看风景的心情”。年轻真好呀,你这样想。


    反思    


我后来一直再想,为啥人家的dcm图,特别事医用的,都没这些事,这次委托方的图都这德性。一打听才知道,国产X光设备,且老迈。无他,没按国际标准设计罢了。。。

以上是关于再聊图像识别的主要内容,如果未能解决你的问题,请参考以下文章

什么是图像识别?图像识别是如何实现的?

AI图像识别3:图像识别+语音识别开门

coco图像识别无法使用

AI图像识别1:初识AI图像识别

证件图像识别API接口应用广泛

第五期 图像识别