精品文章基于图像识别的电能表智能建档系统研究
Posted 电工仪器仪表生产力促进中心
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了精品文章基于图像识别的电能表智能建档系统研究相关的知识,希望对你有一定的参考价值。
赵兴旺1,2,叶剑斌1,2
(1. 南瑞集团有限公司国网电力科学研究院,南京210003;2. 国电南瑞南京控制系统有限公司,南京 210003)
关键词:电能计量生产;电能表;智能建档;图像识别;识别后处理;Bi-gram
国家电网公司和南方电网公司均在其省(直辖市)电力公司完成或正在建设省级计量检定中心,实现了电能表等计量设备检定检测的整体式授权,同时,又在省级计量检定中心推进自动化检定生产设施建设,推广应用检定自动化检定检测流水线和智能化立体式存储库房。各省电能计量设备检定,由原来的地市人工检定的方式,转变为省级计量检定中心集中自动化检定。在此背景下,检定流水线替代了原有的人工挂表检定方式;智能化仓储替代了原有的人工搬运盘点模式,充分发挥了检定自动化设备优势,整个检定过程很少需要人为干预。目前计量检定中心正在向智能化、无人化、高可靠方向发展。
省级计量检定中心现采用“需求驱动生产,生产响应需求”的管理方式,开展采购、到货、检定、配送工作,主要流程包括:供应商按供货通知要求送货至计量中心、中心资产管理人员收货建档、计量生产平台调度智能立库进行新表到货入库、计量生产平台调度检定流水线和智能立库对设备进行自动化检定,按地市需求通过计量生产平台调度智能立库进行配送出库。
电能表建档是指:省级计量检定中心资产管理人员根据供应商提供的到货设备参数和RFID标签群读装置上传的设备条码信息,建立计量资产档案信息。现采用人工维护方式实现,但存在批次多、维护工作量大、填报录入容易发生错误、效率低影响生产等问题。实际生产中也发生过因将单相电能表的电流维护错误,导致单相检定流水线续流板烧坏等类似事件。
通过调研发现国网公司和南网公司对各类计量设备均有对应企业标准技术规范,包括:规格、环境条件、安装尺寸、机械性能、材料及工艺、功能配置、外形结构、电气性能等方面的技术要求和试验项目等内容。其中,外观结构对计量设备印刷位置和内容进行了具体规范要求,详细包含设备条码、公司LOGO、相关参数、制造标准、液晶屏尺寸、制造厂商、生产年份等,参数主要有电压、电流、频率、有无功准确度等级、有无功常数等,基本囊括了设备建档所需的主要参数信息。
另外,随着省级计量检定中心移动办公软件建设的逐步落地,为研究通过采用移动终端采集电能表外观图像的智能建档系统提供前置条件,系统可避免人工干预,进一步提升中心自动化管理水平。鉴于此,文中研究实现了基于图像识别的电能表智能建档系统,系统具有一般通用性。
提出一套可识别参数的电能表智能建档系统,系统基于智能终端采集电能表外观图像,经过参数区域定位、字符切分、特征抽取、分类识别以及识别后处理后,实现参数信息识别获取,并结合设备条码自动完成电能表建档。系统流程详见图1所示。
2 电能表参数定位和切分
电能表参数定位和切分将电能表外观图像中的待识别参数区分检出来,并对各参数区进行单个字符切分。电能表建档参数定位和切分主要由特征区匹配、参数区定位和字符切分三大部分内容组成,流程详见如图2所示。
图1 系统流程
Fig.1 System flow
图2 电能表参数定位和切分流程
Fig.2 Parameter positioning and segmentation flow of energy meter
2.1 特征区匹配
电能表按照相数可分为单相电能表和三相电能表,单相电能表主要用于普通居民用户,三相电能表主要用于工商业大用户。按计量设备企业标准技术规范,单相电能表与三相电能表的外观及参数印刷位置和印刷内容存在较大差异,鉴于此,研究采用特征区图像匹配方法实现单、三相电能表图像的识别和区分。整体的策略为:通过分析单、三相电能表外观图像,分别选取单、三相电能表的轮显按钮区域作为各自的特征模板图像,通过特征点匹配方法实现单、三相电能表的识别和判断。具体步骤如下:
步骤1:对电能表外观采集图像顺序进行灰度化和二值化处理,再利用二值图像,基于Hough变换直线检测方法对原采集图像进行倾斜矫正;
步骤2:考虑采集图像可能发生旋转或大小变化等情况,研究使用SIFT特征点匹配算法,将矫正后的电能表采集图像分别与单、三相电能表特征区模板图像进行匹配;
步骤3:选择匹配特征点多的特征区模板图像作为该采集图像所属的相别,即单相电能表或三相电能表,并记录特征区的坐标位置和大小。其中,单、三相电能表的特征点匹配结果如图3所示。
鉴于电能表参数印刷位置固定,研究将特征区作为参考位置,统计各参数区坐标位置与参考坐标位置的距离(像素差值)。通过计算实际匹配所得的特征区大小和参考特征区大小的比值,实现各参数区的定位。具体识别参数如表1所示。
步骤1:分别选取一张单相电能表和三相电能表的样本图像作为基准图像,假设基准图像的特征区宽度为w0、高度为h0,其左上角坐标为(x0,y0),与第i个参数区的左边界距离为ldi0、右边界距离为rdi0、上边界距离为udi0、下边界距离为ddi0;
步骤2:针对待识别的电能表采集图像,假设经匹配算法得到的特征区宽度和高度为w、h,其左上角坐标为(x,y),分别计算采集图像的特征区和基准图像的宽高比系数为kw=w/w0、kh=h/h0;
步骤3:根据宽高比系数,分别计算各参数区图像的左上角坐标以及区域的宽度和高度,其中,第i个参数区位置信息为:
(1)
式中 wi表示i个参数区的宽度;hi表示i个参数区的高度;xi表示i个参数区左上角的横坐标;yi表示i个参数区左上角的纵坐标;
步骤4:对局部参数区图像进行二值化处理,通过直方图投影算法进行去噪处理,从而达到各参数区图像的精确定位。单相电能表和三相电能表参数区坐标位置图像如图4所示。
字符切分是指将各参数区图像切分为单个字符图像。文中研究的电能表参数涉及的字符由数字、大写字母、小写字符、汉字和特殊字符(括弧、斜线等)组成,字符的大小和间距均不相同,情况较为复杂。
针对均匀光照图像,通常采用基于二值图像的垂直投影法实现字符切分,但对于非均匀光照下的电能表外观采集图像,采用一般二值化方法处理后常会出现字符断裂等情形,无法达到精确切分的目的。鉴于此,提出基于大津法(又称“最大类间阈值法”,简称Ostu)的改进的垂直投影直方图方法实现对断裂字符的准确切分。具体步骤如下:
步骤1:对各参数区图像进行灰度化处理,再应用Ostu二值化方法进行二值化处理后,得到参数区二值图像;
步骤2:将参数区二值图像的像素点在垂直方向进行投影,得到参数区的垂直投影直方图;
步骤3:统计投影直方图分割得到的子图像平均宽度和子图像间平均间距,分别设为AvgWidth和AvgGap;
步骤4:遍历投影直方图子图像,通过比较子图像宽度(设为CharWidth)、子图像间距(设为CharGap)与子图像平均宽度、子图像间平均间距之间的关系进行断裂字符判断和处理。设kw=CharWidth/AvgWidth、kg=CharGap/AvgGap,若kw<1且kg<1,则说明该子图像存在断裂情况,就将该子图像与其左侧子图像或右侧子图像进行合并,也即实现将断裂字符图像合并;若kw≥1或kg≥1,则说明该子图像不存在字符断裂情况,即为单个字符图像。
通过大量样本图像表明该方法可准确实现参数区字符切分,有效解决字符断裂等问题。“型号”参数区字符切分流程如图5所示。
图5 型号参数区字符切分流程
Fig.5 Character segmentation process in model parameter area
3 电能表参数识别与建档
电能表外观采集图像经图像处理与分析后,各参数区图像被切分为单个字符图像,下面通过对单个字符图像的识别以实现对整个参数串的识别。分类识别流程如图6所示,具体包括:标准化、特征抽取、字符识别、参数串识别后处理。
3.1 标准化
对于单个字符图像,其大小不一。为便于特征提取计算、降低特征的维度,采用双线性插值方法将原字符图像进行标准化处理,缩放至统一尺寸。考虑数字、字母、汉字、符号等图像形状均为长方形,采用双线性插值方法将单个字符图像统一标准化为32×48像素,即经切割后的字符图像若尺寸不为32×48像素,则将其统一标准化[16]为32×48像素。
3.2 特征抽取
对于标准化后的单个字符图像,采用网格统计特征对字符进行特征提取和识别。网格大小为8×8像素,通过隶属函数计算网格内隶属度作为网格的特征值。同时,使用特征数据构建字库,作为分类识别的依据。
3.3 分类器设计
设计采用K最近邻(KNN)算法对单个字符图像进行分类识别,KNN算法主要思路为:首先,计算待识别单个字符与已知类别的字符图像(字库)之间的距离;其次,按照距离(多采用欧式距离作为计算依据)递增次序排序,选取与待识别字符距离最近的K个字符;再次,确定前K个字符所在类别的出现次数;最后,返回前K个字符出现次数最高的类别作为待识别字符的预测分类。参数串中所有字符图像识别完成后,将所有字符的识别结果合并作为该参数串的整体识别结果。
3.4 后处理
受字符结构复杂、相似字符多等因素影响,单个字符的识别率受到了一定程度的限制,导致参数串的整体识别率不高,无法满足计量中心实际应用需要。为提高电能表参数串识别的准确率,对文中研究的电能表参数区待识别字符串进行分析发现,所有电能表参数均是电能表生产厂商按照省级计量检定中心要求和需求进行印刻的,计量中心拥有所有可能的参数集合信息,因此,对于待识别的电能表外观图像,省级计量中心仅仅不知道是参数集合中的哪一项而已。鉴于此,利用电能表参数的这一特殊性,提出了一种基于Bi-gram语言模型的电能表参数串识别后处理方法。具体步骤如下:
步骤1:根据参数集合统计构建语料库(不同参数分别构建),包括:参数串中单字符的字频、字符出现在句首的字频率以及字字同现的频率,字字同现统计采用Bi-gram二元语法,即统计两字同现的情况。Bi-gram二元统计语言模型是将整个参数串的概率值分解为单位条件概率值的乘积,即:
(2)
式中 S为某一参数字符串;n为字符串长度(即字符个数);ωi为语言模型的基本单位,此处为单个字符。Bi-gram采用Markov假设,每个预测单位只依赖于它前1个单位的概率,即:
P(ωi|ω1,ω2,…,ωi-1)=P(ωi|ωi-1)(3)
其中,条件概率值基于语料库采用MLE最大似然估计法估计求取,即:
(4)
式中 c(ωi-1,ωi)表示在构建的语料库中基本单位串ωi-1,ωi出现的次数;P(ω1)表示ω1在句首出现的概率,采用MLE将其表示为ω1出现在句首的字频与该参数的语料库数量的比值。
另外,考虑语言模型的局限性,研究将可靠性融入基于Bi-gram语言模型的电能表参数串识别后处理中,调整条件概率值为:
P′(ωi|ωi-1)=αP(ωi|ωi-1)+βcondfi,α+β=1(5)
式中 α和β可根据实验情况进行调整;condfi当前候选字的可靠性值。
可靠性计算方法:假设待识别的字符图像经分类器识别后,与类i的距离为di,且类i的类内平均距离为即:
(6)
步骤2:使用分类器对参数串中每个字符进行分类识别,求取距离最新的k个候选字符并计算可靠性;
步骤3:根据式(2)计算不同句首下的整个参数串的概率值,将最大概率值的后处理识别结果作为整个字符串的最终识别结果。
3.5 智能建档
在电能表全部参数的识别后处理完成后,综合接收到的RFID标签群读装置上传的设备条码信息,实现对电能表设备进行智能建档。电能表档案信息具体包括:资产条码、电压、电流、频率、有功准确度等级、供应商、设备名称、型号、模块厂商、无功准确度等级、有功常数、无功常数等。
3.6 实验结果与分析
采用移动终端在光照均匀和不均匀、抖动和不抖动等不同场景下,采集428张24位真彩色电能表(其中单相电能表201张、三相电能表227张)图像作为实验样本。采用图像预处理和分类识别方法,对428张样本图像进行分类识别实验,对预处理完全正确的395张图像,系统能准确识别382张,单个字符的识别率为92.73%,整个电能表参数串的识别结果如表2所示。
4 结束语
文中应用图像处理和模式识别相关技术,通过对电能表外观中参数串识别进行研究,建立了基于图像识别的电能表智能建档系统。系统对电能表图像进行了特征区匹配、参数区定位、字符切分等预处理工作,研究使用SIFT特征点匹配算法实现单、三相电能表图像的精确判断,提出基于大津法的改进的垂直投影直方图方法实现对断裂字符的准确切分;针对字符分类识别,提出了基于Bi-gram语言模型的电能表参数串识别后处理方法,使参数串整体识别率提高了14.49%,取得了较好的效果。下一步,将对计量自动化终端和互感器开展研究,以实现全部计量设备的智能建档。
来源/《电测与仪表》
中国电工仪器仪表信息网(www.tc104.org)
如有合作意愿 请咨询 0451-86659398
©中国电工仪器仪表信息网
以上是关于精品文章基于图像识别的电能表智能建档系统研究的主要内容,如果未能解决你的问题,请参考以下文章