2脱敏数据
Posted 悄悄努力
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2脱敏数据相关的知识,希望对你有一定的参考价值。
脱敏数据测试注意事项
测试字段中脱敏数据
来源一个服务器日志一个是ES系统中
ES系统日志有延时性质。所以测试过程优先排查应用服务器打印日志
/home/finance/Logs/stdprocwithdraw.msxf.lo
日志:all.8080.2021-10-12.0.log
异常日志:error.8080.2021-09-09.log
业务日志 /home/finance/Logs/decisionapi.msxf.lo/business
1、因为项目中定义的字段名称各有不同,所以需要咨询研发接口中字段的含义,根据脱敏提供字段名称进行排查
排查字段参考http://wiki.msxf.com/pages/viewpage.action?pageId=16718854
下面以申请单为例:查找字段applyNo:
grep -n \' applyNo:\' all.8080.2021-10-12.0.log
根据排查结果查看是否脱敏
用查出来“申请单号”进行查询避免遗漏()
grep -n \'1795052781971702024\' all.8080.2021-10-12.0.log
查询样例:
手机号: egrep \'^1[3578][0-9]{9}\' all.8080.2021-10-12.0.log 身份证: egrep \'[0-9]{18}|[0-9]{17}X\' all.8080.2021-10-12.0.log 银行卡: 待完善 姓名: 待完善 |
注意问题:
1).发现测试环境日志内容很少或者没有接口返回报文。询问研发是否日志级别较低,调整和线上级别一直即可 优先级从高到低分别是ERROR、WARN、INFO、DEBUG。
2)ES测试人员定期排查自己熟悉应用。通过日志查找排查是否关键字段数据没有进行脱敏。发现未脱敏及时和相应研发联系及时修复
3)自动巡检。利用检查工具定期巡检,一周一次进行排查(工具开发中)
数据脱敏——什么是数据脱敏
一、什么是数据脱敏?
数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。
百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。
生活中不乏数据脱敏的例子,比如我们最常见的火车票、电商收货人地址都会对敏感信息做处理,甚至女同志较熟悉的美颜、有些视频中的马赛克都属于脱敏。
二、为什么要进行数据脱敏?
上面说到,在“涉及客户安全数据或者一些商业性敏感数据的情况下”对数据进行改造,说明我们要进行改造的数据是涉及到用户或者企业数据的安全,进行数据脱敏其实就是对这些数据进行加密,防止泄露。
对于脱敏的程度,一般来说只要处理到无法推断原有的信息,不会造成信息泄露即可,如果修改过多,容易导致丢失数据原有特性。因此,在实际操作中,需要根据实际场景来选择适当的脱敏规则。改姓名,身份证号,地址,手机号,电话号码等几个客户相关字段。
三、如何实现数据脱敏
按照脱敏规则,可以分为可恢复性脱敏和不可恢复性脱敏。可恢复性脱敏就是数据经过脱敏规则的转化后,还再次可以经过某些处理还原出原来的数据,相反,数据经过不可恢复性脱敏之后,将无法还原到原来的样子,可以把二者分别看做可逆加密和不可逆加密。
我们目前遇到的场景是日志脱敏,即在把日志中的密码,甚至姓名、身份证号等信息都进行脱敏处理。
脱敏前:
脱敏后:
如上图,仔细分析会发现,打日志之前,获得脱敏的数据就两个步骤:【拿到要输入的数据(user实体)】→【进行序列化】,所以要进行数据脱敏可以考虑在这两个步骤上进行实现。第一个方法就是在序列化实体之前先把需要脱敏的字段进行处理,之后正常序列化;第二个方法就是在实体序列化的时候,对要脱敏的字段进行处理。
后面来分享一下具体实现数据脱敏的方法。
【 转载请注明出处——胡玉洋《数据脱敏——什么是数据脱敏》】
以上是关于2脱敏数据的主要内容,如果未能解决你的问题,请参考以下文章