现代信息技术高速发展,云计算、大数据、物联网、移动应用和5G等新技术的出现正从方方面面改变着社会的运行方式。从科学研究、生产制造,到社交学习和生活娱乐,无处不体现着各种新信息技术的作用。新信息技术的开发过程中,离不开大量数据的测试和验证,正是由于新技术的爆发式增长,在开发和测试环节发生的数据泄漏事件层出不穷。
为了使测试更接近真实环境,测试所用数据通常由生产环境导出,这一行为通常会产生三种风险:
1、合规风险:
生产环境和开发测试环境一般属于不同安全区域,敏感信息在不同安全级别区域间流动时,需要进行处理,特别是个人信息,必须处理成无法识别特定个人且不能复原,才可以用作其它方面。
2、数据泄漏:
开发测试环境属于安全级别较低的区域,且开发测试工作由外包团队完成的情况非常普遍。生产数据在毫无安全防护的条件下驻留在开发测试环境容易发生数据泄漏的事件。
3、数据处理不当:
对生产数据进行技术处理,既要使测试过程接近真实环境,又要求处理后的数据不包含敏感信息,这需要有合适的脱敏技术,能够在两者之间取得平衡。
敏感数据自动发现
基于字段名、字段内容匹配、以及复合发现规则和用户自定义敏感数据发现规则,对数据源的敏感数据自动发现和标识。帮助用户从海量的的字段定义敏感数据元的工作中解脱出来,大大提高了系统的可用性。
制定脱敏策略
针对每种敏感数据,需要梳理出脱敏策略,才能够进行脱敏技术的实施。脱敏策略要考虑敏感数据的类型和匿名化的效果,以及该数据在开发测试过程种的用途和要求。
数据脱敏
在生产数据进入开发测试环境之前,要经过数据脱敏处理,根据数据的类型和敏感级别,采用高保真的脱敏技术和算法,使数据达到匿名化的标准,并满足开发测试对数据的仿真要求。
脱敏结果检查
主要是检查脱敏结果是否符合预期,并且检查脱敏后的数据是否仍然存在敏感数据,特别是个人信息,必须达到匿名化的标准。