【专家视点】重视大数据中的“隐秘角落”——隐形数据的安全问题及其挑战

 作者:闵京华,中电长城网际系统应用有限公司

大数据具有体量大、种类多、生成快、变化多等特征,其中蕴藏的价值,随着云计算、人工智能、移动互联网等新一代信息技术的迅猛发展,被不断地挖掘出来,给人类的生活和工作带来了翻天覆地的变化。与此同时,大数据的安全问题相伴而生,大数据的应用越广泛越深入,其安全问题就越严峻越棘手。

大数据的价值呈现不同于传统数据。传统数据的价值一般直接呈现在有限范围内可见到的数据上,如交易数据、科技论文等,而大数据的价值呈现则需要大范围地不断挖掘,如客户的消费偏好、科技发展的热点和趋势等。由此可见,大数据中存在两种形态的数据,一种是显形数据,另一种是隐形数据。所谓显形数据是指能直接看到的数据,也就是说数据就在眼前;所谓隐形数据是指需要经过挖掘(即搜集、分析、关联和生成)之后才能看到的数据,也就是说这种数据最初是不知道在哪里的,需要时才去通过挖掘来获取,使其成为显形数据。这两种形态的数据都具有价值,都面临着各种安全问题,都需要加以保护。对于显形数据,传统的数据保护措施(如加密、访问控制)是有效的,但对于隐形数据却很难奏效,因为不知道需要保护的数据在哪里,总不至于把含有隐形数据的所有数据都加密或控制对其访问,这样不仅保护成本过高,而且还阻碍了数据的合理流通和应用,是得不偿失。

人们通常关注的是显形数据,却往往忽视了隐形数据,即可谓大数据中的一个“隐秘角落”,尚缺乏足够的关注与重视。如何保护大数据中的隐形数据安全?这是不同于传统数据安全保护的新挑战。传统数据安全保护对象是看得见的显形数据,保护措施直接落在需要保护的数据上,但这种保护措施却不适用于看不见的隐形数据。隐形数据安全保护对象虽不宜直接是那些看不见的隐形数据本身,但可以考虑隐形数据的挖掘过程、方法和工具,对其采取安全控制措施,即通过从安全角度规范数据挖掘过程、审查数据挖掘方法、控制数据挖掘工具,从而达到保护隐形数据安全的目的。为此,需要新的思路、方法和技术手段来发现隐形数据的安全隐患并加以防范。同时,在大数据安全教育培训中,增加人们对隐形数据安全保护的意识及相关知识和技能。

《中华人民共和国数据安全法》规定对数据实行分类分级保护,制定重要数据目录,加强对重要数据的保护。大数据显性或隐性地包含着重要数据,即表现为显形重要数据或隐形重要数据。重要数据目录不仅要列出显形重要数据,还应描绘出隐形重要数据。同样地,对重要数据的保护,既要保护看得见的显形重要数据,也要保护看不见的隐形重要数据。风险管理是数据安全的基本方法,因此,风险评估既要识别出显形重要数据,也要识别出隐形重要数据,为风险处置所采用的数据安全保护措施提供依据和落实对象。

表  大数据中显形数据与隐形数据的对比

上表从不同方面对大数据中的显形数据和隐形数据进行了对比。

综上所述,隐形数据安全是大数据带来的一大安全挑战,传统的数据安全保护方式和手段对其难以适用,有待重新认识和不断创新。相信大数据、云计算、人工智能、移动互联网等新一代信息技术也是解决其自身带来的安全问题的有效途径。

(作者简介:闵京华,博士,教授级高级工程师。毕业于清华大学,先后获学士学位和硕士学位,曾在清华大学计算机科学与技术系任教。留学日本,毕业于日本东京大学获博士学位,曾作为HIVIPS(日立高级访问学者)就职于日立制作所中央研究所。回国后,先后就职于北京清华得实科技股份有限公司(后更名为北京同方信息安全技术股份有限公司),任高级研究员;中国电子科技集团第三十研究所所属上海三零卫士信息安全有限公司,任首席安全战略咨询官。现就职于中国电子信息产业集团有限公司(CEC)所属中电长城网际系统应用有限公司,任标准化总工。研究领域为信息技术,研究方向为信息安全、云计算、大数据、智慧城市、人工智能等,研究专长为信息技术标准化。)

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章