2023年1月6日,由新华社瞭望智库主办的“第七届新金融论坛”在京举行。国家统计局统计科学研究所党委委员、首席统计师何强进行了主题演讲。
以下是演讲内容实录:
在官方统计中,目前数据治理通常被定义为对数据的管理和转换行使权力、实施控制,目的是提高数据资产价值,并减少与数据相关的风险。世界银行在其2021年发布的《数据让生活更美好》的报告中,对数据治理也持有类似观点。健全的数据治理框架对数据生态系统的顺利运作至关重要。近些年来,政府、企业和家庭都积极利用数据红利来改善决策或优化业务流程。但是,各级政府部门对数字政府数据的管理、存储和访问方式往往各不相同且不一致,从而削弱了数据驱动治理的效果,并阻碍了由数据科学、分析学和人工智能构成的创新生态系统充分发挥其潜力。因此,需要建立一个国家数据治理政策框架,充分利用数据的力量,来建设更有效运行的数字政府,实现更大的公共利益,做出更具引领性的创新。为此,需要从以下四个方面进行着手。
一、明晰国家高层政策意图
数据治理起始于明确的政策意图,也即是最大限度地利用数据促进发展和改善政策制订。这种政策意图往往是通过政府高层阐述。
国家数据战略的政策意图往往集中在三个主题上。首先,充分利用政府现有数据的价值,建立适当的数据生态系统,促进“数据即服务”建设。其次,建立合适的基础架构和平台,以最大限度地获取和使用这些数据。最后,健全的数据治理需要在数据所有者、聚合者和使用者之间建立信任,因此需要透明的规则和有效的程序。这些主题需要被认真贯彻落实到行动方案之中。
这里,我想重点强调一下数据生态系统构建问题。众所周知,数据正在以前所未有的速度增长。不同平台上的各种数据流正在不断涌向私人和公共领域。但是,并非所有的数据流都能够被完全捕获、分析并产生价值。大量的数据流和及其流动性让数据开发变得困难。数据整理,也即是创建、组织和维护数据集的过程,于是成为数据转化价值链中的一个重要环节。当数据集被共享和整合到一个数据生态系统中时,会变得更加有用。所谓数据生态系统,是指结合了多个数据流,并从综合数据使用中创造价值的平台。数据生态系统并不是完全自发产生的。虽然它可以通过利益的交汇或互利而自然发生,但它的蓬勃发展需要某种形式的组织领导。比如,联合国的商品贸易统计数据库系统,就是一个建立在成员国自愿提供商品贸易数据基础上的数据生态系统。但是,它的成功,其实在更大程度上是得益于联合国统计司在管理数据平台和不断提高其可访问性、可检索性方面的大量努力。良好的数据生态系统,需要秉持“数据即服务”基本原则,持续进行数据聚合,通过安全的交换实现去中心化的访问,最终将自身发展成知识中心、分享数据和见解的平台。
二、夯实数据基础架构和标准
健全的数据治理需要有效的实施机制。支持政策举措和行政程序需要建立国家数据基础架构。数据基础架构是数据从收集到转化和使用过程中,管理数据的规则、政策和机构。目前,一些国家已经颁布了具体法条,为建立数据基础架构提供法律授权;其他国家则依靠内部治理机制来提供指导。
在数据基础框架和标准建设中,我提倡实施“源头质量保证”原则,将收集和管理特定数据集的政府机构指定为“唯一事实来源”实体,并在国家数据综合管理机构中建立数据源的“信任中心”,执行数据融合功能且作为数据中介,还可以通过立法规定关于识别“经许可的用户”和“经许可的数据服务提供商”的条款。
三、有效实施数据托管和管理
国家数据治理涉及政策意图、必要的基础架构以及数据管理和协调机制。在政策层面之下,需要为数据系统顺利运行提供基本服务的支撑实体。其中,两个关键实体分别是数据托管者和数据管理者。
数据托管者履行具体的数据管理职责,包括管理数据收集过程、质量保证机制、存储和检索程序。因此,他们是业务单位,是整个数据系统的基础。数据托管者需要遵守两个重要的操作原则:“源头质量保障”原则和“源头数据隐私保障”原则。在数据治理框架下,政府可以指定特定的实体作为数据托管者。
数据管理者在数据生产过程之上履行专业职能,主要包括评估和促进数据的使用、发现数据系统的缺陷,以及努力满足用户的需求和信任。因此,数据管理者不是监管者或政策决策者,也不是生产单位。无论数据生态系统的规模大小和复杂程度,这个角色总是需要专业技术能力来提升系统的运转。所以,数据管理者更像是一名业务经理,确保为用户提供好的数据。随着数据生态系统的激增和日趋复杂,对数据管理者的专业服务需求将会上升。在新西兰和印度尼西亚,其国家统计局传统上是官方统计生态系统的数据管理者,但是近些年他们已经被赋予了国家治理责任,成为国家数据管理者,这是国家数据治理体制建设中一个重要变化。
四、深入推进数据整合、共享和可获取性
健全的数据管理实践是有效数据治理的一个重要组成部分。各国政府都在努力为数据整合、共享和获取提供健全的管理框架。北欧国家在整合数据库并将其用于各种目的方面,具有深厚的传统。在亚太地区,数据整合过程的步伐近些年来越来越快,出现了很多成功案例。在行业中,包括金融在内的行业机构似乎更有兴趣在严格的隐私规则下分享他们的数据,用于相关的数据聚合分析。当两个或更多的数据源被一个共同的身份联系起来时,就会发生数据整合,而这些数据最初是为不同的目的而收集的。
2016年,科学界首次提出数据的FAIR指导原则,即“可查找、可获取、可互操作、可重复使用”。我认为,任何数据生态系统的资源、工具、元数据和产出,都应该努力满足这四个条件。在数据生态系统中实施FAIR原则将是数据管理者的任务。此外,像澳大利亚和新西兰等国家推行的数据整合和共享的“五个安全”原则,也值得推广。这“五个安全”原则分别是指安全个体、安全项目、安全环境、安全数据和安全输出。
总结一下我今天的发言。我认为,构建中国式现代化的数据治理体系,离不开完善的国家数据治理框架。完善的国家数据治理框架,应当明晰国家高层政策意图,夯实数据基础架构和标准,有效实施数据托管和管理,以及深入推进数据整合、共享和可获取性。在国家数据生态系统迅速扩张的过程中,包括金融机构、统计机构、互联网监管机构等在内的很多数据利益攸关方的职能和功用,将会被重新界定,进而加速推进国家治理的数字化、数据化和数智化。