摘要:在当今数字化浪潮席卷全球的时代,数据已成为推动社会发展和经济增长的关键生产要素,如同石油和电力之于工业时代。国家数据基础设施作为支撑数据全生命周期活动的关键体系,正逐渐成为数字时代的核心基础设施,其重要性不言而喻。
从宏观层面看,国家数据基础设施是数字经济蓬勃发展的基石。它支撑着数据从采集、存储、处理、分析到应用的全流程,为各类数字创新和业务模式提供了坚实的底层支撑。在微观层面,对于企业和个人而言,国家数据基础设施的完善,意味着更高效的数据获取、更精准的数据分析以及更广泛的数据应用,从而为企业创新和个人生活带来极大便利。
随着数字技术的飞速发展,国家数据基础设施的内涵和外延不断丰富。其中,隐私保护计算、区块链、可信数据空间、数场、数联网、数据元件等概念逐渐成为这一领域的关键组成部分,它们相互关联、协同作用,共同推动着国家数据基础设施的发展和完善。接下来,让我们逐一深入了解这些重要概念,揭开国家数据基础设施的神秘面纱。
-
6大基本技术概念解析
-
6大技术路线的区别
01
—
六大基本技术概念解析
隐私保护计算:数据安全流通的 “隐形护盾”
在数据流通与应用的过程中,隐私保护至关重要。隐私保护计算应运而生,它是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一类信息技术 ,保障数据在产生、存储、计算、应用、销毁等数据流转全过程的各个环节中 “可用不可见”。简单来说,就是让数据在不暴露原始内容的情况下发挥价值,实现数据的 “可用不可见”。
以金融领域为例,在传统的信贷审批流程中,银行需要收集大量客户的个人信息,包括收入、资产、信用记录等,来评估客户的信用风险。但这些信息都涉及客户的敏感隐私,一旦泄露,后果不堪设想。而隐私保护计算技术的出现,为这一难题提供了解决方案。比如,多家金融机构可以在不直接共享原始数据的情况下,通过安全多方计算技术,联合计算客户的信用评分。每个机构输入自己掌握的客户数据,经过加密和协议处理,共同得出信用评分结果,而在整个过程中,任何一方都无法获取其他机构的原始数据。
在医疗领域,隐私保护计算同样发挥着关键作用。医院之间常常需要共享患者数据以进行联合科研、疾病诊断等工作,但患者数据包含大量敏感信息,如病历、基因数据等,隐私保护至关重要。通过联邦学习技术,不同医院可以在不交换原始患者数据的情况下,协同训练疾病预测模型。各医院利用本地数据训练模型的一部分,然后将模型参数上传进行聚合,最终得到一个融合各方数据特征的全局模型,实现了数据的 “可用不可见”,有效保护了患者隐私。
区块链:构建数据信任的分布式账本
区块链技术,作为一种去中心化的分布式账本,近年来在各个领域得到了广泛的关注和应用。它通过密码学算法将数据块按时间顺序排列并链接在一起,形成一个不可篡改、可追溯的链式数据结构。每个数据块包含了一定时间内的交易或数据记录,以及前一个数据块的哈希值,这种链式结构使得数据一旦被记录,就难以被篡改,从而保证了数据的真实性和完整性 。
在国家数据基础设施中,区块链技术发挥着关键作用。一方面,它为数据确权提供了可靠的解决方案。通过区块链的分布式账本和智能合约技术,可以清晰地记录数据的所有权、使用权和流转过程,确保数据的权属明确,为数据交易和流通提供了坚实的基础。另一方面,区块链的不可篡改和可追溯特性,保障了数据在流通和共享过程中的安全性和可信度。在供应链金融领域,企业可以将供应链上的交易数据记录在区块链上,包括货物的发货、运输、签收等环节,金融机构可以通过区块链实时获取这些数据,对企业的信用进行评估,从而为企业提供融资支持。由于区块链上的数据不可篡改,金融机构可以放心地依据这些数据进行决策,降低了信用风险。
以长安链为例,作为我国自主研发的区块链技术平台,长安链在国家数据基础设施建设中取得了显著成果。长安链具有高性能、高安全、强隐私、广协作的特点,已广泛应用于政务、金融、能源、医疗等多个领域。在政务领域,长安链实现了政务数据的可信共享和业务协同,提高了政务服务的效率和质量;在金融领域,长安链助力金融机构开展供应链金融、跨境支付等创新业务,提升了金融服务的普惠性和便捷性。在 2024 全球数字经济大会数据要素高层论坛上启动建设的长安链・数据流通利用增值协作网络,运用高性能的长安链与隐私计算技术,为数据要素流通和应用提供安全传输、可信协作、闭环激励的关键支撑能力。数据接入长安链后,采取分布式存储,流通全程真实可信、不可篡改;运用隐私计算技术加密,原始数据全程 “可用不可见”,确保了数据拥有者的隐私安全 。
可信数据空间:数据可信流通的生态平台
可信数据空间,是基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体 。简单来说,可信数据空间就像是一个数据 “可信流通超市”,各类数据在这个 “超市” 里,遵循统一的规则和标准,进行安全、可信的流通和交易。
为了实现数据的 “可用不可见、可控可计量”,可信数据空间综合运用了多种先进技术。其中,隐私计算技术是保障数据隐私安全的关键,通过加密、混淆等手段,确保数据在计算和流通过程中的保密性;区块链技术则为数据的可信性提供了坚实支撑,其分布式账本和不可篡改特性,使得数据的来源、流转和使用情况都可追溯、可验证;虚拟沙箱技术则为数据提供了一个隔离的运行环境,防止数据在处理过程中受到外部干扰和恶意攻击。
国家数据局发布的《可信数据空间发展行动计划 (2024—2028 年)》提出,要开展企业、行业、城市、个人、跨境等五类可信数据空间建设。企业可信数据空间由龙头企业建设,重点是协同上下游企业开放共享高质量数据资源,特别是面向中小企业提供普惠便利数据服务;行业可信数据空间由多主体联合打造,重点在科技创新、农业农村、工业、服务业等领域发力;城市可信数据空间以公共数据为牵引,帮助城市加快全域数字化转型和城市群数字一体化发展;在个人可信数据空间方面,条件成熟时,稳慎引导个人开放个人数据资源;在跨境可信数据空间方面,支持自由贸易试验区探索数据跨境便利化机制。
以医疗行业为例,不同医疗机构之间的数据往往分散且难以共享,导致医疗资源无法得到有效整合,患者的就医体验也受到影响。通过构建医疗行业可信数据空间,各医疗机构可以将患者的病历、检查报告、诊断结果等数据加密上传到空间中,在授权的情况下,其他医疗机构可以安全地获取和使用这些数据,实现医疗数据的共享和协同,提高医疗诊断的准确性和效率。同时,患者也可以更好地掌控自己的医疗数据,选择授权哪些机构使用自己的数据,保障了个人隐私安全 。
数场:数据要素的 “超级市场”
数场,作为国家数据基础设施中的重要概念,是一种综合性的数据流通利用设施,为数据要素提供了一个高效、安全、可信的流通和开发利用环境,被誉为数据要素的 “超级市场”。在数场中,数据的流通就像在传统市场中商品的买卖一样,遵循一定的规则和流程,实现数据从供给方到需求方的高效流转。
数场通过构建标准化技术体系,涵盖数据接入、传输、存储、计算和交易等全生命周期,使数据流通的各个环节更加有序、高效、安全 。在数据接入环节,数场设置了严格的准入机制,对数据的格式、质量、合规性和安全性进行审查,确保进入数场的数据符合标准,防止敏感信息的泄露。在数据传输环节,数场采用高速光纤、分布式网络架构等技术,构建了高效、安全、稳定的数据传输网络,确保数据能够在不同节点之间以低延迟、高吞吐的方式流动。
在数据流通、共享和交易的核心区域,数场为数据供需双方提供了一个自由匹配的交互空间,实现数据价值的最大化。数场不仅提供数据存储和流通能力,还构建了丰富的行业应用生态,使数据能够在金融、医疗、交通、工业等多个领域发挥作用,为各行业的数字化转型和创新发展提供强大的数据支持。
以某金融数场为例,该数场汇聚了银行、证券、保险等各类金融机构的数据,通过标准化的数据处理和安全的加密传输,为金融机构提供了联合风控、精准营销等数据服务。在联合风控场景中,数场整合了各金融机构的客户信用数据、交易数据等,运用大数据分析和人工智能技术,对客户的信用风险进行全面评估,有效降低了金融机构的信贷风险。在精准营销场景中,数场根据客户的消费习惯、投资偏好等数据,为金融机构提供个性化的营销方案,提高了营销效果和客户满意度。
数联网:数据流通的高速网络
数联网,作为国家数据基础设施中的关键组成部分,是实现数据广泛连接和安全流通的重要支撑。它通过构建一个庞大的数据传输网络,将不同地区、不同行业、不同类型的数据资源连接在一起,打破了数据孤岛,实现了数据的自由流通和共享 。简单来说,数联网就像是数据世界的 “高速公路”,让数据能够在不同节点之间快速、安全地传输。
数联网的核心在于其强大的连接能力和高效的数据传输机制。它采用了先进的网络技术和数据处理算法,能够实现数据的高速传输和实时处理。数联网还通过引入区块链、隐私计算等技术,确保了数据在流通过程中的安全性和隐私性,让数据的所有者能够放心地共享和使用数据。
在实际应用中,数联网已经在多个领域展现出了巨大的潜力。在政务领域,数联网可以实现不同政府部门之间的数据共享和协同办公,提高政务服务的效率和质量。通过数联网,税务部门可以与工商部门、银行等机构实现数据共享,实时获取企业的经营数据和财务信息,从而更准确地进行税收征管和风险评估;公安部门可以与交通、民政等部门共享数据,实现对人口信息、车辆信息等的实时监控和分析,提高社会治安管理水平。
在金融领域,数联网为金融机构提供了更丰富的数据资源和更高效的风险评估手段。通过数联网,银行可以获取企业和个人在其他金融机构的信用记录、交易数据等,更全面地评估客户的信用风险,为信贷决策提供更准确的依据;保险公司可以与医疗机构、汽车维修厂等机构共享数据,实现对保险理赔的快速审核和精准定价,降低保险欺诈风险。
中国移动发布的数联网(DSSN),依托 “连接 + 算力 + 能力” 信息服务体系,构建了跨行业、跨区域、跨领域、跨主体的下一代集约高效的数据流通基础设施,为场内集中交易和场外分散交易提供低成本、高效率、可信赖的流通环境,满足连接、算力、安全、合规等方面的共性需求,支撑国家数据要素流通市场高效健康发展 。数联网能够连接多个数据提供方、数据需求方、数据交易提供方等主体,在保证数据安全合规使用的前提下,一点接入网络,为数据商品流通提供 “数据物流” 服务。
数据元件:数据生产的标准化 “零件”
数据元件,作为国家数据基础设施建设的关键技术路线之一,是对数据资源进行清洗治理、加工生产形成的信息密度大、安全属性强、形态稳定、产权清晰、价值释放效率高的数据表征结果 。简单来说,数据元件就是数据经过标准化处理后,具有特定功能和价值的数据 “零件”,这些 “零件” 可以被组合、复用,为数据的加工和生产提供了高效、安全的基础。
数据元件的生产过程涉及多个环节,包括数据采集、清洗、脱敏、建模等。在数据采集阶段,需要从各种数据源中收集数据,确保数据的完整性和准确性;清洗环节则是去除数据中的噪声、重复数据和错误数据,提高数据质量;脱敏过程采用加密、模糊化等技术,对敏感数据进行处理,确保数据的安全性;建模环节则是通过数据分析和挖掘,提取数据的特征和规律,将数据转化为具有特定功能的数据元件。
数据元件具有标准化、模块化、可复用的特点,这使得它在数据加工和生产中具有重要作用。通过将数据转化为数据元件,可以实现数据的标准化管理,提高数据的质量和可用性;模块化的设计使得数据元件可以像搭积木一样进行组合和复用,大大提高了数据开发的效率;可复用性则使得数据元件可以在不同的场景和应用中重复使用,降低了数据开发的成本。
在金融领域,风险评估是一项关键业务。传统的风险评估方式往往依赖于大量的原始数据,数据处理难度大,且存在隐私泄露的风险。而通过数据元件技术,可以将客户的信用记录、交易行为、资产状况等数据进行标准化处理,生成信用评估数据元件。这些数据元件可以被金融机构直接使用,用于评估客户的信用风险,不仅提高了评估的准确性和效率,还保障了客户数据的安全。
在医疗领域,数据元件同样发挥着重要作用。医疗机构可以将患者的病历、检查报告、诊断结果等数据进行脱敏处理,生成医疗数据元件。这些数据元件可以用于医学研究、疾病预测、药物研发等领域,为医疗行业的创新发展提供了有力支持。同时,由于数据元件经过了脱敏处理,患者的隐私得到了有效保护 。
02
—
六大技术路线对比分析
这张图表是 “国家数据基础设施技术路线比较”,详细对比了六种技术路线,包括隐私保护计算、区块链、可信数据空间、数场、数联网、数据元件 。以下是对图表内容的解读:
隐私保护计算
基本含义:通过多方安全计算、联邦学习等技术,在保护数据隐私前提下实现数据价值流通。
技术特点:多方协同,安全加密,有全链路加密、MPC 等多种技术特性。
应用现状:在金融、医疗、政务等多领域广泛应用。
突破方向:聚焦通信优化、算法创新、安全增强等方面。
区块链
基本含义:分布式网络结合多种技术,构建新型数据存储和共享体系。
技术特点:有去中心化、信息不可篡改、共识机制等特性。
应用现状:在政务数据共享、供应链协同等场景应用。
突破方向:从绿色化、融合化、监管科技等方面实现突破。
可信数据空间
基本含义:基于共识规则连接多方,实现数据资源共享共用。
技术特点:构建三大能力体系,融合多种技术保障安全高效。
应用现状:在城市治理等八大领域赋能提效。
突破方向:提升通信效率、构建标识体系、推动多源深度融合。
数场
基本含义:以隐私计算、区块链等构建数据流通基础。
技术特点:融合多种技术,形成数据共享方案。
应用现状:在政务、金融等领域助力数据共享。
突破方向:在技术融合、生态构建、区域协同等方面突破。
数联网
基本含义:解决数据流通效率与安全问题,提供数据流通服务。
技术特点:在技术融合、安全等六方面有特点。
应用现状:用于政务协同、金融服务等领域。
突破方向:从提高效率、融合技术等方向突破。
数据元件
基本含义:提供标准、自主可控的数据存储加工服务。
技术特点:标准化、安全化处理形成可流通数据单元。
应用现状:在政务、金融、医疗等领域有关键技术突破。
突破方向:在技术标准化、安全增强等方面突破。
国家数据基础设施中的隐私保护计算、区块链、可信数据空间、数场、数联网和数据元件等关键概念,共同构建了一个安全、高效、可信的数据流通与应用生态系统。它们在数据安全、信任构建、流通效率、应用创新等方面发挥着不可或缺的作用,为数字经济的发展提供了强大的支撑。