2024-01-25

小盟科普丨数据要素时代涌现了哪些新技术?

分享:



习近平总书记指出,数据作为新型生产要素,对传统生产方式变革具有重大影响,要构建以数据为关键要素的数字经济。2019年10月,党的十九届四中全会首次将数据纳入生产要素范畴;2022年12月,党中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》(下称“数据二十条”),这是我国首部从生产要素高度系统部署数据要素价值释放的国家级专项政策文件。

随着“数据二十条”等一系列政策措施相继出台,数据要素市场培育进展加速,畅通数据资源大循环的方向愈加明确。尤其是在人工智能快速迭代、大模型与大数据相得益彰的发展态势中,数据要素战略地位进一步凸显。各地方、各部门、各大企业纷纷加快数据要素领域布局,从体制机制、市场流通、产品研发、标准规范等多层次、多角度开展落地方案的深度探索,涌现出数据要素价值释放新热潮。

工业互联网产业联盟组织产业界系统梳理了相关内容,展开数据要素系列科普活动。



数据要素Q&A

—— 小盟科普 ——

问:数据要素时代,有哪些新的数据处理技术?

答:以云原生、软硬协同以及湖仓一体等技术为代表的数据处理技术持续助力用户降本增效。

云原生技术通过存储计算分离架构,实现资源池化和极致弹性,具备高扩展性、高可用性、跨地域规模、低成本等优势,可为用户提供真正具备秒级智能弹性扩容能力、随需而动。

软硬协同技术为软件技术带来了新的机遇,一些企业陆续发布GPU数据库、数据库一体机等产品,以满足业务规模不断扩张的需求。硬件技术的发展一方面促进了数据处理技术性能提升,另一方面也推动了数据处理技术与其他新兴技术的融合,使得技术体系的安全性和智能性得到提升。

湖仓一体方面,数据仓库(Data Warehouse)和数据湖(Data Lake)两项技术在不断演进过程中逐渐融合形成湖仓一体(Data Lakehouse)技术架构。湖仓一体集数据湖的灵活性、可扩展性优势以及数据仓库的数据结构和数据管理功能于一体,能够降低数据冗余、减少存储成本,提升数据处理时效性。当前,湖仓一体技术落地应用速度持续加快,应用领域主要集中在互联网、电信运营商以及金融等国内数字化程度较高行业。



问:数据要素时代,有哪些新的技术能保障数据要素安全流通?

答:以人工智能、隐私计算、区块链及图技术等为代表的新兴技术持续护航数据要素安全流通。

AI技术与数据处理技术相结合降低技术使用门槛,2023 年 AIGC 技术的跨越式突破发展,不仅使大语言模型进入公众视野,更扩展了数据基础设施与AI融合的发展空间。以数据库为例,生成式AI在数据库结构设计、架构设计、数据分析挖掘等方面可以不同程度简化人员操作,提高开发、运维、分析的效率,降低用户使用门槛,更好助力数据流通。

数据库与隐私计算相结合落地的全密态数据库能够解决数据全生命周期的隐私保护问题,使得无论在何种系统环境下,数据在传输、运算以及存储的各个环节始终都处于密文状态。

数据库与区块链技术相结合形成的防篡改数据库能够很好地保障云上数据可信运维。防篡改数据库可以内部构建可信索引结构,确保数据库数据的整体完整性,与区块链相结合形成的解决方案,能够形成链上链下链路数据安全可信,解决多方业务间数据安全可信流通难题。

隐私计算与区块链相结合实现数据密态流转。在控制面以区块链为核心构建数据流通管控层;在数据面以隐私计算为核心构建密态数联网。数据流转过程中以密态形式流通,保障其流转计算、融合直到销毁的全链路安全可控,同时将数据要素持有权和使用权分离,实现数据可用不可见、使用可控可计量、以及使用权跨域管控。

图联邦技术能够打破数据孤岛,图联邦技术是为了解决数据孤岛、隐私保护和数据安全问题提出的概念,在保护用户隐私和公司数据的前提下,更好地发挥数据价值。


问:数据要素时代,有哪些新的技术能支撑新兴业务场景?

答:向量数据库、图分析技术、时空大数据平台以及时空数据库等技术有效支持新兴业务场景下的数据要素价值释放。

向量数据库能够支撑AI技术赋能数据要素价值释放。一些非结构化数据需要通过机器学习算法从中提取出以向量为表示形式的“特征”,向量数据库的兴起便是为了解决对这些向量进行存储与计算的问题。

图分析技术助力洞察数据连接新价值。数据要素时代,数据规模将会不断增大,数据量及数据自身丰富度不断增加,图分析技术能够有效分析数据之间的关联性以及处理数据之间的复杂关系。

时空大数据平台时空数据库能够实现海量时空数据管理、查询、统计与分析。在现实世界中有超过80%的数据都和地理位置(空间)相关,而所有数据均含有时间属性。因此,实际业务场景中许多数据需要通过时空大数据平台或时空数据库来处理。近年来,时空大数据平台以及时空数据库等技术的发展有效应对北斗时空大数据服务、数字李生、智慧城市等新兴数据应用业务场景下对于时空数据处理的需求。