
習近平總書記指出,數(shù)據作為新型生產要素,對傳統(tǒng)生產方式變革具有重大影響,要構建以數(shù)據為關鍵要素的數(shù)字經濟。2019年10月,黨的十九屆四中全會首次將數(shù)據納入生產要素范疇;2022年12月,黨中央、國務院印發(fā)《關于構建數(shù)據基礎制度更好發(fā)揮數(shù)據要素作用的意見》(下稱“數(shù)據二十條”),這是我國首部從生產要素高度系統(tǒng)部署數(shù)據要素價值釋放的國家級專項政策文件。
隨著“數(shù)據二十條”等一系列政策措施相繼出臺,數(shù)據要素市場培育進展加速,暢通數(shù)據資源大循環(huán)的方向愈加明確。尤其是在人工智能快速迭代、大模型與大數(shù)據相得益彰的發(fā)展態(tài)勢中,數(shù)據要素戰(zhàn)略地位進一步凸顯。各地方、各部門、各大企業(yè)紛紛加快數(shù)據要素領域布局,從體制機制、市場流通、產品研發(fā)、標準規(guī)范等多層次、多角度開展落地方案的深度探索,涌現(xiàn)出數(shù)據要素價值釋放新熱潮。
工業(yè)互聯(lián)網產業(yè)聯(lián)盟組織產業(yè)界系統(tǒng)梳理了相關內容,展開數(shù)據要素系列科普活動。
數(shù)據要素Q&A
—— 小盟科普 ——
問:數(shù)據要素時代,有哪些新的數(shù)據處理技術?
答:以云原生、軟硬協(xié)同以及湖倉一體等技術為代表的數(shù)據處理技術持續(xù)助力用戶降本增效。
云原生技術通過存儲計算分離架構,實現(xiàn)資源池化和極致彈性,具備高擴展性、高可用性、跨地域規(guī)模、低成本等優(yōu)勢,可為用戶提供真正具備秒級智能彈性擴容能力、隨需而動。
軟硬協(xié)同技術為軟件技術帶來了新的機遇,一些企業(yè)陸續(xù)發(fā)布GPU數(shù)據庫、數(shù)據庫一體機等產品,以滿足業(yè)務規(guī)模不斷擴張的需求。硬件技術的發(fā)展一方面促進了數(shù)據處理技術性能提升,另一方面也推動了數(shù)據處理技術與其他新興技術的融合,使得技術體系的安全性和智能性得到提升。
在湖倉一體方面,數(shù)據倉庫(Data Warehouse)和數(shù)據湖(Data Lake)兩項技術在不斷演進過程中逐漸融合形成湖倉一體(Data Lakehouse)技術架構。湖倉一體集數(shù)據湖的靈活性、可擴展性優(yōu)勢以及數(shù)據倉庫的數(shù)據結構和數(shù)據管理功能于一體,能夠降低數(shù)據冗余、減少存儲成本,提升數(shù)據處理時效性。當前,湖倉一體技術落地應用速度持續(xù)加快,應用領域主要集中在互聯(lián)網、電信運營商以及金融等國內數(shù)字化程度較高行業(yè)。
問:數(shù)據要素時代,有哪些新的技術能保障數(shù)據要素安全流通?
答:以人工智能、隱私計算、區(qū)塊鏈及圖技術等為代表的新興技術持續(xù)護航數(shù)據要素安全流通。
AI技術與數(shù)據處理技術相結合降低技術使用門檻,2023 年 AIGC 技術的跨越式突破發(fā)展,不僅使大語言模型進入公眾視野,更擴展了數(shù)據基礎設施與AI融合的發(fā)展空間。以數(shù)據庫為例,生成式AI在數(shù)據庫結構設計、架構設計、數(shù)據分析挖掘等方面可以不同程度簡化人員操作,提高開發(fā)、運維、分析的效率,降低用戶使用門檻,更好助力數(shù)據流通。
數(shù)據庫與隱私計算相結合落地的全密態(tài)數(shù)據庫能夠解決數(shù)據全生命周期的隱私保護問題,使得無論在何種系統(tǒng)環(huán)境下,數(shù)據在傳輸、運算以及存儲的各個環(huán)節(jié)始終都處于密文狀態(tài)。
數(shù)據庫與區(qū)塊鏈技術相結合形成的防篡改數(shù)據庫能夠很好地保障云上數(shù)據可信運維。防篡改數(shù)據庫可以內部構建可信索引結構,確保數(shù)據庫數(shù)據的整體完整性,與區(qū)塊鏈相結合形成的解決方案,能夠形成鏈上鏈下鏈路數(shù)據安全可信,解決多方業(yè)務間數(shù)據安全可信流通難題。
隱私計算與區(qū)塊鏈相結合實現(xiàn)數(shù)據密態(tài)流轉。在控制面以區(qū)塊鏈為核心構建數(shù)據流通管控層;在數(shù)據面以隱私計算為核心構建密態(tài)數(shù)聯(lián)網。數(shù)據流轉過程中以密態(tài)形式流通,保障其流轉計算、融合直到銷毀的全鏈路安全可控,同時將數(shù)據要素持有權和使用權分離,實現(xiàn)數(shù)據可用不可見、使用可控可計量、以及使用權跨域管控。
圖聯(lián)邦技術能夠打破數(shù)據孤島,圖聯(lián)邦技術是為了解決數(shù)據孤島、隱私保護和數(shù)據安全問題提出的概念,在保護用戶隱私和公司數(shù)據的前提下,更好地發(fā)揮數(shù)據價值。
問:數(shù)據要素時代,有哪些新的技術能支撐新興業(yè)務場景?
答:向量數(shù)據庫、圖分析技術、時空大數(shù)據平臺以及時空數(shù)據庫等技術有效支持新興業(yè)務場景下的數(shù)據要素價值釋放。
向量數(shù)據庫能夠支撐AI技術賦能數(shù)據要素價值釋放。一些非結構化數(shù)據需要通過機器學習算法從中提取出以向量為表示形式的“特征”,向量數(shù)據庫的興起便是為了解決對這些向量進行存儲與計算的問題。
圖分析技術助力洞察數(shù)據連接新價值。數(shù)據要素時代,數(shù)據規(guī)模將會不斷增大,數(shù)據量及數(shù)據自身豐富度不斷增加,圖分析技術能夠有效分析數(shù)據之間的關聯(lián)性以及處理數(shù)據之間的復雜關系。
時空大數(shù)據平臺或時空數(shù)據庫能夠實現(xiàn)海量時空數(shù)據管理、查詢、統(tǒng)計與分析。在現(xiàn)實世界中有超過80%的數(shù)據都和地理位置(空間)相關,而所有數(shù)據均含有時間屬性。因此,實際業(yè)務場景中許多數(shù)據需要通過時空大數(shù)據平臺或時空數(shù)據庫來處理。近年來,時空大數(shù)據平臺以及時空數(shù)據庫等技術的發(fā)展有效應對北斗時空大數(shù)據服務、數(shù)字李生、智慧城市等新興數(shù)據應用業(yè)務場景下對于時空數(shù)據處理的需求。