在數(shù)字經(jīng)濟蓬勃發(fā)展的時代背景下,數(shù)據(jù)作為基礎性戰(zhàn)略資源和關鍵生產要素,數(shù)據(jù)要素價值釋放成為推動經(jīng)濟社會高質量發(fā)展的核心動力。然而,一方面相較于逐年遞增的數(shù)據(jù)產量,存力規(guī)模增速略顯滯后,數(shù)據(jù)“應存未存”現(xiàn)象依然存在。另一方面,數(shù)據(jù)作為AI三大核心要素之一,其規(guī)模與質量直接影響AI技術應用與發(fā)展。在此背景下,先進存力中心應運而生,作為新型信息基礎設施的重要組成部分,對于數(shù)據(jù)資源積累、數(shù)據(jù)資產轉化、數(shù)據(jù)資本流通以及促進數(shù)字經(jīng)濟與實體經(jīng)濟深度融合具有深遠意義。
近日,中國信息通信研究院(簡稱“中國信通院”)云計算與大數(shù)據(jù)研究所在2025中國算力大會先進數(shù)據(jù)存力論壇上發(fā)布《先進存力中心研究報告(2025年)》,中國信通院云計算與大數(shù)據(jù)研究所總工程師郭亮對報告進行了深入解讀。
報告從基礎設施建設、數(shù)據(jù)價值釋放、產業(yè)應用賦能的全局視角出發(fā),以新型信息基礎設施演進為主線,分析當前AI發(fā)展對大規(guī)模高質量數(shù)據(jù)需求與數(shù)據(jù)“應存未存”之間的結構性矛盾,闡述先進存力中心運用“1+4+N”架構體系在破解多源異構數(shù)據(jù)匯聚、治理、流通、利用全生命周期瓶頸中的樞紐作用。提出以全閃化存力底座、跨域數(shù)據(jù)編織、存儲內生安全、AI數(shù)據(jù)湖存儲、數(shù)據(jù)分級治理、可信數(shù)據(jù)空間等關鍵技術為支撐,實現(xiàn)“規(guī)模聚數(shù)、高效治數(shù)、安全供數(shù)、產業(yè)用數(shù)”的數(shù)據(jù)價值閉環(huán)。同時,在新型信息基礎設施體系中,先進存力中心可為算力中心持續(xù)供給高質量數(shù)據(jù)資源,形成“以存匯數(shù)、以數(shù)促算、以算興業(yè)”的發(fā)展范式,助力我國在全球數(shù)據(jù)競爭中搶占戰(zhàn)略制高點。
報告核心觀點
1. 先進存力中心是以先進存力為底座,可提供數(shù)據(jù)從匯聚到應用的全周期服務能力的新型基礎設施。具體而言,先進存力中心是集先進存儲設備、數(shù)據(jù)資源管理和數(shù)據(jù)安全防護等于一體,融合數(shù)據(jù)治理、開發(fā)流通等功能的新型基礎設施。先進存力中心具備高可靠、高性能、高安全、綠色低碳等特征,提供數(shù)據(jù)托管、數(shù)據(jù)治理、數(shù)據(jù)供給與流通、數(shù)據(jù)開發(fā)與加工等服務能力,可實現(xiàn)規(guī)模聚數(shù)、高效治數(shù)、安全供數(shù)、產業(yè)用數(shù),可為算力中心、大模型及數(shù)據(jù)交易提供高質量、高可信、高可用的數(shù)據(jù)供給,支撐數(shù)字經(jīng)濟創(chuàng)新。
先進存力中心定義與特征
來源:中國信通院
2. 建設先進存力中心是破解當前我國數(shù)據(jù)“應存未存”困局的有效途徑之一。當前我國面臨數(shù)據(jù)存儲能力與生產規(guī)模不匹配的嚴峻挑戰(zhàn)。2024年數(shù)據(jù)顯示,全國數(shù)據(jù)年產量達41.06ZB,但存儲總量僅為2.09ZB,數(shù)據(jù)留存率由2023年的2.89%降至2.80%。先進存力中心通過實現(xiàn)多源異構數(shù)據(jù)的高效匯聚與安全存儲,為優(yōu)化數(shù)據(jù)資源配置、避免高價值數(shù)據(jù)流失提供重要支撐。
3. 先進存力中心利用AI數(shù)據(jù)湖存儲技術實現(xiàn)多源多模態(tài)數(shù)據(jù)統(tǒng)一歸集,為我國數(shù)字經(jīng)濟發(fā)展積累充分數(shù)據(jù)資源。先進存力中心以AI數(shù)據(jù)湖存儲作為先進存力底座,可實現(xiàn)多源異構數(shù)據(jù)的統(tǒng)一采集與預處理,支持結構化、半結構化及非結構化數(shù)據(jù)的批量同步與實時接入。在數(shù)據(jù)入湖階段執(zhí)行標準化映射與敏感字段脫敏標記,以分區(qū)分表形式存儲于文件系統(tǒng)與數(shù)據(jù)庫構成的湖倉一體架構。同步實現(xiàn)元數(shù)據(jù)自動捕獲、注冊與血緣構建,形成“數(shù)據(jù)-元數(shù)據(jù)-目錄”一體化管理體系,為數(shù)據(jù)治理與授權加工提供可追蹤、可審計的資源基礎。
4. 先進存力中心可將數(shù)據(jù)資源有效轉化為行業(yè)高質量數(shù)據(jù)集,為打造人工智能強國夯實數(shù)據(jù)基礎。先進存力中心利用高效數(shù)據(jù)歸集和存儲能力,依托數(shù)據(jù)清洗、標注、特征融合等平臺工具,將原始數(shù)據(jù)轉化為具有行業(yè)特征的高質量數(shù)據(jù)集,為算力資源高效利用提供數(shù)據(jù)保障。同時,可采用存算資源協(xié)同調度為算力中心提供低延遲、高吞吐的訓練數(shù)據(jù)流,充分發(fā)揮我國算力資源建設優(yōu)勢。
5. 先進存力中心通過統(tǒng)一標準、質量控制、脫敏及血緣管理,將原始數(shù)據(jù)轉化為可審計、可授權的數(shù)據(jù)資產。先進存力中心在治理階段依據(jù)統(tǒng)一的數(shù)據(jù)標準、模型和分層分類規(guī)范,對入湖原始數(shù)據(jù)進行字段級盤點、標準化映射、質量校驗、脫敏處理和血緣注冊,形成可檢索、可授權、可計量、可審計的高質量數(shù)據(jù)集,并同步生成數(shù)據(jù)資產目錄,為后續(xù)合規(guī)流通和價值釋放提供可信依據(jù)。
報告目錄
一、先進存力中心建設背景
(一)數(shù)據(jù)成為數(shù)字經(jīng)濟發(fā)展新階段戰(zhàn)略資源
(二)數(shù)據(jù)留存率與存力建設水平仍有待提升
二、先進存力中心定義與內涵
(一)先進存力中心定義內涵
(二)先進存力中心服務能力
(三)先進存力中心產業(yè)定位
(四)先進存力中心運營模式
三、先進存力中心建設意義
(一)多源多模態(tài)數(shù)據(jù)資源高效匯聚
(二)助力數(shù)據(jù)要素價值進一步釋放
(三)為算力中心提供數(shù)據(jù)資源保障
四、先進存力中心關鍵技術
(一)全閃存儲架構建設,突破數(shù)據(jù)應用效能瓶頸
(二)數(shù)據(jù)編織可視可管,打破分散數(shù)據(jù)孤島效應
(三)虛擬資源智能調度,滿足數(shù)據(jù)高效流通利用
(四)數(shù)據(jù)存儲內生安全,保障數(shù)據(jù)資產高可用性
(五)AI數(shù)據(jù)湖存儲技術,實現(xiàn)多源數(shù)據(jù)統(tǒng)一歸集
(六)全域數(shù)據(jù)分級歸類,強化數(shù)據(jù)資源高效治理
(七)構建可信數(shù)據(jù)空間,促進數(shù)據(jù)資產供給流通
(八)數(shù)據(jù)挖掘與AI賦能,夯實行業(yè)數(shù)智轉型基礎
五、先進存力中心應用場景
(一)行業(yè)高質量數(shù)據(jù)集構建,構筑企業(yè)全域知識運營基座
(二)醫(yī)療影像共享空間建設,打造影像數(shù)據(jù)共享管理中樞
(三)智能網(wǎng)聯(lián)汽車數(shù)據(jù)管理,促進新能源產業(yè)數(shù)字化轉型
(四)公共數(shù)據(jù)授權運營開放,建設數(shù)據(jù)要素托管流通樞紐
(五)城市全域數(shù)據(jù)匯聚治理,形成民意感知研判響應閉環(huán)
六、發(fā)展建議
(一)加強國家頂層規(guī)劃,統(tǒng)籌先進存力中心建設布局
(二)鼓勵技術研發(fā)攻關,推進存力與算力的協(xié)同創(chuàng)新
(三)完善存力建設體系,保障基礎設施可持續(xù)性發(fā)展
(四)牢筑人才培育根基,支撐數(shù)據(jù)存力產業(yè)生態(tài)建設

