挖貝網(wǎng)> 產(chǎn)業(yè)> 詳情
全國信標委委員談AI算力標準化:DeepX G20系列的標準化實(shí)踐與產(chǎn)業(yè)啟示
【2025年10月29日,北京】作為全國信息技術(shù)標準化技術(shù)委員會(huì )委員,我長(cháng)期關(guān)注AI算力基礎設施的標準化工作。近年來(lái),隨著(zhù)AI技術(shù)的快速發(fā)展,算力需求呈指數級增長(cháng),但算力供給模式卻面臨著(zhù)成本高企、安全性堪憂(yōu)、標準不統一等結構性問(wèn)題。在參與制定相關(guān)技術(shù)標準的過(guò)程中,我們觀(guān)察到一個(gè)明確的趨勢:AI算力正在從"集中式云端"走向"分布式本地",從"租賃模式"走向"自主可控"。這不僅是技術(shù)演進(jìn)的自然結果,更是標準化發(fā)展的必然方向。

一、AI算力標準化面臨的三大挑戰
挑戰一:性能評估標準缺失,市場(chǎng)存在"測試混亂"
當前AI算力市場(chǎng)存在一個(gè)普遍問(wèn)題:不同廠(chǎng)商使用不同的性能指標,導致用戶(hù)無(wú)法橫向比較。
現狀:
云廠(chǎng)商強調"TFLOPS"(浮點(diǎn)運算能力)
芯片廠(chǎng)商強調"TOPS"(整數運算能力)
服務(wù)器廠(chǎng)商強調"功耗比"
各自為政,用戶(hù)困惑
標準化需求:參考MLPerf等國際基準測試標準,我們在全國信標委推動(dòng)《信息技術(shù)人工智能算力評估規范》明確提出:
統一測試基準:LLaMA推理、Stable Diffusion生成、YOLO目標檢測等實(shí)際場(chǎng)景
統一評估維度:性能、能效、成本、延遲四位一體
統一測試環(huán)境:溫度、濕度、負載條件標準化
DeepX的標準化實(shí)踐:東方超算的DeepX G20系列在產(chǎn)品發(fā)布時(shí),主動(dòng)采用了第三方標準化測試:
委托CHAI進(jìn)行MLPerf v3.1標準測試
公開(kāi)完整測試報告和測試環(huán)境參數
結果可復現:LLaMA 13B推理779 tok/s,Stable Diffusion XL生成2.10s/張
這種透明化做法,正是標準化推廣的重要實(shí)踐。
挑戰二:接口標準不統一,生態(tài)碎片化嚴重
現狀:
NVIDIA CUDA生態(tài)封閉,供應商鎖定嚴重
AMD ROCm、Intel oneAPI各自為政
國產(chǎn)AI芯片(寒武紀、海光等)接口不兼容
開(kāi)發(fā)者移植成本高,模型無(wú)法跨平臺復用
標準化需求:參考ONNX(Open Neural Network Exchange)等開(kāi)放標準,我們需要:
統一的算子標準(Operator Standard)
統一的模型格式(Model Format)
統一的API接口(Runtime API)
統一的部署標準(Deployment Specification)
DeepX的標準化實(shí)踐:DeepX G20系列基于x86架構+開(kāi)源生態(tài),天然具備標準化優(yōu)勢:
硬件層:Intel x86架構,兼容所有主流操作系統和軟件
軟件層:支持ONNX、TensorFlow、PyTorch等主流框架
接口層:AppMall提供RESTful API,符合OpenAPI 3.0標準
模型層:推動(dòng)1000+模型的ONNX格式標準化適配
AppMall的生態(tài)開(kāi)放性,為模型標準化提供了實(shí)踐平臺。目前已有130+開(kāi)發(fā)者上傳標準化模型,形成了良性循環(huán)。
挑戰三:數據安全標準滯后,本地化需求爆發(fā)
現狀:
《數據安全法》《個(gè)人信息保護法》要求數據本地化
煙草、金融、醫療等行業(yè)數據不能上云
但云GPU是主流方案,存在合規風(fēng)險
企業(yè)面臨"要性能還是要合規"的兩難選擇
標準化需求:參考ISO/IEC 27001信息安全標準和等保2.0要求,我們需要:
明確AI算力的數據流轉標準
建立本地化部署的安全評估體系
制定算力設備的等保認證規范
推動(dòng)"數據不出域"的技術(shù)標準
DeepX的標準化實(shí)踐:DeepX G20系列的100%本地化部署,天然符合數據安全標準:
數據零上傳:所有計算在本地完成,數據不經(jīng)過(guò)互聯(lián)網(wǎng)
物理隔離:支持內網(wǎng)部署,符合等保三級要求
審計能力:AppMall內置日志記錄,可追溯所有操作
二、AI算力標準化的發(fā)展趨勢:從云端到本地
從標準化角度看,AI算力正在經(jīng)歷一場(chǎng)深刻的范式轉移。
趨勢一:從"租賃為主"到"買(mǎi)斷為主"
傳統模式:
企業(yè)需求 → 購買(mǎi)云GPU → 按小時(shí)付費 → 持續支出→ 數據上傳 → 算力調度 → 結果下載
問(wèn)題:
-長(cháng)期成本不可控(3年TCO高達數百萬(wàn))
-數據安全風(fēng)險(上傳云端)
-性能波動(dòng)(共享資源)
-供應商鎖定(遷移成本高)
新模式:
企業(yè)需求 → 購買(mǎi)本地設備 → 一次性投入 → 零邊際成本→ 數據本地 → 算力自主 → 零延遲
優(yōu)勢:
TCO降低95%以上
數據100%自主可控
性能穩定可預期
無(wú)供應商鎖定
從標準化角度,"買(mǎi)斷模式"更符合長(cháng)期趨勢:
成本可預測:符合企業(yè)財務(wù)管理標準
資產(chǎn)可管理:納入固定資產(chǎn),符合會(huì )計準則
安全可審計:滿(mǎn)足等保和合規要求
生態(tài)可遷移:不依賴(lài)單一供應商
DeepX的1824 TOPS算力、4萬(wàn)元價(jià)格,將TCO降至云GPU的1/375,正是這一趨勢的代表性產(chǎn)品。
趨勢二:從"通用算力"到"場(chǎng)景化算力"
傳統云GPU的問(wèn)題:
通用設計,但企業(yè)80%的需求集中在推理而非訓練
大而全,但中小企業(yè)只需要"夠用"的算力
配置復雜,需要專(zhuān)業(yè)團隊運維
場(chǎng)景化算力的特征:
針對推理優(yōu)化(INT8/INT4量化)
算力適度(1-2P足以滿(mǎn)足90%企業(yè)需求)
開(kāi)箱即用(3分鐘部署,零運維)
從標準化角度,"場(chǎng)景化"符合ISO 9126質(zhì)量模型:
功能性:滿(mǎn)足實(shí)際需求而非堆砌參數
易用性:降低使用門(mén)檻,AppMall實(shí)現"點(diǎn)擊式部署"
效率性:能效比優(yōu)化,功耗僅300W
可移植性:1.68kg便攜設計,可跨場(chǎng)景使用
某建筑設計院的案例很能說(shuō)明問(wèn)題:他們需要在工地現場(chǎng)演示BIM方案,云GPU需要聯(lián)網(wǎng)+筆記本,延遲高且不穩定。DeepX裝進(jìn)背包,到工地插電就用,客戶(hù)現場(chǎng)修改方案、實(shí)時(shí)渲染,投標中標率從30%提升到70%。這就是場(chǎng)景化算力的價(jià)值。
趨勢三:從"硬件采購"到"生態(tài)訂閱"
傳統硬件采購的問(wèn)題:
買(mǎi)完設備就結束,供應商無(wú)持續服務(wù)動(dòng)力
模型升級、功能迭代需要重新采購
客戶(hù)學(xué)習成本高,復購率低
生態(tài)訂閱模式的特征:
硬件是"入口",生態(tài)是"價(jià)值"
AppMall持續更新模型,硬件持續增值
客戶(hù)深度綁定,LTV是硬件價(jià)格的5-8倍
從標準化角度,"生態(tài)模式"符合服務(wù)化趨勢:
符合ISO/IEC 20000服務(wù)管理標準
建立持續改進(jìn)機制(PDCA循環(huán))
形成客戶(hù)成功體系(Customer Success)
AppMall目前1,247個(gè)模型,月新增85個(gè),這個(gè)速度是任何企業(yè)內部團隊無(wú)法達到的。某量化私募反饋:他們每月在AppMall測試10-15個(gè)新策略模型,創(chuàng )新速度提升50倍。硬件會(huì )折舊,但生態(tài)會(huì )增值。
三、DeepX G20系列的標準化設計理念
作為東方超算創(chuàng )始人,我在設計DeepX系列時(shí),始終將標準化作為核心原則。
設計原則一:架構開(kāi)放,拒絕生態(tài)封閉
選擇x86而非ARM/專(zhuān)用芯片的理由:
x86是事實(shí)上的工業(yè)標準,40年生態(tài)積累
兼容所有主流操作系統(Windows/Linux/macOS)
支持所有AI框架(TensorFlow/PyTorch/ONNX)
開(kāi)發(fā)者零學(xué)習成本,模型直接遷移
對比:

這個(gè)選擇犧牲了部分性能,但換來(lái)了標準化和生態(tài)開(kāi)放性。從長(cháng)期看,這是正確的。
設計原則二:性能透明,接受標準化測試
我們主動(dòng)做了三件事:
委托第三方測試:基于MLPerf v3.1標準測試
公開(kāi)測試數據:完整報告發(fā)布在官網(wǎng),任何人可下載
接受復現驗證:提供測試代碼和環(huán)境配置
測試結果(MLPerf v3.1標準):
LLaMA 13B推理:779 tok/s(vs 參照系統612 tok/s,+27%)
Stable Diffusion XL:2.10s/張(vs 參照系統3.33s,+58%)
YOLOv8目標檢測:186 FPS(vs 參照系統67 FPS,+178%)
這種透明化,正是標準化推廣的基礎。我們歡迎任何機構重復測試,如果發(fā)現數據不符,我們承諾退貨退款。
設計原則三:生態(tài)開(kāi)放,推動(dòng)模型標準化
AppMall的三個(gè)標準化目標:
模型格式標準化
推動(dòng)所有模型轉為ONNX格式
當前1,247個(gè)模型,82%已完成ONNX轉換
目標:2025年底100%標準化
API接口標準化
遵循OpenAPI 3.0規范
RESTful API設計,支持跨平臺調用
開(kāi)發(fā)者可用任何語(yǔ)言接入(Python/Java/Go/Node.js)
部署流程標準化
一鍵部署:3分鐘完成模型部署
零配置:自動(dòng)優(yōu)化參數,無(wú)需手動(dòng)調優(yōu)
可復現:記錄所有部署參數,支持導出
某醫療機構的案例:他們在AppMall部署了8個(gè)AI診斷模型(肺結節、骨折、腦卒中等),所有模型都是ONNX格式,部署流程完全一致。如果未來(lái)更換硬件平臺,這8個(gè)模型可以零成本遷移。這就是標準化的價(jià)值。
四、標準化工作的未來(lái)方向與產(chǎn)業(yè)建議
作為全國信標委委員,我認為AI算力標準化還有很多工作要做:
方向一:建立統一的性能測試標準
當前問(wèn)題:
各廠(chǎng)商自說(shuō)自話(huà),測試方法不統一
用戶(hù)無(wú)法橫向比較產(chǎn)品
建議:
推動(dòng)《AI算力基準測試規范》國家標準制定
建立第三方測試認證機制
強制要求廠(chǎng)商公開(kāi)測試數據
東方超算承諾:我們愿意開(kāi)放DeepX的所有測試數據,供標準制定參考。
方向二:推動(dòng)模型格式標準化
當前問(wèn)題:
TensorFlow/PyTorch/ONNX等格式并存
模型移植成本高
建議:
推廣ONNX為國家推薦標準
建立模型格式轉換工具庫
鼓勵企業(yè)開(kāi)放模型
東方超算承諾:AppMall將在2026年實(shí)現100%模型ONNX化,并開(kāi)源轉換工具。
方向三:制定數據安全合規標準
當前問(wèn)題:
本地化部署缺乏評估標準
企業(yè)不知道如何選型
建議:
制定《AI算力本地化部署安全規范》
建立等保認證體系
明確不同行業(yè)的合規要求
東方超算承諾:我們愿意將DeepX的安全設計經(jīng)驗貢獻給標準制定,并配合相關(guān)部門(mén)完善認證體系。
五、結語(yǔ):標準化是產(chǎn)業(yè)健康發(fā)展的基石
AI算力產(chǎn)業(yè)正處于從無(wú)序競爭到標準化發(fā)展的關(guān)鍵轉折點(diǎn)。
作為從業(yè)者,我有三點(diǎn)體會(huì ):
第一,標準化不是約束,而是賦能。
統一標準降低了用戶(hù)的選型成本
開(kāi)放生態(tài)降低了開(kāi)發(fā)者的遷移成本
透明測試增強了市場(chǎng)的信任基礎
第二,本地化是趨勢,而非倒退。
云計算解決了"算力稀缺"問(wèn)題
本地化解決了"成本和安全"問(wèn)題
兩者將長(cháng)期共存,各有適用場(chǎng)景
第三,生態(tài)開(kāi)放才能走得長(cháng)遠。
封閉生態(tài)短期獲利,長(cháng)期受限
開(kāi)放生態(tài)短期投入,長(cháng)期共贏(yíng)
AppMall的1,247個(gè)模型,就是開(kāi)放的成果
東方超算DeepX G20系列只是標準化實(shí)踐的一個(gè)案例。我們希望看到更多企業(yè)參與標準化工作,共同推動(dòng)AI算力產(chǎn)業(yè)健康發(fā)展。
當然,DeepX也存在待改進(jìn)之處:
在超大規模集群部署方面,尚缺乏統一的調度標準
能效測試方法需要進(jìn)一步與國際標準對接
跨平臺模型遷移工具仍需完善
這些問(wèn)題的解決,需要全行業(yè)共同努力,也是我們在全國信標委推動(dòng)標準制定的重點(diǎn)方向。
關(guān)于作者
本文作者現任東方超算(深圳)科技有限公司創(chuàng )始人,全國信息技術(shù)標準化技術(shù)委員會(huì )委員,長(cháng)期從事云計算、高性能計算、存儲、算力基礎設施的研發(fā)和標準化工作。本文觀(guān)點(diǎn)代表作者個(gè)人,不代表全國信標委立場(chǎng)。
關(guān)于東方超算
東方超算(深圳)科技有限公司是東方材料(603110.SH)全資子公司,專(zhuān)注于便攜式企業(yè)級AI算力解決方案。核心產(chǎn)品DeepX G20系列和AppMall.ai應用商城,致力于通過(guò)標準化、本地化、生態(tài)化,讓AI算力真正普及到千行百業(yè)。
相關(guān)閱讀
- 華安保險湖北分公司以專(zhuān)業(yè)保障服務(wù)護航武漢足超聯(lián)賽
- 數智賦能破局生鮮零售困局:213 集市五大服務(wù)體系價(jià)值解析
- 區域生鮮零售協(xié)同發(fā)展新范式:213集市涿州、保定15店聯(lián)動(dòng)對地方商業(yè)生態(tài)激活的啟示
- “雙十一”第三方即配迎運力考驗,順豐同城超800臺無(wú)人車(chē)助力末端提效
- 科技美育融合創(chuàng )新:vivo攜手中國美院發(fā)布《科技美育探索報告》,共建鄉村美育新生態(tài)
- 強養成爽切割,996傳奇盒子“去玩攻速神器”燃爆傳奇現代節奏
- 光大銀行信用卡:以分期優(yōu)惠開(kāi)啟蘋(píng)果新品季
- 續航高的電動(dòng)車(chē)怎么選?雅迪冠能S白鯊塑造行業(yè)新標桿
- 環(huán)球車(chē)享用戶(hù)座談賦能主機廠(chǎng),助力奧迪E5精準觸達市場(chǎng)
- 從創(chuàng )新到信賴(lài):康姿百德如何以科技基因與人才戰略解鎖健康消費新未來(lái)
推薦閱讀
快訊 更多
- 07-09 13:16 | 三重煥新,啟航未來(lái)——Pivotal中文品牌發(fā)布暨喬遷新址、新官網(wǎng)上線(xiàn)
- 04-10 11:21 | 為“首發(fā)經(jīng)濟”注入創(chuàng )新動(dòng)力,CMEF見(jiàn)證寬騰醫學(xué)影像技術(shù)革新
- 02-20 18:53 | 手機也要上HBM芯片?三星計劃推出移動(dòng)版HBM,預計首款產(chǎn)品2028年上市
- 12-30 16:40 | 國產(chǎn)首款DDR5內存問(wèn)世!價(jià)格戰開(kāi)啟,復制長(cháng)江存儲擊敗三星路徑!
- 12-30 16:36 | 華為手機回歸第一年:全年銷(xiāo)量或超4000萬(wàn)臺 有望憑借Mate 70在高端市場(chǎng)擊敗蘋(píng)果
- 11-26 18:19 | 眾興菌業(yè)擬與漣水縣人民政府簽訂《招商引資合同書(shū)》 擬投資設立漣水食用菌產(chǎn)業(yè)園項目
- 11-26 18:16 | 美芝股份中選vivo全球AI研發(fā)中心-精裝工程采購項目(標段二)
- 11-26 18:14 | 健之佳擬用不超1億回購公司股份 維護公司價(jià)值及股東權益
- 11-26 09:53 | 格靈深瞳收購深圳市國科億道科技有限公司部分股權并增資5000萬(wàn)
- 11-26 09:37 | 煒岡科技擬以1.49億購買(mǎi)衡所華威9.33%股權 華海誠科擬發(fā)行可轉債收購煒岡科技所持衡所華威股權
