詞元(Token)作為人工智能大模型處理信息的最小單元,已演進(jìn)為智能經(jīng)濟(jì)時(shí)代的重要計(jì)量單位。根據(jù)中國(guó)信息通信研究院(簡(jiǎn)稱(chēng)“中國(guó)信通”)調(diào)研和測(cè)算,2025年我國(guó)公有云大模型對(duì)客側(cè)Token調(diào)用量達(dá)到約2000萬(wàn)億,相較2024年增長(zhǎng)超過(guò)16倍。大模型服務(wù)性能也在持續(xù)提升,根據(jù)中國(guó)信通院持續(xù)開(kāi)展的“公有云大模型Token服務(wù)性能監(jiān)測(cè)”結(jié)果顯示,2025年底平均調(diào)用成功率達(dá)到99.9%,首Token時(shí)延(TTFT)由年初的0.8秒左右降至年底0.6秒左右,每秒輸出Token數(shù)(TPS)從年初30個(gè)左右提升至年底50個(gè)左右。然而模型即服務(wù)(MaaS)平臺(tái)作為T(mén)oken規(guī)模化生產(chǎn)、流通和應(yīng)用的關(guān)鍵載體,為T(mén)oken的高效供給提供核心支撐。因此,以MaaS平臺(tái)為底座承載能力,以Token服務(wù)為觸點(diǎn)對(duì)外輸出,將驅(qū)動(dòng)Token服務(wù)體系閉環(huán)。
在此背景下,中國(guó)信通院現(xiàn)將“MaaS評(píng)估體系”全面升級(jí)為“Token服務(wù)評(píng)估體系”,形成覆蓋Token服務(wù)、MaaS平臺(tái)和產(chǎn)品、管理和運(yùn)營(yíng)的3大維度的評(píng)估體系。新體系在原基礎(chǔ)上,一是重點(diǎn)新增Token服務(wù)能力評(píng)估,涵蓋Token服務(wù)質(zhì)量、Token服務(wù)性能、Token服務(wù)可觀測(cè)性等維度,以及為提升Token服務(wù)能力所需的智能模型路由、智能原生CLI等工具能力評(píng)估;二是擴(kuò)充模型運(yùn)營(yíng)管理能力評(píng)估能力,增加面向企業(yè)的智能體管理運(yùn)營(yíng)、模型運(yùn)營(yíng)、模型管理等成熟度能力評(píng)估;三是完善MaaS平臺(tái)和應(yīng)用能力評(píng)估,增加多模態(tài)MaaS能力,以及醫(yī)療等行業(yè)應(yīng)用能力的評(píng)估。

中國(guó)信通院Token服務(wù)評(píng)估體系圖(2026年)
1. Token服務(wù)能力評(píng)估:包括對(duì)Token服務(wù)質(zhì)量、服務(wù)性能、服務(wù)可觀測(cè)性、服務(wù)SLA符合性、服務(wù)效能、服務(wù)計(jì)量能力等維度的評(píng)估,目標(biāo)是面向平臺(tái)廠商供給的Token服務(wù),驗(yàn)證其服務(wù)的各項(xiàng)能力水平,提升Token服務(wù)質(zhì)效。
2. MaaS平臺(tái)能力評(píng)估:包括大模型開(kāi)發(fā)平臺(tái)、大模型服務(wù)平臺(tái)、模型管理平臺(tái)、大模型應(yīng)用開(kāi)發(fā)平臺(tái)、多模態(tài)及行業(yè)MaaS平臺(tái)以及智能路由和CLI等維度的平臺(tái)能力評(píng)估,目標(biāo)是面向提供MaaS平臺(tái)的廠商,驗(yàn)證各平臺(tái)的產(chǎn)品能力水平,助力產(chǎn)品迭代和優(yōu)化。
3. 運(yùn)營(yíng)管理能力評(píng)估:圍繞企業(yè)生產(chǎn)過(guò)程中模型開(kāi)發(fā)、交付、監(jiān)控、運(yùn)營(yíng)、管理等全生命周期,從組織機(jī)制、流程規(guī)范、技術(shù)工具、數(shù)據(jù)治理、安全可信等維度開(kāi)展成熟度評(píng)估,目標(biāo)是面向應(yīng)用方企業(yè),衡量企業(yè)內(nèi)部落地應(yīng)用能力的成熟度,助力企業(yè)構(gòu)建可度量、可優(yōu)化、可持續(xù)的AI運(yùn)營(yíng)體系。
中國(guó)信通院聯(lián)合產(chǎn)業(yè)各界持續(xù)圍繞大模型服務(wù)開(kāi)展研究,以中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)模型服務(wù)(MaaS)工作組為載體,2023年以來(lái)陸續(xù)發(fā)布了《MaaS框架與應(yīng)用研究報(bào)告(2024年)》《大模型平臺(tái)落地實(shí)踐研究報(bào)告(2025年)》、“MaaS標(biāo)準(zhǔn)體系”等多項(xiàng)成果,2024年以來(lái)通過(guò)構(gòu)建“方升”公有云大模型Token服務(wù)性能監(jiān)測(cè)平臺(tái),持續(xù)開(kāi)展公有云大模型Token服務(wù)性能監(jiān)測(cè)工作,并每季度發(fā)布“公有云大模型服務(wù)性能結(jié)果”,同時(shí)陸續(xù)開(kāi)展MaaS能力評(píng)估,現(xiàn)共計(jì)完成和進(jìn)行中的評(píng)估達(dá)到近30項(xiàng)目。

評(píng)估結(jié)果一覽圖
中國(guó)信通院2026年“Token服務(wù)評(píng)估”現(xiàn)正式啟動(dòng),首輪評(píng)估結(jié)果將于2026年6月在相關(guān)會(huì)議上發(fā)布,如需了解評(píng)估細(xì)節(jié),請(qǐng)咨詢(xún)聯(lián)系人。
聯(lián)系方式:
中國(guó)信通院
人工智能研究所
程老師
15600298825(微信同號(hào))
尹老師
18561320877(微信同號(hào))
來(lái)源:中國(guó)信息通信研究院