6月25日,萬維公司“一站式智算調(diào)度服務(wù)平臺”全新V2.0版本正式上線。萬維戰(zhàn)新業(yè)務(wù)事業(yè)部智算業(yè)務(wù)團隊聚焦模型服務(wù)、異構(gòu)算力納管、異構(gòu)算力調(diào)度適配三大方向,持續(xù)優(yōu)化平臺核心功能,幫助用戶更好地與智算模型服務(wù)深度融合,進一步降低算力管理成本、降低模型使用技術(shù)壁壘、簡化異構(gòu)算力調(diào)度效率,助力降本增效,釋放數(shù)據(jù)價值。
目前,平臺已實現(xiàn)北京、武漢、深圳等全國9大區(qū)域覆蓋,完成20余套部署,服務(wù)對象涵蓋政府部門、企業(yè)客戶、院校、金融機構(gòu)及醫(yī)院等多元化用戶,有效解決了算力管理成本高、模型使用技術(shù)難等痛點。
一是落地案例成效顯著。長慶油田部署“平臺+大小模型+視頻智能業(yè)務(wù)”方案,打造覆蓋煙火識別、車輛檢測等5個場景的訓(xùn)推一體服務(wù),實現(xiàn)數(shù)據(jù)標注到部署推理全流程智能化。深圳G行采用“私有算力+平臺+DeepSeek大模型”方案,快速構(gòu)建智能客服、風(fēng)控預(yù)警應(yīng)用,效率提升20%。蘭州市“小蘭AI答”依托“平臺+DeepSeek模型”,提供7×24小時智能政務(wù)咨詢,顯著提升服務(wù)智能化水平。
二是以“三化”特色構(gòu)建核心競爭力。國產(chǎn)化適配能力突出,支持華為昇騰、寒武紀等國產(chǎn)GPU及主流算力統(tǒng)一納管與卡級調(diào)度,適配市面80%以上大模型。服務(wù)流程輕量化,提供“一鍵接入模型、共享模型隨心換、按卡時訂購”等模式,降低技術(shù)壁壘,提升服務(wù)效率。訓(xùn)推一體生態(tài)化,構(gòu)建“數(shù)據(jù)標注-模型訓(xùn)練-部署推理-模型評測”全流程服務(wù)鏈,支持多模態(tài)模型開發(fā),形成運營閉環(huán)。
三是V2.0版本強化五大特色服務(wù)。國產(chǎn)算力協(xié)同調(diào)度與可視化監(jiān)控功能,實現(xiàn)了算力資源的高效配置和實時管理,顯著提升運營效率。行業(yè)模型可視化微調(diào)支持SFT、PT等多種模式,為模型的精準適配和優(yōu)化提供了強大支持。模型一鍵部署推理與精細計量服務(wù),極大簡化了操作流程,滿足用戶對算力資源的精準需求。多維度模型評測(基線、性能評測)與報告生成功能,為模型的持續(xù)優(yōu)化提供了科學(xué)依據(jù)。智算集群統(tǒng)一可視化多級管理機制,則進一步增強了集群管理的便捷性和高效性。
四是平臺升級新增八大功能。平臺引入靈活的框架管理,涵蓋推理、訓(xùn)練以及yolo框架等多種類型;構(gòu)建起完善的模型評測體系;對模型體驗?zāi)K進行升級,支持文本和視覺的多模態(tài)體驗;拓展訓(xùn)練能力,新增SFT、PT和DPO等多種訓(xùn)練模式;優(yōu)化數(shù)據(jù)集管理流程;并提供線上化運營資料等,通過這些功能的持續(xù)優(yōu)化,不斷提升技術(shù)適配性和用戶體驗。