商湯(00020.HK)大裝置事業群研發總監張行程出席華為全聯接大會2024時表示,多年來商湯大模型基於昇騰原生開發進行實踐,共同推進基礎模型、行業大模型應用與創新,通過高效並行、通信優化及網絡架構感知和任務調度等技術改善,構建大規模並行訓練加速系統。
其中102B模型的訓練性能已達到業界的120%以上,同時單一任務集群規模擴展至3倍,算力效率損失僅為3%,線性加速比可高達97%以上。他又指,基於昇騰計算生態,商湯已建設長序列並行訓練加速機制,與業界相比,4K序列性能提升1倍以上,32K序列性能持平,更可處理128K長序列訓練。
他表示,通過與昇騰團隊合作,商湯已將全棧大模型生產能力產品化,構建從基礎層、模型層、串聯層到應用層的高效、完備、易用的大模型生產工具鏈。(gc/k)~
阿思達克財經新聞
網址: www.aastocks.com
相關股票: 00020,80020