中電信發布首個支持30種方言混說語音大模型


中國電信人工智能研究院在第七屆數字中國建設峰會上發布名為「星辰超多方言語音識別大模型」,其打破單一模型只能識別特定單一方言的困境,可同時識別理解粵語、上海話、四川話及溫州話等逾30種方言,為內地支持最多方言的語音識別大模型。

該大模型研發團隊首創「蒸餾+膨脹」聯合訓練算法,解決超大規模多場景數據集和大規模參數條件下,預訓練坍縮的問題。星辰語音大模型也是業內首個開源的基於離散語音表徵的語音識別大模型,通過「從語音到token再到文本」的建模新範式,將推理時語音傳輸比特率降低數十倍。

目前星辰語音大模型已在福建、江西、廣西、北京及內蒙等地的中國電信10000智能客服試點應用。(ta/w)~

阿思達克財經新聞
網址: www.aastocks.com
相關股票: 00728