訓練台版AI語言模型 許永真:盼讓百工百業商用中央社記者江明晏台北30日電 (2024-04-30 13:13:42)

國科會去年4月啟動TAIDE計畫,研發台版大型繁中AI語言模型,台大資工系教授許永真表示,TAIDE是透過中文資料,訓練以英文為母語的Llama模型,「像在教美國長大的ABC講中文」,目前已有初步成果,盼盡快讓台灣百工百業商用。

「2024年AI與資訊安全論壇」今天登場,台大資工系教授許永真以「台灣的AI與大型語言模型(LLM)」為題發表演說。

為因應國際大型語言模型常產生資訊偏誤,或不符台灣文化與價值觀的回應,國科會去年4月啟動TAIDE計畫,在Llama(Meta推出的語言模型)原型基礎上,由國內學界專家進一步發展及訓練調校。

許永真為台灣AI卓越中心副總召集人,參與TAIDE計畫,她今天在論壇中表示,AI有其資安風險,許多人都擔心「所思所想、機敏資料外流」,讓大家對AI又愛又怕,甚至有人透過AI模型學習,可攻擊世界上任何一個網站。

她援引哈佛法學教授雷席格所說,「我們正處於AI的『奧本海默時刻』,好壞永遠並存」。

許永真也說,雖然要擔心資料外流的問題,但更應該正視台灣失去數位話語權、失去自主發展大模型的機會,因此一年前就與專家團隊一同建議台灣應該建造自己的AI對話引擎,在國科會指導下,成功打造出TAIDE可信任AI對話引擎。

她分享,TAIDE是站在巨人肩膀上,選擇以英文為母語的Llama模型,再透過中文資料繼續訓練;許永真比喻「就像在教一個在美國長大的ABC學會講中文」,透過英文基礎教育、中文基礎教育、中學教育、高等教育等加強學習。

在算力有限的狀況下,TAIDE去年6月就成功完成第一階段展示,她表示,目標是成為可商用模型,讓台灣百工百業都來使用,其條件包括基礎模型必須可商用,也要有充足的可商用授權中文相關資料。

許永真分享,Meta去年7月推動可商用的Llama 2,並在今年4月19日公開釋出Llama 3新一代的大型語言模型,團隊僅用4天就完成模型訓練;接下來的挑戰是透過可商用中文資料訓練,目前已經有許多中文授權資料量,也歡迎各界交流資源。

她強調,TAIDE不是要去和各大語言模型抗衡匹敵,但希望能提供台灣中小企業,甚至不願意資料外流的金融業一個安全可靠的語言模型,也期待民間力量來把這個專案商轉,一起來共同壯大。
加密貨幣
比特幣BTC 66397.50 130.01 0.20%
以太幣ETH 3085.64 48.58 1.60%
瑞波幣XRP 0.522363 0.00 0.65%
比特幣現金BCH 470.19 6.07 1.31%
萊特幣LTC 83.77 1.24 1.50%
卡達幣ADA 0.482403 0.03 6.49%
波場幣TRX 0.125049 0.00 -1.07%
恆星幣XLM 0.109117 0.00 2.17%
投資訊息
相關網站
股市服務區
行動版 電腦版
系統合作: 精誠資訊股份有限公司
資訊提供: 精誠資訊股份有限公司
資料來源: 台灣證券交易所, 櫃買中心, 台灣期貨交易所
依證券主管機關規定,使用本網站股票、期貨等金融報價資訊之會員,務請詳細閱讀「資訊用戶權益暨使用同意聲明書」並建議會員使用本網站資訊, 在金融和投資等方面,能具有足夠知識及經驗以判斷投資的價值與風險,同時會員也同意本網站所提供之金融資訊, 係供參考,不能做為投資交易之依據;若引以進行交易時,仍應透過一般合法交易管道,並自行判斷市場價格與風險。
請遵守台灣證券交易所『交易資訊使用管理辦法』等交易資訊管理相關規定本資料僅供參考,所有資料以台灣證券交易所、櫃買中心公告為準。 因網路傳輸問題造成之資料更新延誤,精誠資訊不負交易損失責任。