台灣特色大型語言模型與時俱進 吳政忠承諾讓TAIDE不斷炊

國科會今天(3日)指出,自4月中旬釋出具台灣特色、繁體中文生成的大型語言模型TAIDE-LX-7B後,已有超過6,000人次下載,日前更跟進Meta 公開釋出Llama 3,推出Llama 3為基礎的模型。由於之前此計畫僅簽約1年,讓外界擔憂難以延續,國科會主委吳政忠指出,會讓TAIDE模型與時俱進,成為台灣指標性的基礎模型。

國科會自去(2023)年初推動可信任生成式AI發展先期計畫(Trustworthy AI Dialogue Engine,簡稱TAIDE),在經過一年後,在4月15日釋出TAIDE-LX-7B模型,這是一款以Meta Llama-2-7B為基礎、結合台灣文化的大型語言模型,具有繁體中文的文本生成能力,隨著4月19日Meta 公開釋出Llama 3,為回應各界對繁中模型的期待,TAIDE團隊僅以4天時間旋即完成Llama 3-TAIDE-LX-8B-Chat-Alpha1模型,並於4月29日公開釋出。

國科會3日舉行記者會發表成果,國科會主委吳政忠指出,TAIDE LX-7B模型,不到半個月的時間,已有超過6,000人次下載,顯示各界對於可信任、具有台灣特色的繁體中文基礎模型有強烈需求,未來國科會也將繼續努力,讓TAIDE模型與時俱進,成為台灣指標性的基礎模型。他說:『(原音)政府會持續援助此計畫、我承諾至少延一年,已經請科技辦公室持續推,讓此引擎更適合台灣的環境。』

TAIDE計畫負責人、中央研究院資通安全專題中心(TWISC)執行長李育杰也指出,業界運用TAIDE為基礎,推出可以講台語、客語的應用,就是在保護自己的文化,這是國際上的趨勢,但他坦言,以擁有功能強大的GPU H100為例,Llama 3有兩萬四千片,台灣只有72片,在算力競爭台灣絕對不夠;而這不像蓋房子,按圖施工就可以,而是要跟著趨勢跑。

中研院院士孔祥重致詞時也指出,TAIDE是台灣邁出的關鍵一步,可符合台灣文化和價值,他期望TAIDE可成為台灣生成式人工智慧的知識中心,未來要關注此技術對道德、政策和社會的影響,確保模型的可信度。

Google傑出科學家紀懷新受訪時也指出,他覺得TAIDE做得非常好,因為台灣硬體是強項,但軟體若沒結合,就會垮下來,這項成果明顯能補強軟體這部分,但他強調,任何大型語言模型都會有「幻覺」,從剛剛的案例也可看出要讓資訊完全正確不容易,這是後續要注意的地方。

原始連結

更多中央廣播電臺新聞
管理生成式AI 岸田文雄巴黎公佈全球規範框架
首屆台法科學研究會議落幕 吳政忠盼雙方優勢互補、共創雙贏
瞄準奧運商機 國科會將率43隊新創赴法國VivaTech