「臺灣主權AI 訓練語料庫」上線啦

發佈日期 : 2026-01-22 資訊群組 : admin 公告分類 : 首頁/重大訊息,首頁/公佈欄,首頁/校內公告,圖書館公告

為推動臺灣主權AI發展,數位發展部打造「臺灣主權AI訓 練語料庫」(下稱語料庫),廣納高品質正體中文語料, 支援AI模型訓練更貼近臺灣語言、文化與生活情境,促進 AI模型具備更高的本土辨識力與語意理解能力。

語料庫目前已逾200個政府機關投入,上架累計超過3,000 筆資料集,語料規模超過10億詞元(token)並持續擴充,收 錄內容為各機關具臺灣文化特色之高品質資料集,涵蓋語 言、文化、交通、教育、生物、地理環境等領域。

歡迎有AI模型訓練需求之機關(構)、公私法人、研究機 構、學校、非法人團體或自然人申請使用,用臺灣的語 料,打造理解臺灣的AI!

若有申請相關問題,請洽語料庫維運管理單位客服信箱:tsaitc@moda.gov.tw