TwinkleAI開源Formosa-Vision台灣視覺集 廣邀社群強化台灣文化自主

發稿時間:2025/11/20 15:42
最新更新:11/20/2025 16:05:49
字級:

隨著全球人工智慧模型在內容生成領域的影響日益擴大,台灣文化及語境面臨被弱化風險。在地社群Twinkle AI團隊發起 Formosa Vision 專案,希望透過建立本地開放授權圖文資料集,強化台灣文化在 AI 時代的保存與自主性,回應社群關於文化語境被邊緣化的憂慮。

Formosa Vision 專案由在地社群 Twinkle AI 發起,主要於台灣各地進行圖文資料的整理與開放授權,目標是建立台灣視覺與語言資料集,讓人工智慧能更精確地理解並傳承台灣的獨特文化樣貌。專案從國家文化記憶庫 2.0中精選兩千餘張資料,文字描述採用 OGDL 1.0 授權、及圖片為 CC By SA(及更開放的授權條款)授權的影像,內容涵蓋景點、建築、生活場景與歷史脈絡。

TwinkleAI開源Formosa-Vision台灣視覺集 廣邀社群強化台灣文化自主(開放文化基金會提供)
TwinkleAI開源Formosa-Vision台灣視覺集 廣邀社群強化台灣文化自主(開放文化基金會提供)

專案導師黃亮勳表示,國際視覺語言模型如 Gemma、LLaMA 系列雖具技術優勢,卻對台灣影像及地區資訊的理解有限。他強調,如果 AI 輸出內容長期受外國語法及資料驅動,可能影響台灣文化及歷史的傳承。專案學員劉俊彥則指出,Formosa Vision 的設立,正是希望維持台灣在世界 AI 資料集的能見度與活躍度,防止由外來模型單方面詮釋台灣文化價值。

團隊成員分享,過去全球視覺語言 AI 模型因缺乏台灣在地數據,出現多次誤判。例如,AI 曾將婚喪場合使用的花圈誤認為警戒標誌,或將山區道路的粗繩誤判成防落石設施,顯示現有模型對台灣習俗與環境理解有限。團隊認為,Formosa Vision 致力於補足此類知識缺口,使 AI 能更貼近本地需求。

導師陳旻詣表示,現階段 AI 若無法充分理解台灣的文化背景及社會語境,將難以在實際應用中發揮效益。例如,外國旅客在台尋求協助時,倘若模型無法辨識地點,將影響服務品質。

團隊說明,資料收集過程中,主要從國家文化記憶庫約兩百萬筆資料中,嚴選約兩千多筆圖片,並依據開放授權條款進行分類,確保資料集能自由運用。整理之資料涵蓋如古道、海景、馬祖戰地地標與桃園眷村等在地景觀。團隊期望透過這些影像資料,協助大眾重新認識台灣歷史與文化亮點,例如原住民族部落遺址若未被及時記錄,恐將遭到忽略。

團隊強調,Formosa Vision 資料集重現台灣語言與文化的多元特性,包括日治時期日語、馬雅各傳教士書寫法、國民政府遷台後書寫方式及原住民族語等。學員黃仁和表示,許多現有資料集僅對圖像做物件標註,Formosa Vision 則進一步納入文化及歷史脈絡,以協助 AI 模型不僅學會辨識,亦能理解影像背後蘊含的歷史情感。

黃亮勳指出,無論是 Formosa Vision 專案還是 Twinkle AI 團隊,長期以來皆面臨資金、人力與社群維護等挑戰。他表示,開源專案常因人才招募不易及營運門檻高,導致部分成員中途離開。為此,團隊持續透過公開活動與資訊曝光,吸引有志人士參與,期望建立長期合作機制。

專案在算力資源取得方面同樣面臨挑戰。Formosa Vision 團隊說明,目前部署於 DGX 等級伺服器以支援圖像審核,相關 GPU 設備建置成本已逾新台幣百萬元。專案得以持續運作,部分仰賴黃亮勳所屬 APMIC 公司,協助補足算力資源。黃亮勳表示,若政府能於經費與基礎設施上提供協助,將有助台灣 AI 產業生態健全發展。

目前政府雖推動算力租借計畫,但申請流程複雜且資源多由大型企業取得,中小企業與學術界研究者較難受惠。Twinkle團隊建議,應簡化申請程序並分配使用配額,以保障基層新創與學界的實質需求。

團隊指出,台灣在 AI 模型訓練實務上,主要挑戰之一為缺乏足夠繁體中文與本地化資料集。根據學員梁廣廷說法,目前資料準備約佔整體訓練工時八成,資料缺口已成模型性能提升的主要障礙。他呼籲政府推動資料探勘例外條款,規範 AI 研究者在合理範圍內利用公開資料,並建立專責審查機制,降低法律風險與提升研究效率。

劉俊彥進一步指出,多數本地文史工作者傾向採用 CC BY-NC 等授權方式,限制了資料可用性。即便政策層面表達開放意願,基層承辦人員仍因法規風險顧慮,導致開放進度遲緩。他建議,政府應明定法規配套,讓資料釋出單位或個人無須承擔額外風險。

陳旻詣表示,來自中國大陸的 AI 模型引發語法應用風險與資料污染等疑慮。他指出,部分教師因教材不足,必須利用對岸模型產製簡體文本,再透過 OpenCC 等工具轉換為繁體,易造成文字譯錯,如「濃郁」譯為「濃鬱」,「虱目魚」變成「蝨目魚」等。他認為,唯有提升本地資料的語境一致性與品質,台灣方能確保在地語料與 AI 發展自主性。

Twinkle AI 團隊秉持開源精神,已將 Formosa Vision 相關訓練工具、程式碼以及評測架構全面公開,包括自建訓練平台 Twinkle Gallery 及評測工具 Twinkle Eval。團隊表示,未來將持續推動繁體中文資料集與模型權重研發,逐步拓展至聲音等多模態領域,並將串聯媒體與民間組織,鼓勵開放私有文字資料。

Formosa Vision 團隊表示,專案目前已著手建立在地視覺資料集與開源訓練架構,處於早期試行階段。團隊期望,未來能攜手更多重視開源精神與文化保護的合作夥伴,共同推動台灣 AI 於文化傳承領域建立更堅實基礎。

Formosa Vision開源視覺集專案,由數位發展部數位產業署社群業師培力支持,亦經資策會數轉院與開放文化基金會協助推動,並且由 APMIC 贊助算力得以架設視覺模型輔助。(文/Twinkle AI)