您可能已注意到,AV01的正體中文內容在最近的時間內被翻譯得更快,也更貼近了日語原文。
我們很高興地宣佈:
AV01已正式進入AI時代。
您也許曾經想過,過去人工翻譯的工作,每天需要處理上過千甚至過萬的刺激文字描述,是如何承受的?這份工作真的不容易。
還有一個現實問題是,正體中文社群的規模遠小於隔壁的x億人口的社群,因此人力資源變得更加珍貴,也更難要求得到快速和及時的翻譯服務。寶貴的人力時間,應該用在更有創造力的工作上。
「他們是他們,我們是我們」
隔壁的AI項目之多,語言好像相通但不盡相同,我們說的是「影片」(臺:ㄧㄥˇ ㄆㄧㄢˋ 港: jing2 pin3-2),他們說的是"視頻"(Shipin),我們寫的是「正體」,他們說我們的是"繁体"。我們的使用者來自世界各地,當然也有使用簡體字的朋友。我們理解一門語言是會不斷進化和吸納不同的新造詞,但每個地區的使用者偏好的語言不同。
♪~婆娑無邊的太平洋 懷抱著自由的土地
溫暖的陽光照耀著 照耀著高山和田園~♫
AV01是如何做到的?我們站在臺灣LLM的基礎上,自行增強了模型的日語處理能力及微調正體中文用詞,才得出令人滿意的AI翻譯成果。
在此,我們感謝以下兩支臺灣的LLM團隊,排名不分先後,只按LLM釋出時間列出。
Taiwan LLM - Yen-Ting Lin, Yun-Nung Chen @ NTU MiuLab (林彥廷,陳縕儂 @ 國立臺灣大學資訊工程學系 機器智慧與理解實驗室) 2023年10月
Breeze-7B - Chan-Jan Hsu, Chang-Le Liu, Feng-Ting Liao, Po-Chun Hsu, Yi-Chang Chen, and the supervisor Da-Shan Shiu @ MediaTek Research (許湛然,劉昶樂,廖峰挺,許博竣,陳宜昌 及 指導 許大山 @ 聯發科研發小組) 2024年1月
有興趣的朋友可以自行逕上Hugging Face看看他們家Model cards的介紹。
想在本地環境下試作的,也可以看看以由Audrey Tang (唐鳳,數位發展部部長) 個人Hugging Face頁面 上的量化模型,用最少的GPU或CPU資源開始LLM的探索。
不知道哪個LLM比較好? 可以在 TaiwanLLM聊天機器人競技場 比較一下喔。
我們再次感謝以上臺灣的學術先鋒,為正體中文社群作出的莫大貢獻!
AV01團隊
2024年2月2日
近期發佈大部分的都是AI翻譯, 隨手挑了幾個特別有意思的範例: DSD-885 FC2-PPV-4280655 START-019