• startupfocusnews

Facebook 推出新AI語言 翻譯無須以英文作為仲介

Facebook作為主要全球通訊工具,其翻譯系統尤其重要,單計「動態消息」,Facebook每天就已經要翻譯200億次。最近Facebook推出AI語言M2M-100,是個無須依賴英語作為中介語言的多語言機器翻譯系統。

一般而言,由於英文作為國際語言,AI可參考的資料庫較其他語言龐大,因此不少傳統翻譯系統皆以英文作為中介語言,例如由中文譯德文,一般AI系統會將中文先譯為英文,將英文翻譯出德文。但這個做法會減低翻譯結果的準確度,而且過程繁複。

Facebook新翻譯系統將提升用戶體驗。(圖片來源:Facebook官方網站)


新模型M2M-100則解決了這個問題。模型透過建構新Laser2.0系統,收集了75億句由100種不同語言組成的句子作為數據庫,將具相同意義的句子歸納成同一個意涵,更提升語言辨識速度,因此能直接翻譯100種語言,共4450種配對組合。

新模型可在100種語言間來回直接翻譯而無須經過英語。(圖片來源:Facebook官方網站)


M2M-100模型並非完全排斥中介語言的翻譯模式,而是將中介語言再細分,而非以英語為中心。模型針對語言分類、地理位置及文化相近性去提升翻譯品質,將100種語言再分14組進行訓練。例如對於印度語,模型會以印地語、孟加拉語和泰米爾語作為中介語言。

根據BLEU機器翻譯質量評測法,M2M-100比需經過英語的翻譯系統在表現上高出10分。相信未來Facebook用戶可享受高品質的翻譯體驗。

12 次瀏覽
1;1_工作區域 1.jpg

© 2020 Startup Focus