Gboard 兩年內支援 500 種語言,Google 是怎麼做到的?

2016 年 12 月,Gboard 在 Android 平台上推出,並支援 100 種語言,包含了世界最常用的 10 種語言,涵蓋全世界人口的一半,另一半(約 10 億)人口使用語言高達數千種,也是 Gboard 團隊的目標。

「要讓剩下的人充分利用網路,科技必須支援他們的語言。」Gboard 技術項目經理 Daan van Esch 表示,Gboard 目前已經支援 500 種語言,全世界 90% 人口可以使用 Gboard 他們熟悉的語言。兩年內支援 500 種語言很難嗎?讓 Gboard 團隊告訴你吧。

black and white blackboard business chalkboard

Photo by Pixabay on Pexels.com

Gboard 團隊碰到的第一個難題就是「客製化鍵盤」。客製化鍵盤很重要,如果鍵盤不支援某種少數人使用的語言的詞彙、字母,對於文字傳遞就是一種挑戰。例如奈及利亞人想輸入「Ásụsụụgbò」,使用英文輸入會自動判別成別種語言,並自動糾正成別的詞彙。

Gboard 也向我們解釋了客製化鍵盤的難處。Gboard 支援的語言有許多都沒有被人們廣泛的使用,就算是在圖書館也很難找到對應的文本,同時,這也增加了訓練 AI 的難度。好在網路的興起,人們在網路上與遠方的人使用各自的語言交流,這也讓團隊能擁有足夠的文本訓練 AI。

為什麼要訓練 AI?每次 Gboard 要添加一種新語言,團隊必須先創建全新的的機器學習語言模型,透過模型可以瞭解「人們如何使用這種語言」,AI 學會這些語言後,就能糾正你的詞彙,甚至預測你下個要輸入的字。

要訓練 AI,你還必須要有足夠龐大的文字資料庫,某些在網路上不常見的語言,團隊會找來母語人士提供輸入提示的列表。

最後,根據每種語言訂製出不同的鍵盤配置,例如數字,英文使用 0123456789。在印度語、梵語中則是使用 ०१२३४५६७८९。Gboard 團隊完成新語言的客製化鍵盤後,會找來母語人士測試,改善 Gboard 的輸入體驗。

 

科技速報

熱愛遊戲,但很少破關,喜愛日本時裝,但大多買不起,雖然到了看表演會避開衝撞區的年紀,仍會為新科技和漫威電影感到興奮。
聯絡方式:8bitgaoooo@gmail.com

More in 科技速報

達梭系統推出新一代 3D 設計軟體 SOLIDWORKS 2025,進一步加速產品開發流程

Kisplay2024/11/06

LG 獲選《2024 全球最佳品牌》 品牌重塑戰略成功,品牌價值倍增至 65 億美元

Kisplay2024/10/24

Qualcomm 正式發表 Snapdragon 8 Elite 小米 15 首發 ASUS ROG Phone 9 台灣首發

Kisplay2024/10/22

Lenovo 在 2024 年 Tech World 發表全新混合式 AI 產品組合

Kisplay2024/10/22

三星以 AI 技術驅動 蟬聯全球最佳品牌前五 強化智慧終端與半導體領域

Kisplay2024/10/17

康寧推出 EXTREME ULE Glass,支援下一代晶片製程

Kisplay2024/10/04
-->
一起用好點子過好生活吧!