Gboard 兩年內支援 500 種語言,Google 是怎麼做到的?

2016 年 12 月,Gboard 在 Android 平台上推出,並支援 100 種語言,包含了世界最常用的 10 種語言,涵蓋全世界人口的一半,另一半(約 10 億)人口使用語言高達數千種,也是 Gboard 團隊的目標。

「要讓剩下的人充分利用網路,科技必須支援他們的語言。」Gboard 技術項目經理 Daan van Esch 表示,Gboard 目前已經支援 500 種語言,全世界 90% 人口可以使用 Gboard 他們熟悉的語言。兩年內支援 500 種語言很難嗎?讓 Gboard 團隊告訴你吧。

black and white blackboard business chalkboard

Photo by Pixabay on Pexels.com

Gboard 團隊碰到的第一個難題就是「客製化鍵盤」。客製化鍵盤很重要,如果鍵盤不支援某種少數人使用的語言的詞彙、字母,對於文字傳遞就是一種挑戰。例如奈及利亞人想輸入「Ásụsụụgbò」,使用英文輸入會自動判別成別種語言,並自動糾正成別的詞彙。

Gboard 也向我們解釋了客製化鍵盤的難處。Gboard 支援的語言有許多都沒有被人們廣泛的使用,就算是在圖書館也很難找到對應的文本,同時,這也增加了訓練 AI 的難度。好在網路的興起,人們在網路上與遠方的人使用各自的語言交流,這也讓團隊能擁有足夠的文本訓練 AI。

為什麼要訓練 AI?每次 Gboard 要添加一種新語言,團隊必須先創建全新的的機器學習語言模型,透過模型可以瞭解「人們如何使用這種語言」,AI 學會這些語言後,就能糾正你的詞彙,甚至預測你下個要輸入的字。

要訓練 AI,你還必須要有足夠龐大的文字資料庫,某些在網路上不常見的語言,團隊會找來母語人士提供輸入提示的列表。

最後,根據每種語言訂製出不同的鍵盤配置,例如數字,英文使用 0123456789。在印度語、梵語中則是使用 ०१२३४५६७८९。Gboard 團隊完成新語言的客製化鍵盤後,會找來母語人士測試,改善 Gboard 的輸入體驗。

 

科技速報

熱愛遊戲,但很少破關,喜愛日本時裝,但大多買不起,雖然到了看表演會避開衝撞區的年紀,仍會為新科技和漫威電影感到興奮。
聯絡方式:8bitgaoooo@gmail.com

More in 科技速報

聯發科技攜手 NVIDIA 推出 NVIDIA GB10 超級晶片 強化個人 AI 超級電腦 Project DIGITS

Kisplay2025/01/08

聯發科技攜手意騰科技亮相 CES 2025,展出多元 AI 語音方案

Kisplay2025/01/07

萊雅集團 CES 2025 展推出革命性肌膚智慧檢測儀 Cell BioPrint

Kisplay2025/01/07

街口支付支援 Apple 服務付款 提供免國外交易手續費與多元回饋

Kisplay2025/01/06

達梭系統推出數位孿生技術應用於臨床試驗的指南,加速醫療創新

Kisplay2024/12/31

COMPUTEX 2025 「AI NEXT」為主題!四大科技趨勢亮相 搶攻 AI 應用市場

Kisplay2024/12/30
-->
一起用好點子過好生活吧!