2016 年 12 月,Gboard 在 Android 平台上推出,並支援 100 種語言,包含了世界最常用的 10 種語言,涵蓋全世界人口的一半,另一半(約 10 億)人口使用語言高達數千種,也是 Gboard 團隊的目標。
「要讓剩下的人充分利用網路,科技必須支援他們的語言。」Gboard 技術項目經理 Daan van Esch 表示,Gboard 目前已經支援 500 種語言,全世界 90% 人口可以使用 Gboard 他們熟悉的語言。兩年內支援 500 種語言很難嗎?讓 Gboard 團隊告訴你吧。
Gboard 團隊碰到的第一個難題就是「客製化鍵盤」。客製化鍵盤很重要,如果鍵盤不支援某種少數人使用的語言的詞彙、字母,對於文字傳遞就是一種挑戰。例如奈及利亞人想輸入「Ásụsụụgbò」,使用英文輸入會自動判別成別種語言,並自動糾正成別的詞彙。
Gboard 也向我們解釋了客製化鍵盤的難處。Gboard 支援的語言有許多都沒有被人們廣泛的使用,就算是在圖書館也很難找到對應的文本,同時,這也增加了訓練 AI 的難度。好在網路的興起,人們在網路上與遠方的人使用各自的語言交流,這也讓團隊能擁有足夠的文本訓練 AI。
為什麼要訓練 AI?每次 Gboard 要添加一種新語言,團隊必須先創建全新的的機器學習語言模型,透過模型可以瞭解「人們如何使用這種語言」,AI 學會這些語言後,就能糾正你的詞彙,甚至預測你下個要輸入的字。
要訓練 AI,你還必須要有足夠龐大的文字資料庫,某些在網路上不常見的語言,團隊會找來母語人士提供輸入提示的列表。
最後,根據每種語言訂製出不同的鍵盤配置,例如數字,英文使用 0123456789。在印度語、梵語中則是使用 ०१२३४५६७८९。Gboard 團隊完成新語言的客製化鍵盤後,會找來母語人士測試,改善 Gboard 的輸入體驗。