家達利(Dali)與迪士尼動畫角色瓦力(WALL-E)的組合字。
4 月 6 日,OpenAI 發表改良後的 DALL-E 2 ,除了生成圖片更為清晰之外,還能根據一張圖片製作出不同角度的版本,同時也加入防止濫用機制。
圖片來源/OpenAI
相較去年的版本,新的 DALL-E 2 能夠以 4 倍解析度生成更逼真、準確的圖片,這包括更複雜的背景、景深效果、逼真的陰影,光線反射等。DALL-E 2 另一項功能為圖像修復(inpainting),將圖中指定的區域替換為想要的樣貌,比如「吹蠟燭的猴子」改為「吹蠟燭的猴子,戴著有趣的帽子」。DALL-E 2 甚至能將一張照片生成不同角度、風格的版本。
根據 OpenAI 影片旁白:「DALL-E 是經過圖片及圖片文字敘述的神經網絡訓練而成。借助深度學習,它不僅能理解個別物體,比如無尾熊與摩托車,還能夠理解二者間的關聯。」因此當你輸入「騎著腳踏車的無尾熊」,DALL-E 便能在幾秒內憑空生出多張類似的圖片。
儘管 DALL-E 能夠生成任何你能想到的東西,但它仍有一些限制。OpenAI 研究人員為減少深度偽造(deepfake)、濫用 AI 生成技術帶來的風險,刻意在訓練資料庫中刪除關於仇恨、情色、暴力等內容,甚至禁止 AI 生成真實存在的臉孔。
OpenAI 表示,DALL-E 2 存在的目的有兩點:一是賦予人們以更有創意的方式表達自己的能力;其次是理解人工智慧系統是如何看待我們的世界。腦中雖然有許多瘋狂的點子,但礙於自身技術不足,難以化為現實,應該是不少人都有過的經驗,比如遊戲從業人員在開發一款新遊戲時,會需要繪製遊戲場景的概念圖,這時 DALL-E 便能派上用場。不過,目前 DALL-E 2 僅開放給少數的專家測試,隨著版本不斷迭代,將來可望開放給更多人使用。