將文字化為超現實圖片，OpenAI 發表 AI 生成模型 DALL-E 2

高伯任

2022/04/07

瀏覽： views

家達利（Dali）與迪士尼動畫角色瓦力（WALL-E）的組合字。

4 月 6 日，OpenAI 發表改良後的 DALL-E 2 ，除了生成圖片更為清晰之外，還能根據一張圖片製作出不同角度的版本，同時也加入防止濫用機制。

圖片來源／OpenAI

相較去年的版本，新的 DALL-E 2 能夠以 4 倍解析度生成更逼真、準確的圖片，這包括更複雜的背景、景深效果、逼真的陰影，光線反射等。DALL-E 2 另一項功能為圖像修復（inpainting），將圖中指定的區域替換為想要的樣貌，比如「吹蠟燭的猴子」改為「吹蠟燭的猴子，戴著有趣的帽子」。DALL-E 2 甚至能將一張照片生成不同角度、風格的版本。

根據 OpenAI 影片旁白：「DALL-E 是經過圖片及圖片文字敘述的神經網絡訓練而成。借助深度學習，它不僅能理解個別物體，比如無尾熊與摩托車，還能夠理解二者間的關聯。」因此當你輸入「騎著腳踏車的無尾熊」，DALL-E 便能在幾秒內憑空生出多張類似的圖片。

儘管 DALL-E 能夠生成任何你能想到的東西，但它仍有一些限制。OpenAI 研究人員為減少深度偽造（deepfake）、濫用 AI 生成技術帶來的風險，刻意在訓練資料庫中刪除關於仇恨、情色、暴力等內容，甚至禁止 AI 生成真實存在的臉孔。

OpenAI 表示，DALL-E 2 存在的目的有兩點：一是賦予人們以更有創意的方式表達自己的能力；其次是理解人工智慧系統是如何看待我們的世界。腦中雖然有許多瘋狂的點子，但礙於自身技術不足，難以化為現實，應該是不少人都有過的經驗，比如遊戲從業人員在開發一款新遊戲時，會需要繪製遊戲場景的概念圖，這時 DALL-E 便能派上用場。不過，目前 DALL-E 2 僅開放給少數的專家測試，隨著版本不斷迭代，將來可望開放給更多人使用。

Insta360 Go 3S 動手玩！升級 4K 畫質，配件更好用！真心大推！

台灣手機備份品牌 Maktar 東京發表會結合快充備份和外部儲存新品 Qubii Power 秀超強功能

2030 達全電車目標 Volvo 還能延續瑞典坦克稱號？

New Defender OCTA 極致性能全地形新標竿

徠卡 D-Lux 8 攜帶型相機正式上市變焦鏡頭與經典設計結合

福容徠旅/鄰近機場捷運線與三井Outle t/有三溫暖跟24小時點心吧 ~

點子專區