ChatGPT DALL-E 3 的7個特殊 AI 繪圖應用教學,勝過 Midjourney



前一陣子 Open AI 宣布 ChatGPT 將要加入 DALL.E 3 最新 AI 繪圖引擎,從 2023/10 月份開始,陸續提供給 ChatGPT Plus 或企業版帳戶使用,也就是說,可以直接在 ChatGPT 中使用 GPT-4 來生成圖片了!前幾天,我也在自己的帳號中獲得 AI 生成圖片新功能,馬上實際試試看,發現 ChatGPT 的 DALL.E 3 除了圖像品質提升外,還有一些特殊應用可以超越我已經使用了半年以上的 Midjourney ,今天這篇文章,就來跟大家一一分享這些特殊應用案例。

之前我在電腦玩物已經寫過一篇「Bing AI 大升級,免費支援 GPT-4 與 DALL-E 3 AI 繪圖,實測比較 」,透過免費的 Bing ,大家都可以試試看 DALL-E 3 的圖像生成效果,文章中我也跟 Midjourney 進行了一些比較。

所以今天這篇文章,我要更著重在「結合 ChatGPT 」後, ChatGPT + DALL-E 3 可以有哪些特殊功能,生成哪些原本可能在 Midjourney 中沒有那麼容易生成,甚至無法生成的 AI 圖像呢?

結論來說,因為我已經付費使用 ChatGPT Plus 很長一段時間,而且對我的工作上非常有幫助。既然現在 ChatGPT 已經可以 AI 生成圖片,並且「我需要的應用案例」效果已接近 Midjourney ,甚至有許多應用是 Midjourney 上做不到的。所以,我已經在考慮要退掉 Midjourney 的付費帳戶了。

2023/10/15 更新,現在還可以圖片、文字混合提問,上傳設計圖分析,然後利用 DALL-E 3 來繪製類似風格的設計圖ChatGPT 圖文混合提問 9 種超能力:程式、教育、學習到行銷應用

2024 更新,我實驗了一年的 AI 工作流程總整理2024 我和 ChatGPT AI 工具如何一起工作,提示語、常用案例指南







2024/4/2 更新: ChatGPT 加入「圖片局部修改」功能

在 ChatGPT 生成圖片後,點進圖片,可以看到一個「局部修改」的圈選按鈕,按下後圈選想要修改的部分,然後在右下方輸入要如何修改的指令。

例如下圖,我圈選不想要的部分,在指令輸入「去掉多餘的筆筒」。於是就完成了局部內容的去除。





或者我想替換圖片中的內容,可以圈選想要替換的部分,在指令中提示要如何替換,例如我圈選畫面中的平板,下指令:「替換成 notebook 」。




也可以增加新的內容,圈選要增加內容的部分,然後類似這樣描述:「加上一付眼鏡」即可。




還可以把不滿意的氛圍、顏色、場景進行替代。例如我生成了一張雨天咖啡館的圖像,但是想要替換成大晴天。

於是我圈選落地窗景的部分,然後下指令:「改成陽光明媚的大晴天」。結果也順利的完成了場景氛圍的調整。






ChatGPT DALL-E 3 基本功能

我們還是從基本功能先開始,獲得此功能後,新增一個對話,可以在「 GPT-4 」模式中看到「 DALL-E 3」的選項。

選擇後,這個對話頻道就可以開始用來作為 AI 生成圖像的工具。




「ChatGPT DALL-E 3」有些基本功能:

  • 可以在提示語中,請他生成三種比例的圖像
    • 16:9 (寬) - 1792x1024 像素
    • 1:1 (正方形) - 1024x1024 像素
    • 9:16 (高) - 1024x1792 像素
  • 一次最多可以生成四張圖像
  • 可以輸入中文提示語,可以用自然語言表達, ChatGPT 會自動改寫成適合的 AI 繪圖英文提示語。

基本功能很簡單,用我們的直覺說出我們想畫的圖像,「ChatGPT DALL-E 3」就能幫助我們開始繪圖。(本文開頭的兩張圖像,接下來的圖片,全部都是由「ChatGPT DALL-E 3」生成

接下來,我來分享一些特殊的繪圖應用,以及如何下提示語的教學。





特殊功能一:在圖像加上文字做組合設計

「ChatGPT DALL-E 3」有一個目前 Midjourney 還幾乎做不到的特色,就是可以在圖片加上一些「簡單的英文文字」。

只要在提示語中加上要放入什麼文字,「ChatGPT DALL-E 3」就會想辦法放入圖片中。

例如下面這張圖的提示語是:「16:9 illustration in a vintage comic book style, capturing two people in a drawing duel, representing competing AI illustration tools. The scene has halftone dots and old-school comic aesthetics, with captions like 'Art vs. Tech!' woven into the design.」




不過,加上的文字不能太複雜,而且加入文字也不一定保證成功。但也沒關係,我們可以多試幾次,就有機會獲得需要的文字+圖片成果。

例如下方的提示語,我大概重複繪製了 5 次左右,獲得一個相對成功(但也不算非常成功)的結果:

繪製一張16:9簡報:
簡報題標:GTD
簡報內容:中間5個ICON橫排,由左到右順序為:
Capture 郵件
Clarity 筆記
Organize 資料夾
Reflect 放大鏡
Engage 箭頭

簡報版面:簡潔、留白





特殊功能二:用自然語言說明需求,讓 ChatGPT 自己發揮繪圖設計

在「ChatGPT DALL-E 3」中,可以但不一定要像 Midjourney 那樣寫出公式化的提示語,因為 ChatGPT 會幫我們去改寫繪圖需要的提示。

所以很多時候,我們可以用「描述成果需求」的方式,請「ChatGPT DALL-E 3」幫我們寫出適合的提示語,然後繪製出需要的圖像。

而且,有時寫得愈簡單,反而效果愈好,因為可以讓 ChatGPT 自己去發揮。

例如下面這個提示語:

繪製符合 GTD 概念的一系列ICON

這會讓 ChatGPT 開始去思考怎麼繪製?要繪製什麼圖像?




等 ChatGPT 想清楚了,他自己會幫我們寫出適合的提示語來繪製,最終產出了下面這樣的結果。





特殊功能三:設計文字本身圖像

「ChatGPT DALL-E 3」可以在圖片上加入文字,那可不可以「設計文字本身」呢?

例如把某些特定的英文單字設計成標語、ICON 圖像?

當然可以,而且只要像下面這樣簡單詢問即可,剩下的交給 ChatGPT 去揮發:

我想製作一張帶有「GTD」文字的ICON圖示,可以當作標題字體,只要有 G T D 三個字母,背景白色





特殊功能四:生成四張有關係的連續圖像

「ChatGPT DALL-E 3」一次最多生成四張圖像,而且如果仔細研究,會看到 ChatGPT 其實是自己寫了四種不同的提示語,來生成我們需要的四張圖像。

這樣一來,有沒有可能讓 ChatGPT 自己設計四種提示語,展現出一系列有變化的相同圖像呢?

例如,當你需要四季差別的風景照,可以這樣說:

依序生成下面四張風景照片,呈現出台灣四個季節的風景特色,請特別設計風景是同一個地方,但因為季節改變而有不同風貌:
1. 春
2.夏
3. 秋
4. 冬




我們甚至可以設計一系列年齡變化的照片,下圖是「ChatGPT DALL-E 3」展現的成果:

設計同一個台灣男性的四個不同年齡階段的獨照照片,小孩、青年、中年、老年。
相同的姿勢、相同的造型、相同的外觀,只是年齡不同。照片中只有一個人。




下圖是 Midjourney 用類似提示語產出的結果。

最關鍵的差別,就在於 ChatGPT 會理解我們的意圖,從而讓 AI 寫出四張照片中相近但又有不同的提示語(而我們可能無法寫得那麼精準),創造出一系列的連續照片。




那可不可以用這個特殊應用,請「ChatGPT DALL-E 3」創造漫畫故事呢?我們來試試看:

依序生成下面四張圖像,是一個連續的漫畫故事,主角是同一隻可愛的小火龍,他在便利商店中打工,四張圖是同一個小火龍的連續故事:
1. 小火龍站在便利商店前
2. 小火龍站在便利商店內的收銀機前
3. 小火龍在搬箱子
4.小火龍晚上要下班了

我們可以看到,四張連續圖片的風格是相近的,但「人物」通常很難完全一致,只能相近,因為畢竟還是重新繪製。





特殊功能五:融合圖像進行創意設計

既然 ChatGPT 可以一次創造四張不同圖像,

那可不可以請他根據其中兩張、三張,進行「融合」等特殊的繪圖設計呢?

我們來試試看:

依序生成以下四種圖像:
1. 晴天下的台北101
2.忙碌的上班族
3.時間概念的幾何圖形
4.優雅的植物線條裝飾



接著,把指定的兩張進行融合,這時候,只要用最自然的語言下指令就好:「融合上面的第一張與第二張圖」,就是這麼簡單直覺。






特殊功能六:平面設計的草圖參考

我之前曾經想嘗試用 Midjourney 進行一些平面參考草圖的設計,例如設計一些筆記範本頁面、海報宣傳頁面等等,但效果往往不是很好(也可能我不會下這類的提示語)。

但是如果在「ChatGPT DALL-E 3」中,我不用管提示語怎麼下,而是直覺的下指令就好:

設計符合康乃爾筆記法格式的「空白」筆記表格。白底。

結果真的生成一個有模有樣的參考圖。




或者我可以用這樣的方式,設計一些能夠直接拿來使用的圖像元素。

設計四張圖可愛的貓咪加上對話框的圖像,每張圖都是同一隻貓咪,對話框盡量大並中間空白。

可以看到 ChatGPT 有努力讓貓咪相近,另外也很準確的生成出我需要的對話框與比例。




midjourney 這部分還很難達到這樣的效果,起碼,無法用這樣直覺下指令的方式,達到同樣效果。(下圖是 Midjourney 的結果)





特殊功能七:持續修改前一張圖片,或是呼叫前面某一張圖片進行修改

ChatGPT 的對話功能,讓我們在跟 AI 討論時可以調閱前面的資料進行重新分析,在「ChatGPT DALL-E 3」中,這個邏輯也同樣適用。

對話前面生成的某一張圖片,之後呼叫出來修改,透過持續調整來最佳化,是可行的。

不過,只能盡可能符合原圖,還是等於重新繪製。

例如,前面我有生成一張台北 101 的圖像,我可以在後面這樣提問他。(你可以比較看看前後案例,我覺得有一定的相符程度。)

請根據對話最開頭設計的「 晴天下的台北101」圖片,使用同樣的提示語和同一張圖片種子,修改成下雨天的台北101。




或者我還可以繼續修改:

把上面這張圖改成素描畫,要使用原本的提示語與原圖種子來修改。




改到滿意後,我可以用自然語言請「ChatGPT DALL-E 3」把圖片改成 9:16 ,而且加上 TAIPEI 的文字:

用上面這張素描畫(請使用原圖的種子),製作成垂直的圖像,圖像上方打上「TAIPEI」的大大標題。

這樣的功能如果 Midjourney 要實現,就要使用:Midjourney 局部重繪功能測試心得教學, AI 繪圖後還可 AI 修圖!





結論:ChatGPT DALL-E 3 更直覺、有彈性、相對精準, Midjourney 還是更精細有創意

「ChatGPT DALL-E 3」因為結合了 ChatGPT ,這幫助人在下提示語的時候,不用掌握太多特殊規則,發揮自己的想法, ChatGPT 就會自動幫你撰寫出有效的提示語,而且很精準。在這樣的過程中,我們可以有很多直覺、有彈性的「玩」圖片應用。

「 Midjourney 」也還是有擅長之處,像是攝影照片、藝術創作的精細度與風格創意上,依然優於「ChatGPT DALL-E 3」。

例如下面這幾張圖片的比較,在第一列中我們要一張精準組合各種奇妙元素的圖片,這時候「ChatGPT DALL-E 3」往往能更精準地呈現出我們想要的結果。

第二列中,我們要一張好看的攝影照片或藝術創作,這時候「 Midjourney 」效果往往更好一點。




有興趣的朋友還可以進一步研究:


大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:
我的電子郵件是 esorhjy@gmail.com ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。

(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:ChatGPT DALL-E 3 的7個特殊 AI 繪圖應用教學,勝過 Midjourney

留言

  1. Esor 老師您好,有一部影片和雷蒙寫的一篇文章指出 PARA 系統本身存在的問題,看完後我發現這其實從側面印證的您的防彈筆記法的實用價值,在此與您分享:
    https://raymondhouch.com/notion/para-pai/

    https://www.youtube.com/watch?v=5kNCcpM61eo

    回覆刪除

張貼留言

為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。

這個網誌中的熱門文章

Google 文件推出「分頁」,高效整理專案文件、論文研究資料庫

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

實測用《 ChatGPT x Excel 自動化工作聖經》技巧,設計自動規劃電動車里程電量的 Google 試算表

Google NotebookLM 免費中文 AI 筆記實例教學,老師、學生、創作者利器

Google Maps 我的地圖完全教學!規劃自助旅行攻略

Slack 完整教學與上手心得:找到正確的團隊溝通之道

為什麼大家愛用 Trello ?最佳整理教學讓事情井然有序

畫張圖說得更清楚! Napkin 用 AI 幫你的簡報文章手繪視覺思考圖

ChatGPT Canvas 全新 AI 寫作、程式碼編輯工具,不再只能對話!

Google NotebookLM 影音升級:用 AI 學習英文 YouTube 影片、 整理大量錄音檔最佳工具