ChatGPT DALL-E 3 的7個特殊 AI 繪圖應用教學,勝過 Midjourney



前一陣子 Open AI 宣布 ChatGPT 將要加入 DALL.E 3 最新 AI 繪圖引擎,從 2023/10 月份開始,陸續提供給 ChatGPT Plus 或企業版帳戶使用,也就是說,可以直接在 ChatGPT 中使用 GPT-4 來生成圖片了!前幾天,我也在自己的帳號中獲得 AI 生成圖片新功能,馬上實際試試看,發現 ChatGPT 的 DALL.E 3 除了圖像品質提升外,還有一些特殊應用可以超越我已經使用了半年以上的 Midjourney ,今天這篇文章,就來跟大家一一分享這些特殊應用案例。

之前我在電腦玩物已經寫過一篇「Bing AI 大升級,免費支援 GPT-4 與 DALL-E 3 AI 繪圖,實測比較 」,透過免費的 Bing ,大家都可以試試看 DALL-E 3 的圖像生成效果,文章中我也跟 Midjourney 進行了一些比較。

所以今天這篇文章,我要更著重在「結合 ChatGPT 」後, ChatGPT + DALL-E 3 可以有哪些特殊功能,生成哪些原本可能在 Midjourney 中沒有那麼容易生成,甚至無法生成的 AI 圖像呢?

結論來說,因為我已經付費使用 ChatGPT Plus 很長一段時間,而且對我的工作上非常有幫助。既然現在 ChatGPT 已經可以 AI 生成圖片,並且「我需要的應用案例」效果已接近 Midjourney ,甚至有許多應用是 Midjourney 上做不到的。所以,我已經在考慮要退掉 Midjourney 的付費帳戶了。

2023/10/15 更新,現在還可以圖片、文字混合提問,上傳設計圖分析,然後利用 DALL-E 3 來繪製類似風格的設計圖ChatGPT 圖文混合提問 9 種超能力:程式、教育、學習到行銷應用

2024 更新,我實驗了一年的 AI 工作流程總整理2024 我和 ChatGPT AI 工具如何一起工作,提示語、常用案例指南









2024/4/2 更新: ChatGPT 加入「圖片局部修改」功能

在 ChatGPT 生成圖片後,點進圖片,可以看到一個「局部修改」的圈選按鈕,按下後圈選想要修改的部分,然後在右下方輸入要如何修改的指令。

例如下圖,我圈選不想要的部分,在指令輸入「去掉多餘的筆筒」。於是就完成了局部內容的去除。





或者我想替換圖片中的內容,可以圈選想要替換的部分,在指令中提示要如何替換,例如我圈選畫面中的平板,下指令:「替換成 notebook 」。




也可以增加新的內容,圈選要增加內容的部分,然後類似這樣描述:「加上一付眼鏡」即可。




還可以把不滿意的氛圍、顏色、場景進行替代。例如我生成了一張雨天咖啡館的圖像,但是想要替換成大晴天。

於是我圈選落地窗景的部分,然後下指令:「改成陽光明媚的大晴天」。結果也順利的完成了場景氛圍的調整。






ChatGPT DALL-E 3 基本功能

我們還是從基本功能先開始,獲得此功能後,新增一個對話,可以在「 GPT-4 」模式中看到「 DALL-E 3」的選項。

選擇後,這個對話頻道就可以開始用來作為 AI 生成圖像的工具。




「ChatGPT DALL-E 3」有些基本功能:

  • 可以在提示語中,請他生成三種比例的圖像
    • 16:9 (寬) - 1792x1024 像素
    • 1:1 (正方形) - 1024x1024 像素
    • 9:16 (高) - 1024x1792 像素
  • 一次最多可以生成四張圖像
  • 可以輸入中文提示語,可以用自然語言表達, ChatGPT 會自動改寫成適合的 AI 繪圖英文提示語。

基本功能很簡單,用我們的直覺說出我們想畫的圖像,「ChatGPT DALL-E 3」就能幫助我們開始繪圖。(本文開頭的兩張圖像,接下來的圖片,全部都是由「ChatGPT DALL-E 3」生成

接下來,我來分享一些特殊的繪圖應用,以及如何下提示語的教學。





特殊功能一:在圖像加上文字做組合設計

「ChatGPT DALL-E 3」有一個目前 Midjourney 還幾乎做不到的特色,就是可以在圖片加上一些「簡單的英文文字」。

只要在提示語中加上要放入什麼文字,「ChatGPT DALL-E 3」就會想辦法放入圖片中。

例如下面這張圖的提示語是:「16:9 illustration in a vintage comic book style, capturing two people in a drawing duel, representing competing AI illustration tools. The scene has halftone dots and old-school comic aesthetics, with captions like 'Art vs. Tech!' woven into the design.」




不過,加上的文字不能太複雜,而且加入文字也不一定保證成功。但也沒關係,我們可以多試幾次,就有機會獲得需要的文字+圖片成果。

例如下方的提示語,我大概重複繪製了 5 次左右,獲得一個相對成功(但也不算非常成功)的結果:

繪製一張16:9簡報:
簡報題標:GTD
簡報內容:中間5個ICON橫排,由左到右順序為:
Capture 郵件
Clarity 筆記
Organize 資料夾
Reflect 放大鏡
Engage 箭頭

簡報版面:簡潔、留白





特殊功能二:用自然語言說明需求,讓 ChatGPT 自己發揮繪圖設計

在「ChatGPT DALL-E 3」中,可以但不一定要像 Midjourney 那樣寫出公式化的提示語,因為 ChatGPT 會幫我們去改寫繪圖需要的提示。

所以很多時候,我們可以用「描述成果需求」的方式,請「ChatGPT DALL-E 3」幫我們寫出適合的提示語,然後繪製出需要的圖像。

而且,有時寫得愈簡單,反而效果愈好,因為可以讓 ChatGPT 自己去發揮。

例如下面這個提示語:

繪製符合 GTD 概念的一系列ICON

這會讓 ChatGPT 開始去思考怎麼繪製?要繪製什麼圖像?




等 ChatGPT 想清楚了,他自己會幫我們寫出適合的提示語來繪製,最終產出了下面這樣的結果。





特殊功能三:設計文字本身圖像

「ChatGPT DALL-E 3」可以在圖片上加入文字,那可不可以「設計文字本身」呢?

例如把某些特定的英文單字設計成標語、ICON 圖像?

當然可以,而且只要像下面這樣簡單詢問即可,剩下的交給 ChatGPT 去揮發:

我想製作一張帶有「GTD」文字的ICON圖示,可以當作標題字體,只要有 G T D 三個字母,背景白色





特殊功能四:生成四張有關係的連續圖像

「ChatGPT DALL-E 3」一次最多生成四張圖像,而且如果仔細研究,會看到 ChatGPT 其實是自己寫了四種不同的提示語,來生成我們需要的四張圖像。

這樣一來,有沒有可能讓 ChatGPT 自己設計四種提示語,展現出一系列有變化的相同圖像呢?

例如,當你需要四季差別的風景照,可以這樣說:

依序生成下面四張風景照片,呈現出台灣四個季節的風景特色,請特別設計風景是同一個地方,但因為季節改變而有不同風貌:
1. 春
2.夏
3. 秋
4. 冬




我們甚至可以設計一系列年齡變化的照片,下圖是「ChatGPT DALL-E 3」展現的成果:

設計同一個台灣男性的四個不同年齡階段的獨照照片,小孩、青年、中年、老年。
相同的姿勢、相同的造型、相同的外觀,只是年齡不同。照片中只有一個人。




下圖是 Midjourney 用類似提示語產出的結果。

最關鍵的差別,就在於 ChatGPT 會理解我們的意圖,從而讓 AI 寫出四張照片中相近但又有不同的提示語(而我們可能無法寫得那麼精準),創造出一系列的連續照片。




那可不可以用這個特殊應用,請「ChatGPT DALL-E 3」創造漫畫故事呢?我們來試試看:

依序生成下面四張圖像,是一個連續的漫畫故事,主角是同一隻可愛的小火龍,他在便利商店中打工,四張圖是同一個小火龍的連續故事:
1. 小火龍站在便利商店前
2. 小火龍站在便利商店內的收銀機前
3. 小火龍在搬箱子
4.小火龍晚上要下班了

我們可以看到,四張連續圖片的風格是相近的,但「人物」通常很難完全一致,只能相近,因為畢竟還是重新繪製。





特殊功能五:融合圖像進行創意設計

既然 ChatGPT 可以一次創造四張不同圖像,

那可不可以請他根據其中兩張、三張,進行「融合」等特殊的繪圖設計呢?

我們來試試看:

依序生成以下四種圖像:
1. 晴天下的台北101
2.忙碌的上班族
3.時間概念的幾何圖形
4.優雅的植物線條裝飾



接著,把指定的兩張進行融合,這時候,只要用最自然的語言下指令就好:「融合上面的第一張與第二張圖」,就是這麼簡單直覺。






特殊功能六:平面設計的草圖參考

我之前曾經想嘗試用 Midjourney 進行一些平面參考草圖的設計,例如設計一些筆記範本頁面、海報宣傳頁面等等,但效果往往不是很好(也可能我不會下這類的提示語)。

但是如果在「ChatGPT DALL-E 3」中,我不用管提示語怎麼下,而是直覺的下指令就好:

設計符合康乃爾筆記法格式的「空白」筆記表格。白底。

結果真的生成一個有模有樣的參考圖。




或者我可以用這樣的方式,設計一些能夠直接拿來使用的圖像元素。

設計四張圖可愛的貓咪加上對話框的圖像,每張圖都是同一隻貓咪,對話框盡量大並中間空白。

可以看到 ChatGPT 有努力讓貓咪相近,另外也很準確的生成出我需要的對話框與比例。




midjourney 這部分還很難達到這樣的效果,起碼,無法用這樣直覺下指令的方式,達到同樣效果。(下圖是 Midjourney 的結果)





特殊功能七:持續修改前一張圖片,或是呼叫前面某一張圖片進行修改

ChatGPT 的對話功能,讓我們在跟 AI 討論時可以調閱前面的資料進行重新分析,在「ChatGPT DALL-E 3」中,這個邏輯也同樣適用。

對話前面生成的某一張圖片,之後呼叫出來修改,透過持續調整來最佳化,是可行的。

不過,只能盡可能符合原圖,還是等於重新繪製。

例如,前面我有生成一張台北 101 的圖像,我可以在後面這樣提問他。(你可以比較看看前後案例,我覺得有一定的相符程度。)

請根據對話最開頭設計的「 晴天下的台北101」圖片,使用同樣的提示語和同一張圖片種子,修改成下雨天的台北101。




或者我還可以繼續修改:

把上面這張圖改成素描畫,要使用原本的提示語與原圖種子來修改。




改到滿意後,我可以用自然語言請「ChatGPT DALL-E 3」把圖片改成 9:16 ,而且加上 TAIPEI 的文字:

用上面這張素描畫(請使用原圖的種子),製作成垂直的圖像,圖像上方打上「TAIPEI」的大大標題。

這樣的功能如果 Midjourney 要實現,就要使用:Midjourney 局部重繪功能測試心得教學, AI 繪圖後還可 AI 修圖!





結論:ChatGPT DALL-E 3 更直覺、有彈性、相對精準, Midjourney 還是更精細有創意

「ChatGPT DALL-E 3」因為結合了 ChatGPT ,這幫助人在下提示語的時候,不用掌握太多特殊規則,發揮自己的想法, ChatGPT 就會自動幫你撰寫出有效的提示語,而且很精準。在這樣的過程中,我們可以有很多直覺、有彈性的「玩」圖片應用。

「 Midjourney 」也還是有擅長之處,像是攝影照片、藝術創作的精細度與風格創意上,依然優於「ChatGPT DALL-E 3」。

例如下面這幾張圖片的比較,在第一列中我們要一張精準組合各種奇妙元素的圖片,這時候「ChatGPT DALL-E 3」往往能更精準地呈現出我們想要的結果。

第二列中,我們要一張好看的攝影照片或藝術創作,這時候「 Midjourney 」效果往往更好一點。




有興趣的朋友還可以進一步研究:


大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:
我的電子郵件是 esorhjy@gmail.com ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。

(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:ChatGPT DALL-E 3 的7個特殊 AI 繪圖應用教學,勝過 Midjourney

留言

  1. Esor 老師您好,有一部影片和雷蒙寫的一篇文章指出 PARA 系統本身存在的問題,看完後我發現這其實從側面印證的您的防彈筆記法的實用價值,在此與您分享:
    https://raymondhouch.com/notion/para-pai/

    https://www.youtube.com/watch?v=5kNCcpM61eo

    回覆刪除

張貼留言

為了避免垃圾廣告留言過多,開始測試「留言管理」機制,讓我可以更容易回應讀者留言,並更簡單過濾掉廣告,但只要不是廣告留言都會通過審核。

這個網誌中的熱門文章

全家沖印、 7-11 列印照片誰好用?立可得與 ibon教學+比較表

Google Maps 我的地圖完全教學!規劃自助旅行攻略

Facebook Groups新版社團功能,和一小群朋友建立臉書秘密空間

Acer Chromebook 台灣開箱 Google Chrome OS 心得

Fences 1.0 正式版推出!管理桌面圖示從此井然有序,美化優化桌面的收納盒

如何在 Rainlendar 2.6 桌面行事曆添加RSS、天氣預報、倒數計時面板?

LINE App PC電腦版下載設定教學,手機電腦彈性即時通

Comodo Internet Security 4.0 免費防毒防駭防火牆新版心得

Rainlendar 2.2 桌面行事曆基本安裝設定完全攻略

Comodo Firewall + AntiVirus:全中文免費防火牆+防毒軟體上手教學