Gemini 生成圖片:個人實測心得,可以替代ChatGPT的圖片生成嗎?

Gemini 生成圖片
本月最推薦的環境衛生品牌
好事寶

我們是抗菌研究室,是你最專業的環境整潔隨身筆記,站內整理了多個可以打掃環境衛生的推薦產品,像是在 Elite Beauty 緻美學內賣得相當好的好事寶系列商品,本站有多次做過相關的評價介紹,不論你是在找好用的打掃用品、驅蟲用品、抗菌用品等各式各樣與環境衛生相關的用品,又或者是跟環境衛生相關的知識,本站都可以為你解惑!

文章目錄

在這波 AI 工具大爆炸的浪潮中,Google Gemini 也終於端出「圖片生成」這道大菜。很多人第一時間會問的就是:那它能不能替代我原本用得順手的 ChatGPT 圖片生成功能?

這篇就用我親自上手測試的實戰心得,帶你看看 Gemini 生成圖片的實際表現,還有它跟 ChatGPT(或說 DALL·E)的差異,到底在哪裡。

先說結論:Gemini 生成圖片的功力,在插圖的部分完全無法達到ChatGPT的功力。但是如果你只是要一個還尚可接受的程度的話,勉強可用。

Gemini可以生成圖嗎?

可以,但要看你用的是哪一個版本。Gemini 本身是一套語言模型,不具備內建圖像生成功能;不過在部分整合服務中(像是透過 Google Workspace 的 Gemini、或 Pixel 手機上的 AI 功能),它會串接 Google 的圖像模型,如 Imagen,用來生成圖片。

但這些功能目前還相對受限,像是圖像細節控制不夠、風格轉換能力也不如 OpenAI 的 DALL·E 系列靈活;而且部分使用場景(例如直接輸入「生成成吉卜力風格插圖」)的成功率偏低,對創作者來說,目前還不算真正好用。簡單說:能生圖,但別期待太高,而且圖片會有浮水印。

任務GeminiChatGPT
生成明確指示風格的插圖敗 🤢勝 ✌️
生成吉卜力風格敗 🤢勝 ✌️
生成帶文字的圖片敗 🤢勝 ✌️
類似 Phtoshop 去除圖片內的物件勝 ✌️敗 🤢

Gemini 生成圖片實測環節

這是我給Gemini和ChatGPT的提示詞:

構圖名稱:「悄悄補位的 AI」

構圖設定
場景背景:現代感的簡約辦公空間,桌面乾淨、光線柔和。使用者正處於多工狀態,但畫面流暢有序。
主角人物:一位專注的知識工作者(可為男女不限),正在操作筆電,同時看著手機或平板,身體微微前傾,動作自然。

AI 視覺化設計:在人物後方或桌面上方,有一個抽象的 AI 能量體,形狀可為幾何光球或漂浮能量雲,呈現半透明光感。
AI 正同時釋放三條淡淡的光線,分別連結到:
筆電(顯示自動摘要的圖像介面)
平板(呈現智慧建議流程)
空中漂浮的虛擬信封圖示(象徵處理郵件)

構圖動態:所有浮動元素均為無字圖像介面(例如圖示或流程圖),無任何 UI 字元或語言,僅透過視覺圖形表達功能。
風格建議:黑白灰為主調,少量點綴色;構圖具前後層次,背景留白、元素精簡。人物表情自然、不誇張。
ChatGPT 生成圖片

ChatGPT 生成圖片的成果

非常精美而且符合我想要的感覺。這當然有部分可能原因是我跟ChatGPT時常來回調整我想要的感覺,所以能夠精準命中。

Gemini 生成圖片

Gemini 生成圖片的成果

結果非常平庸,大概就是隨處可見的圖片生成等級。已經要求“無任何語言,僅透過視覺圖形表達功能”,但還是出現文字。之後我再要求他要改成“插畫”風格,線條簡單,他還是無法理解,給我類似的圖。🤮

同場加映:Midjourney生成圖片的結果

提示詞必須要先翻譯成英文才能很好生成。雖然已經明確要求不要有文字但是插圖還是出現了文字。不過風格算是獨特而且好看。

如果要 Gemini 生成圖片成吉卜力風格結果如何?

吉卜力風格可以說是 ChatGPT 最標誌性的生成特色了,特別是在使用 DALL·E 進行圖像創作時,許多人驚訝於它對吉卜力獨特的光影、筆觸與構圖張力的捕捉程度。

於是我請他將前面我們生成的圖片轉成吉卜力風格。然而,當我們把同樣的請求交給 Gemini,結果卻⋯⋯嗯,相當有落差。讓我們來看看比較:

ChatGPT 生成圖片

ChatGPT 生成圖片的成果

完美。只有一個字可以形容,完美。雖然電腦背板的圖示有點奇怪但其實還可以再修改。在背景筆觸、人物臉部都準確抓到精髓。

Gemini 生成圖片

Gemini 生成圖片的成果

就是一個日本可愛插畫風格,有種早期政府宣傳畫的感覺。這,不是我要的吉卜力。🥹

🦾 免費取得 AI 提示詞秘笈
把 AI 變成你的神隊友?這本《LLM 提示詞操作本》正是懶人包。
R‧C‧E 三步驟,百種職場角色模板,十大提詞技巧,四種優化策略,情境演練 & 參謀模式。

😎 讀完能做什麼?
- 3 分鐘寫出精準 Prompt,提高 AI 命中率。
- 用角色扮演快速模擬客戶異議、面試 Q&A。
- 把繁雜數據丟給 AI,直接拿到視覺化報告與行動建議。
Please enable JavaScript in your browser to complete this form.

加入 AI 峰哥的學員LINE社群 💬(千人社群,討論 AI 知識)

除了下載電子書,也可以加入 AI峰哥的LINE社群,現在定期都有免費的視訊課程。讓你在社群提問,讓疑惑得到解答!

其他實測

遠見的其他實測項目中,可以看到如果你對於風格沒有很強的要求,其實他在許多的應用場景有不錯的表現。下面是遠見整理出來的結果:

實測項目表現亮點待改進之處
產出含中文字的圖片中文字樣呈現清晰,整體辨識度高偶爾出現錯字或文字缺漏
在圖片中加入物件新增物件與原圖融合度高,背景過渡自然複雜元件可能出現定位不準或比例不協調
去除圖片內的物件修補區域視覺流暢,畫面整體協調個別細節如線條或紋理略顯粗糙
圖片合成處理合成後畫面整體感良好,主體結合得宜小範圍細節(如飾品或文字)容易被忽略
黑白圖加上色彩配色貼近真實,整體效果具備說服力部分人臉細節(如眼鼻口)處理不夠精確

Gemini 生成圖片:在中文字的生成表現如何?

提示詞:請生成一張貓咪脖子上掛著卡片的插圖,上面寫著『我沒有那麼委屈』的圖片。
ChatGPT 生成圖片

ChatGPT 生成圖片的成果

很可愛,雖然這次中文字生成成功,但是有時中文字生成會有問題。

Gemini 生成圖片

Gemini 生成圖片的成果

一樣不能理解我要“插圖”風格,給我的是寫實風格的圖片。一開始會給我英文字,經過要求後,中文字的生成有問題。

Gemini 生圖 vs ChatGPT:去除圖片內的物件實測

提示詞:(給予原圖後)去除車子和文字

提供的原圖

ChatGPT 生成圖片的成果

雖然完美執行了任務,但是ChatGPT的方向都是會全部重新生成圖,所以會有一些差別,比如建築物上的文字很難重現。但是有一個額外優點是畫質大提升。

Gemini 生成圖片的成果

處理得不錯,在這個任務上,我要的結果跟接近 Gemini 的生成結果,但是右下角會有浮水印

ChatGPT vs Gemini:圖片生成 UI 誰比較好用?

如果你常在兩邊跑,應該馬上會注意到一個明顯差別——ChatGPT 有「圖片庫」,Gemini 沒有。

在 ChatGPT(特別是付費帳號搭載 GPT-4o 的版本)裡,每次你生成圖片,它都會乖乖存進一個「圖片庫」裡。你可以回頭慢慢翻,還能重新下載、比對修改前後版本。這對於需要反覆比稿、做創意迭代的人來說,超方便。甚至你就算跳到別的對話視窗,圖片還是都在,不怕迷路。

反觀 Gemini,圖片生成完之後……就沒了。沒有分類、沒有歷史紀錄,沒有「相簿」這件事。你要是忘了先存下來,下次只能重新畫一張,從頭來過。對於需要版本管理或長期創作追蹤的用戶來說,這是一個小小的致命傷。

結論:Gemini 生圖可以堪用,但還遠不夠好

如果你是衝著「想找一個能畫圖又懂我」的 AI 來試試 Gemini,那我得老實講:它目前還不太行,尤其你對插畫風格有點追求的話,可能會失望。不是不能用,是用起來「沒有靈魂」,更別提要抓住什麼吉卜力神韻。

我測下來的感覺是這樣:Gemini 的圖片生成功能,比起 ChatGPT(特別是 DALL·E)像是學生交作業,有交,但不會拿高分。而 ChatGPT 那種,有時會給你一張你自己都沒想到會那麼棒的圖——就是有靈感、有氣味、有構圖的成熟感。

更慘的是 UI 這塊,Gemini 連個「圖片庫」都不留給你。生成完圖,一不小心關掉就掰掰,彷彿它自己都不太想記得那張圖。不像 ChatGPT,那個圖片管理簡直像是為創作者量身打造,愛怎麼翻、怎麼改、怎麼備份都行。

所以總結一句:

你要快、要穩、要中規中矩?Gemini 還堪用。

但你要風格、要創意、要溝通順暢?回 ChatGPT 的懷抱吧。

未來也許 Google 會補上這些差距,但以目前來看,這場圖片生成的對決,ChatGPT 完勝,毫無懸念。

需要針對“公司產業特性”與“實際流程”設計的 AI 課程嗎?需要 AI 補助課程嗎?

如果需要專業講師針對公司產業特性與實際流程設計課程,或者諮詢企業數位課程補助

建議直接聯繫 AI 峰哥(黃敬峰老師),他擅長依照你想學的特定主題,為個人或企業團隊量身規劃課程內容,甚至從頭到尾負責課程設計、工具選型、流程建議與實際部署。他不只是工具教學者,更會從策略整合、落地流程等面向出發,協助企業建立客製化培訓方案 。

課程介紹與學員課程評價/心得 👉 https://peaker.com.tw/ai

🦾 AI 峰哥過去累積超過 500 小時教學時數,合作過華碩、台灣理光、南山人壽、裕隆、TOYOTA 等企業,專長涵蓋 AI 工具應用、流程自動化到企業內部導入策略等領域 。他的工作坊教學氛圍強調小組互動與實作對話,能促進團隊成員分享使用 AI 的思維與效率提升方式。

AI 峰哥 LINE 諮詢

加入好友

» 更多推薦:

吸濕排汗衫該怎麼挑選的5大秘訣
【2025 最新】生日花束推薦排行榜|精選 10 款人氣生日花束

關於AI峰哥 – 利用數小時課程讓你擁有數百小時的AI能力

跨領域整合:具AI專業、企業管理、財務、業務、行銷、數位轉型等多重經驗,提供全方位AI解決方案。
產官學認證: 服務華碩、台灣理光、南山人壽、裕隆、TOYOTA等多家豐富的企業、政府、學術機構合作經驗。
口碑教學: 500+小時教學時數,學員好評,保證教學品質。
洞見未來: 深入洞悉AI軟硬體整合與商業模式,助你擘劃未來商業藍圖。
客製化工作流: 豐富教學經驗,為您量身打造低成本、高效益的專屬AI應用。

峰哥的風格很不一樣,不是只教你怎麼用AI工具,更會帶你看懂整體策略。

許多企業對AI望而卻步,認為導入成本高、技術難。AI峰哥致力於降低AI導入門檻,讓更多企業,尤其是中小企業,也能輕鬆擁抱AI,提升競爭力。

不只是教你哪個AI軟體好用,而是會一起思考:怎麼跟你的營運方向結合,真的幫上忙。也不是丟個解法就拍拍屁股走人。從一開始的導入規劃、選工具、設流程,到最後真的上線執行,通通會一起走一遍。

而且看的不只是眼前,因為習慣所以很會抓趨勢,幫企業提早佈局,搶得先機,不會等市場都紅了才跟著跑。

可以授課主題

    • 生成式AI工具入門說明研習班

    • AI工具及ChatGPT實戰教學

    • 零基礎輕鬆入門AI工作:提升職場效率與決策力(啟蒙分享與實作)

    • AI智慧及實務應用課程

    • AI社群爆文寫作力

    • AI人工智慧,如何形塑人類未來

    • 零基礎輕鬆入門AI工作:提升職場效率與決策力(初階班)

    • 零基礎輕鬆入門AI工作:提升職場效率與決策力(進階班)

    • 生成式AI打造人機協作的文案工坊實務班

可以授課工具

    • 文案型AI:撰寫文案、新聞稿、翻譯、轉譯、企劃書、開發信件等等。ChatGPT、Perplexity.ai、Claude.ai、Gemini、Co-Pilot …。

    • 分析型AI:不同檔案比較、分析、摘要等等。Google NotebookLM、ChatGPT、Perplexity.ai …。

    • 行銷、圖文AI:製作圖文素材。Adobe FireFly、Canva …。

    • 會議記錄AI:搭配不同AI快速整理會議記錄。memo.ai、whisper-jax、Good Tape、雅婷逐字稿

    • 客製化討論課程內容

更多精選文章
返回頂端