Gemini API 教學:輕鬆上手多模態 AI,和 ChatGPT API 誰比較強?

Gemini API 教學
本月最推薦的環境衛生品牌
好事寶

我們是抗菌研究室,是你最專業的環境整潔隨身筆記,站內整理了多個可以打掃環境衛生的推薦產品,像是在 Elite Beauty 緻美學內賣得相當好的好事寶系列商品,本站有多次做過相關的評價介紹,不論你是在找好用的打掃用品、驅蟲用品、抗菌用品等各式各樣與環境衛生相關的用品,又或者是跟環境衛生相關的知識,本站都可以為你解惑!

文章目錄

如何開始使用 Gemini API:懶人快速開通攻略

✅ 第一步:先拿到你的「魔法鑰匙」——API 金鑰

如何取得 Gemini API?想用 Gemini API,不需要什麼程式背景,基本上就像辦一張會員卡,拿到鑰匙後就能開啟 AI 魔法世界。

流程很簡單:

  1. 登入 Google 帳號,進入 Google AI Studio
  2. 建立一個專案(或選一個舊的也可以)。
  3. 點選「API 金鑰」→ 產生一串看起來很機密的密碼字串。
如何取得Gemini API

這串就是你的 API 金鑰,記得複製下來好好保存。接下來只要在任何支援 Gemini 的外部工具、插件、網站服務裡,貼上這串金鑰,就能叫 Gemini 幫你動腦了。

像 Notion AI 插件、AI 瀏覽器擴充工具、有些寫作/設計平台,都會有個「填入 Gemini API Key」的欄位,只要貼上,就能開啟智慧模式。

🧠 小提醒:

  • 這串 API 金鑰就像是你專屬的提款卡密碼,不要貼在公開網站、也不要丟到 GitHub。
  • Google 有提供免費額度可以先試用,平常用其實很夠用,不需要馬上刷卡。
  • 記得,如果你換了 Google Cloud 專案,API 金鑰也要重新設定一次。

Gemini API 可以做什麼?

Gemini 是 Google 家現在最強的生成式 AI 模型,強到不像話。除了會「看字懂意思」,它還會「看圖猜內容」、「聽音辨場面」,甚至連影片都能理解個大概。你可以把它想成一個有點誇張的 AI 萬事通,只要你開口,它幾乎都能給出一個像樣的答案。

✍️ 幫你寫字寫文案,連道歉信都能代筆

你可以給 Gemini 幾句提示,它就能幫你:

  • 寫完一篇還沒結尾的文章
  • 生出一個創意小故事
  • 幫你總結文件、翻譯段落
  • 甚至把你不想打的道歉信、拒絕信,包裝得又誠懇又動人

重點是——它寫的還不錯。根據一些大型語言理解測試(像是 MMLU),它的表現甚至超過人類專家!是不是有點毛骨悚然,但又有點想趕快拿來用看看?

👨‍💻 懂程式碼,比很多線上課程還有耐心

如果你是寫程式會卡住的人(其實誰不會),Gemini 可以直接幫你看程式碼、解釋它在幹嘛,甚至照你的需求寫一段出來。不管你是寫 Python、Java 還是 Go,它都能搭上話。

你只需要問它:「這段是幹嘛的?我想改成 XXX 要怎麼寫?」
它會秒懂然後給你範例,完全像請到一個不會請假、也不會翻白眼的資深工程師。

🖼 看圖說話不是夢,還能幫你解影片

Gemini 的多模態能力也很強。

你傳一張照片給它,它不只會說「這是一隻貓」,還會說出「這隻貓看起來正在生氣,因為旁邊的杯子打翻了」。

同樣地,給它一段音訊、甚至影片片段,它也能理解裡面發生什麼事——超級適合做:

  • 圖片問答聊天機器人
  • 看圖寫圖說文的教學應用
  • 自動產出影音摘要的影片助手

🤖 拿來做聊天機器人?非常可以,還很會記話

當然,最基本的應用之一就是做成聊天機器人。

跟 Gemini 對話,就像請一個反應快、記性好又不會情緒勒索的 AI 小幫手。你可以拿它來做:

  • 客服聊天機器人
  • 個人助理式的對話 AI
  • 複雜任務的流程引導機器人

它最大的優勢之一是「長記憶」。不像某些 AI 每三句話就忘了你剛剛說什麼,Gemini 可以記得對話脈絡、上下文邏輯,而且不會跳針。

而且 Google 還有推出 Gemini Live 這種能即時語音互動的功能,基本上就是能跟你用講的,像真人聊天一樣。

ChatGPT API 跟 Gemini API 哪個好用?

Gemini API 與 ChatGPT API 比較

Gemini API 表格比較

比較項目ChatGPT API(OpenAI)Gemini API(Google)
模型能力與表現GPT-4 對話自然、知識與程式表現穩定,適合日常應用與泛用任務Gemini 1.5 Pro 在推理、程式、學術任務上表現強勁,回答更精簡有力
多模態能力主要支援文字輸入;需另串接 DALL·E(圖)、Whisper(語音)等工具原生支援文字、圖片、語音,多模態整合在同一 API 裡
語言支援與在地化多語言能力強,中文表現佳多語言也很出色,Google 自家搜尋與翻譯優勢讓在地化更貼近使用情境
功能彈性與整合支援 Function Calling、外掛,生態成熟,但缺乏原生網路搜尋可直接整合 Google 搜尋;支援「Grounding」,適合深度資訊查詢
上下文長度(token)GPT-4 最大支援 32K tokenGemini 1.5 系列支援上看 100 萬 token,超長文本處理強大
開發者體驗註冊簡單,API 文件與社群資源豐富,新手上手快設定略繁瑣(需建 Google Cloud 專案),但提供 AI Studio 工具與代碼產生器
價格與免費額度無長期免費額度;GPT-4 每 1K token 約 $0.06(輸出)提供每日免費額度;1.5 Pro 每 1K token 約 $0.005,價格具吸引力
適合情境想快速打造聊天機器人、處理一般問答、常識性任務需要多模態輸入、長文本處理、與 Google 生態整合的專案開發

總結:如果把 ChatGPT API 和 Gemini API 比喻成兩款飲料,一個是經典可樂(穩定好喝,人人熟悉),另一個是新出的綜合果汁(口味豐富,主打多合一)。哪個好喝?要看你的口味和需求!

若你需要強大的對話和豐富的現有範例,ChatGPT 是穩紮穩打的選擇;但如果你嚮往多模態整合、一杯滿足,而且想省點荷包,Gemini 值得你一試。反正兩家都有各自優勢,身為開發者何不兩邊薅羊毛,把好處都利用起來呢 😎

Gemini API 是免費的嗎?有哪些免費額度?

先說結論:可以,而且 Google 給得不算小氣

他們設計了一個叫「Free Tier」的長期免費機制——不是那種三天試用完就請你刷卡的套路,而是你每天都有穩定的免費配額可以用,只要你沒濫用,它就會一直免費給你用下去。

免費額度怎麼算?

以目前比較熱門的 Gemini 1.5 Flash 來說:

  • 每分鐘最多 15 次請求
  • 每分鐘最多 25 萬個 token(token 就是模型處理資料的單位)
  • 每天最多 500 次請求

如果你用的是 Gemini 2.0 Flash,規格再更高一點,token 上限甚至拉到每分鐘 100 萬個,每天最多 1500 次請求。講白一點:你就算整天坐在那邊一直丟問題給它,它也不會馬上翻臉。

這對大多數插件、小工具、個人用戶來說,根本夠用到溢出來。

token 是什麼?我要怎麼知道我用多少?

一個 token 大概是 4 個英文字符、1 個中文字的單位,簡單說你打一段幾百字的提問,再加上 Gemini 回你一段答案,大約會花掉幾百~幾千個 token。

只要你不是在拿它寫十萬字小說、或每天幫一堆人自動生成報告,平常使用是很難用爆的。Google 給得這麼寬容,真的有點像在默默補助開發者學習費。

而且這些免費額度是 每天會自動刷新 的,沒有什麼「只能用 X 天」的限制,基本上你只要不要手滑過量,它就會乖乖供應你每天用到飽。

🚨 什麼時候會開始收費?

當你開始做出一點規模,例如:

  • 請求量動輒上千、超過每天上限
  • 想要用到速度更快、限制更寬的模型
  • 或者你的 app 每天都有一堆使用者在敲它

那時候你就要考慮升級到付費等級了。Google 有設計幾個 Usage Tier(使用層級),從免費開始,一路往上到 Tier 1、Tier 2、Tier 3,升級條件通常跟你花了多少錢有關——累積達到某個金額+持續付款紀錄,就能進入更高層級,獲得更高的速率、更多資源。

一旦進入付費,每百萬 token 就會開始算錢(輸入+輸出都會計)。但別怕,通常到你願意付錢的那個程度,你的產品也差不多開始賺錢了。

免費額度在哪些國家有?

目前台灣是支援地區之一,所以你可以爽爽用免費額度。

如果你剛好在某些不支援的國家或區域(Google 官方有列),那就比較可惜,可能連免費額度都看不到。但放心,大多數國家都在支援範圍內

Gemini API 有什麼限制?不要一股腦猛刷,小心被擋下來

Gemini API 是免費的嗎?有哪些免費額度?

雖然 Gemini API 功能強大又大方給免費額度,但該有的限制還是有。以下幫你整理幾個容易踩雷的點,早知道早避免:

請求速率限制:不是你想刷幾次就幾次

不管你是免費用戶還是付費等級,用 Gemini 都會被「限速」。簡單說:

  • 免費版大概是每分鐘 15 次請求(RPM),每天最多 500~1500 次請求(RPD),看你用哪個模型
  • 付費升級之後,像 Gemini 1.5 Flash 可以拉高到每分鐘 2000 次,爽度升級
  • 但別得寸進尺,瘋狂刷爆它的話,Google 也會根據你的帳戶信用、使用紀錄來決定給不給你更高的配額

另外,有些模型(像會產圖的 Imagen)還有限制「每分鐘幾張圖」、「每分鐘幾段影片」這種指標,不是每個模型都一樣,要看你用的是哪一款

總之,不要手癢一直狂送 API,Google 雖然不會馬上封鎖你,但 Rate Limit 擋你一下也是常有的事。當它叫你休息,你就去喝杯水冷靜一下。

上下文限制(記憶力):不是所有模型都能一次記100萬字

模型的「記憶容量」也是有上限的,專業一點叫 context window。意思是它一次能處理的總字數有極限。

  • 老版本(Gemini 1.0)大概是 32K tokens
  • 現在的 Gemini 1.5 Flash/Pro 可以到 100 萬、甚至 200 萬 tokens(不過要付費)
  • 免費試用的 1.5 Pro 給你 128K,也比 GPT-4 那種 32K 高了不少

如果你丟的是幾百頁 PDF 或大量對話紀錄,記得選對支援長上下文的模型。不然不是它突然失憶、就是回你錯亂訊息,還會直接給你錯誤訊息說「超過上限囉~」

小提醒:上下文越長,系統運算負擔越高,處理時間越久,計費也會越貴。沒必要就不要一口氣餵它長篇小說,對你對它都好。

回應速度:快慢取決於你怎麼用

  • 想快,就用 Flash 系列。像 Gemini 1.5 Flash,就是為速度優化,回應相對快
  • 想準,就選 Pro。用的是 Mixture-of-Experts(混合專家)架構,智慧一點,但跑得沒那麼飛快

影響速度的還有你丟的內容量。簡單幾百字問答,它幾秒就回你;你要它幫你寫十頁報告,或一次分析五萬字,當然會等久一點。

免費跟付費用戶,在模型反應上理論上沒差太多,差的是併發通道數。免費帳號一次最多只能同時跑 3 條請求線程,如果你要同時大量丟任務,那還是得升級才撐得住。

其他限制:內容審查、模型預覽、政策規則等等

跟 ChatGPT 一樣,Gemini 也有內建的內容安全規則。

  • 遇到違規的 prompt(像是非法用途、敏感主題),它可能直接拒絕回應或請你重寫
  • 有些模型還在「預覽」或「實驗」階段,像 1.5 Pro 剛推出時只開放部分帳號,普通用戶一開始只能先用 2.0 Flash 等模型
  • 有些功能目前也不支援微調或 API 批次處理,要看官方更新

所以在開發前,建議你先花幾分鐘看一下 Google 的官方文件,不要一直靠「試試看」來碰運氣,真的很浪費時間。

🧯 最後提醒(順便嘴一下其他人)

這些限制不是在刁難你,是希望你不要學那些 Reddit 上的悲劇使用者:「我只是想試玩一下,怎麼帳單跳出來幾百美金」 😱 當你還在試驗階段、用免費額度時,請理性使用,設定好配額預警。別傻傻讓外掛暴衝,回過神時 API key 幫你刷了一週的 server 費用。

Gemini 模型這麼多,到底誰適合你?一篇搞懂特色、價格與適用情境

Gemini API 模型特色

Gemini api 收費表

項目類別免費方案 (Free Tier)付費方案 (Paid Tier)
輸入文字/圖片/影片免費每 1,000,000 個 Token 收費 $0.10 美元
語音免費每 1,000,000 個 Token 收費 $0.70 美元
輸出文字/圖片/影片免費每 1,000,000 個 Token 收費 $0.40 美元
語音語音輸入與輸出免費不適用
Context Caching (上下文快取)文字/圖片/影片免費 (最多每小時儲存 1,000,000 個 Token)每 1,000,000 個 Token 收費 $0.025 美元
語音不適用每 1,000,000 個 Token 收費 $0.175 美元
Context Caching 儲存免費每小時每 1,000,000 個 Token 收費 $1.00 美元
圖片生成每張圖片免費每張圖片 (最大 1024x1024px) 約 $0.039 美元
Live API (即時語音/影像互動)輸入 (文字)免費每 1,000,000 個 Token 收費 $0.35 美元
輸入 (語音/圖片/影片)免費每 1,000,000 個 Token 收費 $2.10 美元
Grounding with Google Search (結合 Google 搜尋)請求每日最多 1,500 次請求免費 (超過後每 1,000 次請求收費 $35 美元)不適用 (付費方案中未提及額外收費,應以免費方案的額度為基礎,超過後開始計費)

別被名字搞混了,「Gemini API」不是只有一個模型,而是一整個「模型家族」。就像手機有旗艦機、平價機、入門機,Gemini 也有從高智商超級AI到低成本批次處理的不同選擇。以下幫你介紹目前 Gemini 1.x 世代的主要成員,看你想要速度、精度、還是省錢,有得選。

Gemini 1.0 Pro:耐操又聰明,入門首選

這是很多人第一次用 Gemini 的版本。它強調「均衡」,什麼都能做一點,寫文案、改語句、摘要重點、做分類,幾乎都能勝任。

  • 上下文記憶力:32K tokens(很夠用)
  • 價格:輸入 $0.50 / 輸出 $1.50 每百萬 token,便宜又穩定

👉 適合拿來做內容生成器、聊天機器人、客服助手,想先試水溫、不想一開始就爆預算的話,從這支開始準沒錯。


Gemini 1.0 Ultra:大招限定,高智商的天龍人

這是 1.0 家族的「老大哥」,專門處理高難度任務,例如醫療、法律、複雜邏輯推理、企業級知識系統。聰明但貴。

  • 上下文一樣 32K tokens,但理解力更深
  • 價格未公開,但大約是 Pro 的 3~5 倍(請準備厚實錢包)

👉 不是真的需要它的高智商就先別急著用,除非你真的在處理不能出錯的任務,不然 Pro 就很夠用。


Gemini Nano:模型變小,跑進手機裡的 AI

這是 Google 為行動裝置設計的小模型,名字很可愛但用法不一樣:

  • 跑在本地,不靠雲端,不經 API
  • 有 Nano-1 跟 Nano-2,參數數量很迷你(不到 33 億)

👉 未來你手機裡的 AI 可能就是 Nano,但對開發者來說,它比較像是硬體方案,不是你打 API 就能玩的東西。


Gemini 1.5 Pro:智慧大升級,還多了超長記憶

這隻可以說是現在最強又能商用了:它用了新一代 MoE 架構(混合專家系統),運算效率高,但表現一樣強。

  • 上下文超猛:從 128K 到 200萬 tokens!
  • 價格:輸入 $1.25 / 輸出 $5 每百萬 token

👉 如果你要處理長文件、複雜邏輯、程式碼輔助,**這隻是性能與成本的黃金交界點。**別看它比 Pro 貴,但比 GPT-4 便宜不少。


Gemini 1.5 Flash:有速度、有便宜,批量任務小天才

Flash 這名字就知道是來拼速度的,不追求極致細節,但跑得飛快又不會破產。

  • 上下文記憶也有 100萬 tokens
  • 價格超佛:輸入 $0.075 / 輸出 $0.30 每百萬 token
    (翻譯:便宜到你會懷疑它是不是在做慈善)

👉 非常適合跑即時對話系統、大量生成任務、或低成本部署。想要又快又省?選 Flash,荷包會感謝你。


Gemini 1.5 Flash-8B:迷你平民版,能跑就好

這是 Flash 的小隻版,參數只有 80 億,是目前 Gemini 雲端最小的模型。理解力不高,但也不太吃資源。

  • 上下文記憶還是有 100萬 tokens(驚人)
  • 價格更低到不科學:輸入 $0.0375 / 輸出 $0.15 每百萬 token

👉 如果你只要跑分類、標記、結構化資料處理,不求回答多有深度,它就是最划算的入門量產工具。

小提醒:多模態模型計費也會包含圖片/影音

如果你用的模型支援圖片(像 Flash 和 Pro),圖片也會換算成 token 或另外計價。例如在 Pro 模型中,每張圖大約 $0.039。

小結:怎麼選?

模型特色價格級距適合誰
1.0 Pro穩定萬用、CP 值高一般應用、入門首選
1.0 Ultra超高智商、企業級任務★★★★專案不能出錯的你
1.5 Pro長記憶+高智慧★★★文件分析、邏輯處理
1.5 Flash快速高效、超值首選即時聊天、大量併發
1.5 Flash-8B最低成本、應急夠用🌟 幾乎免費簡單分類、大量實驗
Nano在地裝置小助手(非 API)離線、手機應用開發

結語:拿到鑰匙只是開始,真正有趣的是你會怎麼用

所以說,Gemini API 不只是「能用」,而是「超值得玩」。從你註冊拿到那串 API 金鑰開始,就像打開了一扇通往 AI 實驗室的大門——你可以從小工具開始玩起,也可以一步步打造出屬於你的超強工作流。

你要它幫你寫文、寫程式、看圖、回答問題都沒問題,甚至還能挑模型口味:要快的、有,要聰明的、有,要便宜又能跑批量任務的?也有。加上每天送你一批免費額度,根本就像 Google 在默默幫你養副駕駛。

當然啦,不是每個模型都適合每一個場景,也不是免費就可以為所欲為。但只要你懂得選對工具,調整用法,Gemini 絕對能在你的 AI 工具箱裡佔一席之地,甚至變成主力。

未來它還會不斷進化,你也可以一路跟著升級。現在開始玩,總比等別人玩熟了你才跟進來得精彩。

那你呢?要用 Gemini 幫你跑什麼任務?不如現在就打開 AI Studio,試看看它第一句會回你什麼吧。😏

參考資料

  1. Get started with the Gemini API
    Google 官方的入門教學頁,說明如何申請 API 金鑰、安裝 SDK,以及基本使用範例。
  2. Generative AI pricing on Vertex AI
    Google Cloud 官方價格頁面,列出各版本 Gemini 模型的 token 費率、免費額度與限制說明。
  3. Gemini 1.5 technical report
    Google DeepMind 發布的 1.5 模型技術白皮書,說明上下文長度、模型架構與性能表現。
  4. Overview of models available in Gemini API
    列出目前 API 可用的 Gemini 模型(Pro、Flash、Ultra 等),每個模型的特性與用途。
  5. Comparing Gemini 1.5 Pro with GPT-4
    Google 官方部落格文章,介紹 Gemini 1.5 Pro 的多模態能力,並與 GPT-4 進行基準測試比較。

» 更多推薦:

胡志明市房價》3 分鐘了解越南胡志明房價趨勢與發展!
【廣藿香精油功效全解析】廣藿香精油禁忌與搭配方法

更多精選文章
返回頂端