如何開始使用 Gemini API:懶人快速開通攻略
✅ 第一步:先拿到你的「魔法鑰匙」——API 金鑰
如何取得 Gemini API?想用 Gemini API,不需要什麼程式背景,基本上就像辦一張會員卡,拿到鑰匙後就能開啟 AI 魔法世界。
流程很簡單:
- 登入 Google 帳號,進入 Google AI Studio。
- 建立一個專案(或選一個舊的也可以)。
- 點選「API 金鑰」→ 產生一串看起來很機密的密碼字串。

這串就是你的 API 金鑰,記得複製下來好好保存。接下來只要在任何支援 Gemini 的外部工具、插件、網站服務裡,貼上這串金鑰,就能叫 Gemini 幫你動腦了。
像 Notion AI 插件、AI 瀏覽器擴充工具、有些寫作/設計平台,都會有個「填入 Gemini API Key」的欄位,只要貼上,就能開啟智慧模式。
🧠 小提醒:
- 這串 API 金鑰就像是你專屬的提款卡密碼,不要貼在公開網站、也不要丟到 GitHub。
- Google 有提供免費額度可以先試用,平常用其實很夠用,不需要馬上刷卡。
- 記得,如果你換了 Google Cloud 專案,API 金鑰也要重新設定一次。
拿到金鑰之後,就可以開始動手寫程式啦。
你可以選擇走簡單路線,直接用 HTTP + cURL 發請求;或是走輕鬆一點的路線,裝官方提供的 SDK,像是:
Python 的 google-generative-ai
Node.js 的 @google/generative-ai
只要把金鑰放對位置(放在 HTTP header 裡,或是 query string 裡的 ?key=你的API金鑰
),Gemini 就會乖乖聽你說話。額外小確幸是,Google Cloud 新用戶有送 300 美元試用金!等於 Google 請你喝咖啡加送開發空間,先玩個幾百次再說!
第三步:來測試看看,Gemini 會不會講笑話?
這裡給你一個最基本的範例,用 cURL 發出一句話,讓 Gemini 說個笑話來聽聽:curl -X POST "https://aiplatform.googleapis.com/v1/models/gemini-1.5-chat:predict?key=YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "instances": [ { "prompt": "講個笑話來聽聽" } ] }'
如果成功的話,回傳回來的會是 JSON 格式,裡面就有 Gemini 幫你想好的笑話。你也可以把 prompt 換成其他問題,像是「幫我寫一段商品文案」或「用台語翻譯這句話」。
用 SDK 的話更輕鬆,像 Node.js 一樣,generateContent()
一行就可以叫出回答,完全是開發者的 AI 點餐神器。
Gemini API 可以做什麼?
Gemini 是 Google 家現在最強的生成式 AI 模型,強到不像話。除了會「看字懂意思」,它還會「看圖猜內容」、「聽音辨場面」,甚至連影片都能理解個大概。你可以把它想成一個有點誇張的 AI 萬事通,只要你開口,它幾乎都能給出一個像樣的答案。
✍️ 幫你寫字寫文案,連道歉信都能代筆
你可以給 Gemini 幾句提示,它就能幫你:
- 寫完一篇還沒結尾的文章
- 生出一個創意小故事
- 幫你總結文件、翻譯段落
- 甚至把你不想打的道歉信、拒絕信,包裝得又誠懇又動人
重點是——它寫的還不錯。根據一些大型語言理解測試(像是 MMLU),它的表現甚至超過人類專家!是不是有點毛骨悚然,但又有點想趕快拿來用看看?
👨💻 懂程式碼,比很多線上課程還有耐心
如果你是寫程式會卡住的人(其實誰不會),Gemini 可以直接幫你看程式碼、解釋它在幹嘛,甚至照你的需求寫一段出來。不管你是寫 Python、Java 還是 Go,它都能搭上話。
你只需要問它:「這段是幹嘛的?我想改成 XXX 要怎麼寫?」
它會秒懂然後給你範例,完全像請到一個不會請假、也不會翻白眼的資深工程師。
🖼 看圖說話不是夢,還能幫你解影片
Gemini 的多模態能力也很強。
你傳一張照片給它,它不只會說「這是一隻貓」,還會說出「這隻貓看起來正在生氣,因為旁邊的杯子打翻了」。
同樣地,給它一段音訊、甚至影片片段,它也能理解裡面發生什麼事——超級適合做:
- 圖片問答聊天機器人
- 看圖寫圖說文的教學應用
- 自動產出影音摘要的影片助手
🤖 拿來做聊天機器人?非常可以,還很會記話
當然,最基本的應用之一就是做成聊天機器人。
跟 Gemini 對話,就像請一個反應快、記性好又不會情緒勒索的 AI 小幫手。你可以拿它來做:
- 客服聊天機器人
- 個人助理式的對話 AI
- 複雜任務的流程引導機器人
它最大的優勢之一是「長記憶」。不像某些 AI 每三句話就忘了你剛剛說什麼,Gemini 可以記得對話脈絡、上下文邏輯,而且不會跳針。
而且 Google 還有推出 Gemini Live 這種能即時語音互動的功能,基本上就是能跟你用講的,像真人聊天一樣。
ChatGPT API 跟 Gemini API 哪個好用?

Gemini API 表格比較
比較項目 | ChatGPT API(OpenAI) | Gemini API(Google) |
模型能力與表現 | GPT-4 對話自然、知識與程式表現穩定,適合日常應用與泛用任務 | Gemini 1.5 Pro 在推理、程式、學術任務上表現強勁,回答更精簡有力 |
多模態能力 | 主要支援文字輸入;需另串接 DALL·E(圖)、Whisper(語音)等工具 | 原生支援文字、圖片、語音,多模態整合在同一 API 裡 |
語言支援與在地化 | 多語言能力強,中文表現佳 | 多語言也很出色,Google 自家搜尋與翻譯優勢讓在地化更貼近使用情境 |
功能彈性與整合 | 支援 Function Calling、外掛,生態成熟,但缺乏原生網路搜尋 | 可直接整合 Google 搜尋;支援「Grounding」,適合深度資訊查詢 |
上下文長度(token) | GPT-4 最大支援 32K token | Gemini 1.5 系列支援上看 100 萬 token,超長文本處理強大 |
開發者體驗 | 註冊簡單,API 文件與社群資源豐富,新手上手快 | 設定略繁瑣(需建 Google Cloud 專案),但提供 AI Studio 工具與代碼產生器 |
價格與免費額度 | 無長期免費額度;GPT-4 每 1K token 約 $0.06(輸出) | 提供每日免費額度;1.5 Pro 每 1K token 約 $0.005,價格具吸引力 |
適合情境 | 想快速打造聊天機器人、處理一般問答、常識性任務 | 需要多模態輸入、長文本處理、與 Google 生態整合的專案開發 |
總結:如果把 ChatGPT API 和 Gemini API 比喻成兩款飲料,一個是經典可樂(穩定好喝,人人熟悉),另一個是新出的綜合果汁(口味豐富,主打多合一)。哪個好喝?要看你的口味和需求!
若你需要強大的對話和豐富的現有範例,ChatGPT 是穩紮穩打的選擇;但如果你嚮往多模態整合、一杯滿足,而且想省點荷包,Gemini 值得你一試。反正兩家都有各自優勢,身為開發者何不兩邊薅羊毛,把好處都利用起來呢 😎
Gemini API 是免費的嗎?有哪些免費額度?
先說結論:可以,而且 Google 給得不算小氣。
他們設計了一個叫「Free Tier」的長期免費機制——不是那種三天試用完就請你刷卡的套路,而是你每天都有穩定的免費配額可以用,只要你沒濫用,它就會一直免費給你用下去。
免費額度怎麼算?
以目前比較熱門的 Gemini 1.5 Flash 來說:
- 每分鐘最多 15 次請求
- 每分鐘最多 25 萬個 token(token 就是模型處理資料的單位)
- 每天最多 500 次請求
如果你用的是 Gemini 2.0 Flash,規格再更高一點,token 上限甚至拉到每分鐘 100 萬個,每天最多 1500 次請求。講白一點:你就算整天坐在那邊一直丟問題給它,它也不會馬上翻臉。
這對大多數插件、小工具、個人用戶來說,根本夠用到溢出來。
token 是什麼?我要怎麼知道我用多少?
一個 token 大概是 4 個英文字符、1 個中文字的單位,簡單說你打一段幾百字的提問,再加上 Gemini 回你一段答案,大約會花掉幾百~幾千個 token。
只要你不是在拿它寫十萬字小說、或每天幫一堆人自動生成報告,平常使用是很難用爆的。Google 給得這麼寬容,真的有點像在默默補助開發者學習費。
而且這些免費額度是 每天會自動刷新 的,沒有什麼「只能用 X 天」的限制,基本上你只要不要手滑過量,它就會乖乖供應你每天用到飽。
🚨 什麼時候會開始收費?
當你開始做出一點規模,例如:
- 請求量動輒上千、超過每天上限
- 想要用到速度更快、限制更寬的模型
- 或者你的 app 每天都有一堆使用者在敲它
那時候你就要考慮升級到付費等級了。Google 有設計幾個 Usage Tier(使用層級),從免費開始,一路往上到 Tier 1、Tier 2、Tier 3,升級條件通常跟你花了多少錢有關——累積達到某個金額+持續付款紀錄,就能進入更高層級,獲得更高的速率、更多資源。
一旦進入付費,每百萬 token 就會開始算錢(輸入+輸出都會計)。但別怕,通常到你願意付錢的那個程度,你的產品也差不多開始賺錢了。
免費額度在哪些國家有?
目前台灣是支援地區之一,所以你可以爽爽用免費額度。
如果你剛好在某些不支援的國家或區域(Google 官方有列),那就比較可惜,可能連免費額度都看不到。但放心,大多數國家都在支援範圍內。
Gemini API 有什麼限制?不要一股腦猛刷,小心被擋下來

雖然 Gemini API 功能強大又大方給免費額度,但該有的限制還是有。以下幫你整理幾個容易踩雷的點,早知道早避免:
請求速率限制:不是你想刷幾次就幾次
不管你是免費用戶還是付費等級,用 Gemini 都會被「限速」。簡單說:
- 免費版大概是每分鐘 15 次請求(RPM),每天最多 500~1500 次請求(RPD),看你用哪個模型
- 付費升級之後,像 Gemini 1.5 Flash 可以拉高到每分鐘 2000 次,爽度升級
- 但別得寸進尺,瘋狂刷爆它的話,Google 也會根據你的帳戶信用、使用紀錄來決定給不給你更高的配額
另外,有些模型(像會產圖的 Imagen)還有限制「每分鐘幾張圖」、「每分鐘幾段影片」這種指標,不是每個模型都一樣,要看你用的是哪一款。
總之,不要手癢一直狂送 API,Google 雖然不會馬上封鎖你,但 Rate Limit 擋你一下也是常有的事。當它叫你休息,你就去喝杯水冷靜一下。
上下文限制(記憶力):不是所有模型都能一次記100萬字
模型的「記憶容量」也是有上限的,專業一點叫 context window。意思是它一次能處理的總字數有極限。
- 老版本(Gemini 1.0)大概是 32K tokens
- 現在的 Gemini 1.5 Flash/Pro 可以到 100 萬、甚至 200 萬 tokens(不過要付費)
- 免費試用的 1.5 Pro 給你 128K,也比 GPT-4 那種 32K 高了不少
如果你丟的是幾百頁 PDF 或大量對話紀錄,記得選對支援長上下文的模型。不然不是它突然失憶、就是回你錯亂訊息,還會直接給你錯誤訊息說「超過上限囉~」
小提醒:上下文越長,系統運算負擔越高,處理時間越久,計費也會越貴。沒必要就不要一口氣餵它長篇小說,對你對它都好。
回應速度:快慢取決於你怎麼用
- 想快,就用 Flash 系列。像 Gemini 1.5 Flash,就是為速度優化,回應相對快
- 想準,就選 Pro。用的是 Mixture-of-Experts(混合專家)架構,智慧一點,但跑得沒那麼飛快
影響速度的還有你丟的內容量。簡單幾百字問答,它幾秒就回你;你要它幫你寫十頁報告,或一次分析五萬字,當然會等久一點。
免費跟付費用戶,在模型反應上理論上沒差太多,差的是併發通道數。免費帳號一次最多只能同時跑 3 條請求線程,如果你要同時大量丟任務,那還是得升級才撐得住。
其他限制:內容審查、模型預覽、政策規則等等
跟 ChatGPT 一樣,Gemini 也有內建的內容安全規則。
- 遇到違規的 prompt(像是非法用途、敏感主題),它可能直接拒絕回應或請你重寫
- 有些模型還在「預覽」或「實驗」階段,像 1.5 Pro 剛推出時只開放部分帳號,普通用戶一開始只能先用 2.0 Flash 等模型
- 有些功能目前也不支援微調或 API 批次處理,要看官方更新
所以在開發前,建議你先花幾分鐘看一下 Google 的官方文件,不要一直靠「試試看」來碰運氣,真的很浪費時間。
🧯 最後提醒(順便嘴一下其他人)
這些限制不是在刁難你,是希望你不要學那些 Reddit 上的悲劇使用者:「我只是想試玩一下,怎麼帳單跳出來幾百美金」 😱 當你還在試驗階段、用免費額度時,請理性使用,設定好配額預警。別傻傻讓外掛暴衝,回過神時 API key 幫你刷了一週的 server 費用。
Gemini 模型這麼多,到底誰適合你?一篇搞懂特色、價格與適用情境

Gemini api 收費表
項目 | 類別 | 免費方案 (Free Tier) | 付費方案 (Paid Tier) |
---|---|---|---|
輸入 | 文字/圖片/影片 | 免費 | 每 1,000,000 個 Token 收費 $0.10 美元 |
語音 | 免費 | 每 1,000,000 個 Token 收費 $0.70 美元 | |
輸出 | 文字/圖片/影片 | 免費 | 每 1,000,000 個 Token 收費 $0.40 美元 |
語音 | 語音輸入與輸出 | 免費 | 不適用 |
Context Caching (上下文快取) | 文字/圖片/影片 | 免費 (最多每小時儲存 1,000,000 個 Token) | 每 1,000,000 個 Token 收費 $0.025 美元 |
語音 | 不適用 | 每 1,000,000 個 Token 收費 $0.175 美元 | |
Context Caching 儲存 | 免費 | 每小時每 1,000,000 個 Token 收費 $1.00 美元 | |
圖片生成 | 每張圖片 | 免費 | 每張圖片 (最大 1024x1024px) 約 $0.039 美元 |
Live API (即時語音/影像互動) | 輸入 (文字) | 免費 | 每 1,000,000 個 Token 收費 $0.35 美元 |
輸入 (語音/圖片/影片) | 免費 | 每 1,000,000 個 Token 收費 $2.10 美元 | |
Grounding with Google Search (結合 Google 搜尋) | 請求 | 每日最多 1,500 次請求免費 (超過後每 1,000 次請求收費 $35 美元) | 不適用 (付費方案中未提及額外收費,應以免費方案的額度為基礎,超過後開始計費) |
別被名字搞混了,「Gemini API」不是只有一個模型,而是一整個「模型家族」。就像手機有旗艦機、平價機、入門機,Gemini 也有從高智商超級AI到低成本批次處理的不同選擇。以下幫你介紹目前 Gemini 1.x 世代的主要成員,看你想要速度、精度、還是省錢,有得選。
Gemini 1.0 Pro:耐操又聰明,入門首選
這是很多人第一次用 Gemini 的版本。它強調「均衡」,什麼都能做一點,寫文案、改語句、摘要重點、做分類,幾乎都能勝任。
- 上下文記憶力:32K tokens(很夠用)
- 價格:輸入 $0.50 / 輸出 $1.50 每百萬 token,便宜又穩定
👉 適合拿來做內容生成器、聊天機器人、客服助手,想先試水溫、不想一開始就爆預算的話,從這支開始準沒錯。
Gemini 1.0 Ultra:大招限定,高智商的天龍人
這是 1.0 家族的「老大哥」,專門處理高難度任務,例如醫療、法律、複雜邏輯推理、企業級知識系統。聰明但貴。
- 上下文一樣 32K tokens,但理解力更深
- 價格未公開,但大約是 Pro 的 3~5 倍(請準備厚實錢包)
👉 不是真的需要它的高智商就先別急著用,除非你真的在處理不能出錯的任務,不然 Pro 就很夠用。
Gemini Nano:模型變小,跑進手機裡的 AI
這是 Google 為行動裝置設計的小模型,名字很可愛但用法不一樣:
- 跑在本地,不靠雲端,不經 API
- 有 Nano-1 跟 Nano-2,參數數量很迷你(不到 33 億)
👉 未來你手機裡的 AI 可能就是 Nano,但對開發者來說,它比較像是硬體方案,不是你打 API 就能玩的東西。
Gemini 1.5 Pro:智慧大升級,還多了超長記憶
這隻可以說是現在最強又能商用了:它用了新一代 MoE 架構(混合專家系統),運算效率高,但表現一樣強。
- 上下文超猛:從 128K 到 200萬 tokens!
- 價格:輸入 $1.25 / 輸出 $5 每百萬 token
👉 如果你要處理長文件、複雜邏輯、程式碼輔助,**這隻是性能與成本的黃金交界點。**別看它比 Pro 貴,但比 GPT-4 便宜不少。
Gemini 1.5 Flash:有速度、有便宜,批量任務小天才
Flash 這名字就知道是來拼速度的,不追求極致細節,但跑得飛快又不會破產。
- 上下文記憶也有 100萬 tokens
- 價格超佛:輸入 $0.075 / 輸出 $0.30 每百萬 token
(翻譯:便宜到你會懷疑它是不是在做慈善)
👉 非常適合跑即時對話系統、大量生成任務、或低成本部署。想要又快又省?選 Flash,荷包會感謝你。
Gemini 1.5 Flash-8B:迷你平民版,能跑就好
這是 Flash 的小隻版,參數只有 80 億,是目前 Gemini 雲端最小的模型。理解力不高,但也不太吃資源。
- 上下文記憶還是有 100萬 tokens(驚人)
- 價格更低到不科學:輸入 $0.0375 / 輸出 $0.15 每百萬 token
👉 如果你只要跑分類、標記、結構化資料處理,不求回答多有深度,它就是最划算的入門量產工具。
小提醒:多模態模型計費也會包含圖片/影音
如果你用的模型支援圖片(像 Flash 和 Pro),圖片也會換算成 token 或另外計價。例如在 Pro 模型中,每張圖大約 $0.039。
小結:怎麼選?
模型 | 特色 | 價格級距 | 適合誰 |
1.0 Pro | 穩定萬用、CP 值高 | ★ | 一般應用、入門首選 |
1.0 Ultra | 超高智商、企業級任務 | ★★★★ | 專案不能出錯的你 |
1.5 Pro | 長記憶+高智慧 | ★★★ | 文件分析、邏輯處理 |
1.5 Flash | 快速高效、超值首選 | ★ | 即時聊天、大量併發 |
1.5 Flash-8B | 最低成本、應急夠用 | 🌟 幾乎免費 | 簡單分類、大量實驗 |
Nano | 在地裝置小助手(非 API) | — | 離線、手機應用開發 |
結語:拿到鑰匙只是開始,真正有趣的是你會怎麼用
所以說,Gemini API 不只是「能用」,而是「超值得玩」。從你註冊拿到那串 API 金鑰開始,就像打開了一扇通往 AI 實驗室的大門——你可以從小工具開始玩起,也可以一步步打造出屬於你的超強工作流。
你要它幫你寫文、寫程式、看圖、回答問題都沒問題,甚至還能挑模型口味:要快的、有,要聰明的、有,要便宜又能跑批量任務的?也有。加上每天送你一批免費額度,根本就像 Google 在默默幫你養副駕駛。
當然啦,不是每個模型都適合每一個場景,也不是免費就可以為所欲為。但只要你懂得選對工具,調整用法,Gemini 絕對能在你的 AI 工具箱裡佔一席之地,甚至變成主力。
未來它還會不斷進化,你也可以一路跟著升級。現在開始玩,總比等別人玩熟了你才跟進來得精彩。
那你呢?要用 Gemini 幫你跑什麼任務?不如現在就打開 AI Studio,試看看它第一句會回你什麼吧。😏
參考資料
- Get started with the Gemini API
Google 官方的入門教學頁,說明如何申請 API 金鑰、安裝 SDK,以及基本使用範例。 - Generative AI pricing on Vertex AI
Google Cloud 官方價格頁面,列出各版本 Gemini 模型的 token 費率、免費額度與限制說明。 - Gemini 1.5 technical report
Google DeepMind 發布的 1.5 模型技術白皮書,說明上下文長度、模型架構與性能表現。 - Overview of models available in Gemini API
列出目前 API 可用的 Gemini 模型(Pro、Flash、Ultra 等),每個模型的特性與用途。 - Comparing Gemini 1.5 Pro with GPT-4
Google 官方部落格文章,介紹 Gemini 1.5 Pro 的多模態能力,並與 GPT-4 進行基準測試比較。