Google Antigravity 系列一:自主代理人式的整合開發環境
解構軟體開發的新典範:Google Antigravity 自主代理開發平台入門指南
前言
在人工智慧輔助開發(AI-Assisted Development)的領域中,我們曾見證了從單純的語法補全到對話式生成程式碼的演進。然而,2025年底 Google 推出,正式宣告開發環境進入了「代理優先(Agent-first)」的時代。這不僅僅是一個整合開發環境(IDE)的升級,而是一場關於開發主導權的革命:從人類下達每一行指令,轉向由 AI 代理人(Agents)自主規劃與執行任務。
本系列文章的第一篇將帶領讀者深入瞭解這款劃時代工具的本質,並詳細拆解其安裝流程與獨特的雙視角介面,為後續的高階應用打下紮實基礎。
什麼是 Google Antigravity?
Google Antigravity 是一款基於 Visual Studio Code (VS Code) 開源架構進行深度重構的代理化開發平台。雖然其底層結構與開發者熟悉的 IDE 相似,但其核心邏輯已發生根本性變化。
從「助手」到「代理」的跨越
傳統的 AI 編碼助手(如 Cursor 或 GitHub Copilot)主要扮演「副駕駛(Co-pilot)」的角色,它們根據人類的提示詞提供代碼片段,但最終的執行、測試與除錯仍需開發者手動完成。而 Antigravity 則引入了「自主代理(Autonomous Agents)」的概念:
-
自主規劃:代理會根據高階需求(如:實作一個用戶註冊模組)生成結構化的任務計畫 (Tasks)。
-
跨環境操作:代理擁有操作終端機(Terminal)、檔案系統與瀏覽器(Browser Control)的權限。
-
閉環驗證:它能自行啟動伺服器,開啟 Chrome 視窗模擬用戶操作,並根據報錯資訊進行自我修正。
技術架構分析
Antigravity 的強大源於 Google 領先的 AI 模型陣容與雲端生態的深度整合。
核心驅動模型
該平台主要由 Gemini 3 系列模型驅動,包含針對邏輯推理優化的 Gemini 3 Deep Think,以及在快速生成與低延遲表現優異的 Gemini 3 Flash。 此外,為了保持開放性,Antigravity 也支援透過 API 串接如 Anthropic Claude 4.5 或開源的大型語言模型。
關鍵技術支柱
| 技術支柱 | 說明 |
| 可驗證性 (Verifiability) | 代理在完成任務後會產生Artifacts,包含步驟錄影、截圖與差異比對(Diff)。 |
| 非同步協作 (Async Interaction) | 使用者可以在 Agent Manager View 中同時監控多個任務,無需等待單一任務完成。 |
| 環境感知 (Context Awareness) | 代理不僅讀取當前檔案,還能檢索整個專案庫與終端機歷史記錄。 |
Google Antigravity 的安裝與初始化
目前 Google Antigravity 處於公開預覽階段,對於持有個人 Gmail 帳號的使用者提供免費使用。以下是完整的安裝與配置步驟:
第一步:獲取安裝程式
前往Antigravity 官方下載頁面,根據您的作業系統選擇版本:
-
Windows / macOS:下載
.exe或.dmg安裝檔。 -
Linux:提供
.deb與.rpm套件,亦可透過命令行手動配置軟體倉庫。
第二步:身份驗證與授權
啟動程式後,系統會要求進行Google 帳號登入。這是關鍵步驟,因為它將連結您的 Google Cloud 資源與 Gemini 模型權限。
第三步:設定流程 (Setup flow)
可以選擇全新的設定初始化或是從既有的 IDE 工具匯入慣用的設定:
- Start fresh:全新設定
- Import from VS Code:匯入 VS Code 設定
- Import from Cursor:匯入 Cursor 設定
第四步:選擇介面樣式主題 (Theme)
選擇主題:提供 Dark、Tokyo Night、Light、Solarized Light 四種主題。
第五步:設定代理權限 (How do you want to use the Antigravity Agent)
這個步驟中共有三個不同的項目可以設定,以控制代理的自主權限:
-
終端機執行政策 (Terminal Execution policy):這是關於賦予代理程式
(Agent) 在你的終端機中(命令列介面)執行指令(應用程式/工具)的能力。
- Always proceed:始終自動執行終端機指令(除了那些在拒絕清單中的指令)。
- Request review:在執行終端機指令前,要求使用者審核並批准。
-
審核政策 (Review policy)
:當代理程式執行任務時,它會生成各種產出物(Artifact,例如任務計劃、實作計劃等)。審核政策的設定讓你可以決定誰來判斷是否需要審核。你可以選擇一律需要審核,或讓代理程式自行決定,這裡也有以下三種選項。
- Always Proceed:代理程式永遠不會要求審核。
- Agent Decides:代理程式會自行決定何時需要要求審核。
- Request Review:代理程式始終要求審核。
-
JavaScript 執行政策 (JavaScript Execution policy):啟用後,代理程式可以使用瀏覽器工具來開啟
URL、讀取網頁,以及與瀏覽器內容互動。此政策控制 JavaScript
在瀏覽器中的執行方式。
- Always Proceed:代理程式不會停下來要求執行 JavaScript 的許可。這提供代理程式最大程度的自主性,以便在瀏覽器中執行複雜操作與驗證,但同時也有最高的安全漏洞風險。
- Request review:代理程式始終會停下來要求許可,才能在瀏覽器中執行 JavaScript 程式碼。
- Disabled:代理程式永遠不會在瀏覽器中執行 JavaScript 程式碼。
除了一一針對上述項目做設定外,也可以在同一設定頁面的左側,直接點選三個快捷的主題,每個主題會針對上述的項目自動選擇對應的選項。
- 安全模式(Secure Mode):以審核為導向的開發模式,也是建議的選擇。
- 代理導向開發(Agent-Driven Development):降低審核次數,由代理自行決定是否需要人類介入審查。
- 自訂模式(Custom Configuration):由使用者自行根據前述選項依需求個別設定。
介面佈局:Editor vs. Agent Manager
Antigravity 與傳統 IDE 最大的不同在於其「雙介面」設計,開發者可以透過 使用快捷鍵 Ctrl + Shift + M 快速切換。
1. 編輯器視角 (Editor View)
這是開發者最熟悉的空間。它保留了 VS Code 的外觀,包括位於左側的 Activity Bar(及緊鄰於其右側的Side Bar)、位於中央區域的主編輯區、位於右側的聊天機器人對話框以及位於下方的資訊面板(包括Problems, Output, Debug Console, Terminal, Ports),如下圖所示:
在Activity Bar裡包含了Explorer, Code Search, Source Control, Run and Debug, Remote Explorer, Extensions, Testing等,除了使用者可以自行新增、修改、刪除之外,所有在Agent Manager Mode委由代理人執行而新增的檔案,也都能在對應的項目裡查閱。
2. 代理管理器視角 (Agent Manager View)
這是 Antigravity 專為高階任務編排與監控設計的獨立視圖,當你從 Editor View 切換到 Agent Manager View 時,介面會從原始碼編輯轉向「任務管理」,以下是該模式的核心介面摘要:
- 收件匣 (Inbox):你可以將其視為在單一位置追蹤所有對話的方式。當你指派任務給代理人(Agents)後,這些任務會出現在「收件匣」中。點擊收件匣即可取得目前所有對話的清單,點選任何一則對話,則能在中央主要區塊查看完整的往來訊息記錄、任務進度、代理人的產出內容,甚至是代理人是否正在等待你審核批准任務等。這是一個非常便利的功能,方便你日後隨時返回查看先前處理過的任務。
- 開啟新對話 (Start Conversation):點擊此按鈕即可於中央主要區塊開啟新的對話。這會直接帶領你進入標示著「詢問任何事 (Ask anything)」的輸入框。另外可以調整跟對話相關的設定,例如:對話框右上角的下拉式選單中,可以選擇此對話要應用於Playground(類似實驗沙盒)或是指定的工作區(Workspace)。對話框的左下方則可以如一般的聊天對話一般,設定要使用較縝密的規劃模式(Plan)或是快速回應模式(Fast),在其右側的下拉式選單則可以挑選想要使用的大語言模型(編輯此文章之時,有Gemini 3 Pro, Flash, Claude Sonnet 4.5, Opus 4.5, GPT-OSS 120B可供使用)。
- 工作區 (Workspaces):你可以跨任何你想要的工作區進行開發。你可以隨時添加更多工作區,並在開始對話時選擇特定的工作區來執行任務。
- 試驗場 (Playground):這是一個讓你與代理人輕鬆開啟對話的絕佳方式。如果你隨後希望將對話轉換為「工作區」以對檔案進行更嚴格的控管,也可以隨時轉換。你可以將其視為一個「草稿區 (Scratch Area)」。
- 知識 (Knowledge)與瀏覽器 (Browser):代理人在執行你委任的工作時,所產生的知識產物或開啟的網頁都可以在對應的選項中查閱。
結論
Google Antigravity 不僅僅是代碼生成工具的升級,它代表了一種全新的開發典範:開發者從「代碼撰寫者」轉變為「任務策劃者與審核員」。這種轉變雖然降低了編程的入門門檻,但也對開發者的系統架構設計能力與邏輯審查能力提出了更高要求。
在下一篇文章中,我們將透過一個實務案例,演示如何利用 Antigravity 的瀏覽器控制功能,在不手動撰寫任何 CSS/HTML 的情況下,讓代理人自主完成一個響應式網頁的設計與測試。
Comments
Post a Comment