Google Antigravity 系列一:自主代理人式的整合開發環境

解構軟體開發的新典範:Google Antigravity 自主代理開發平台入門指南

前言

在人工智慧輔助開發(AI-Assisted Development)的領域中,我們曾見證了從單純的語法補全到對話式生成程式碼的演進。然而,2025年底 Google 推出,正式宣告開發環境進入了「代理優先(Agent-first)」的時代。這不僅僅是一個整合開發環境(IDE)的升級,而是一場關於開發主導權的革命:從人類下達每一行指令,轉向由 AI 代理人(Agents)自主規劃與執行任務。

本系列文章的第一篇將帶領讀者深入瞭解這款劃時代工具的本質,並詳細拆解其安裝流程與獨特的雙視角介面,為後續的高階應用打下紮實基礎。


什麼是 Google Antigravity?

Google Antigravity 是一款基於 Visual Studio Code (VS Code) 開源架構進行深度重構的代理化開發平台。雖然其底層結構與開發者熟悉的 IDE 相似,但其核心邏輯已發生根本性變化。

從「助手」到「代理」的跨越

傳統的 AI 編碼助手(如 Cursor 或 GitHub Copilot)主要扮演「副駕駛(Co-pilot)」的角色,它們根據人類的提示詞提供代碼片段,但最終的執行、測試與除錯仍需開發者手動完成。而 Antigravity 則引入了「自主代理(Autonomous Agents)」的概念:

  1. 自主規劃:代理會根據高階需求(如:實作一個用戶註冊模組)生成結構化的任務計畫 (Tasks)。

  2. 跨環境操作:代理擁有操作終端機(Terminal)、檔案系統與瀏覽器(Browser Control)的權限。

  3. 閉環驗證:它能自行啟動伺服器,開啟 Chrome 視窗模擬用戶操作,並根據報錯資訊進行自我修正。


技術架構分析

Antigravity 的強大源於 Google 領先的 AI 模型陣容與雲端生態的深度整合。

核心驅動模型

該平台主要由 Gemini 3 系列模型驅動,包含針對邏輯推理優化的 Gemini 3 Deep Think,以及在快速生成與低延遲表現優異的 Gemini 3 Flash。 此外,為了保持開放性,Antigravity 也支援透過 API 串接如 Anthropic Claude 4.5 或開源的大型語言模型。

關鍵技術支柱

技術支柱 說明
可驗證性 (Verifiability) 代理在完成任務後會產生Artifacts,包含步驟錄影、截圖與差異比對(Diff)。
非同步協作 (Async Interaction) 使用者可以在 Agent Manager View 中同時監控多個任務,無需等待單一任務完成。
環境感知 (Context Awareness) 代理不僅讀取當前檔案,還能檢索整個專案庫與終端機歷史記錄。

Google Antigravity 的安裝與初始化

目前 Google Antigravity 處於公開預覽階段,對於持有個人 Gmail 帳號的使用者提供免費使用。以下是完整的安裝與配置步驟:

第一步:獲取安裝程式

前往Antigravity 官方下載頁面,根據您的作業系統選擇版本:

  • Windows / macOS:下載 .exe.dmg 安裝檔。
  • Linux:提供 .deb.rpm 套件,亦可透過命令行手動配置軟體倉庫。

第二步:身份驗證與授權

啟動程式後,系統會要求進行Google 帳號登入。這是關鍵步驟,因為它將連結您的 Google Cloud 資源與 Gemini 模型權限。

第三步:設定流程 (Setup flow)

可以選擇全新的設定初始化或是從既有的 IDE 工具匯入慣用的設定:

  • Start fresh:全新設定
  • Import from VS Code:匯入 VS Code 設定
  • Import from Cursor:匯入 Cursor 設定

第四步:選擇介面樣式主題 (Theme)

選擇主題:提供 Dark、Tokyo Night、Light、Solarized Light 四種主題。

第五步:設定代理權限 (How do you want to use the Antigravity Agent)

這個步驟中共有三個不同的項目可以設定,以控制代理的自主權限:

  • 終端機執行政策 (Terminal Execution policy):這是關於賦予代理程式 (Agent) 在你的終端機中(命令列介面)執行指令(應用程式/工具)的能力。
    • Always proceed:始終自動執行終端機指令(除了那些在拒絕清單中的指令)。
    • Request review:在執行終端機指令前,要求使用者審核並批准。
  • 審核政策 (Review policy) :當代理程式執行任務時,它會生成各種產出物(Artifact,例如任務計劃、實作計劃等)。審核政策的設定讓你可以決定誰來判斷是否需要審核。你可以選擇一律需要審核,或讓代理程式自行決定,這裡也有以下三種選項。
    • Always Proceed:代理程式永遠不會要求審核。
    • Agent Decides:代理程式會自行決定何時需要要求審核。
    • Request Review:代理程式始終要求審核。
  • JavaScript 執行政策 (JavaScript Execution policy):啟用後,代理程式可以使用瀏覽器工具來開啟 URL、讀取網頁,以及與瀏覽器內容互動。此政策控制 JavaScript 在瀏覽器中的執行方式。
    • Always Proceed:代理程式不會停下來要求執行 JavaScript 的許可。這提供代理程式最大程度的自主性,以便在瀏覽器中執行複雜操作與驗證,但同時也有最高的安全漏洞風險。
    • Request review:代理程式始終會停下來要求許可,才能在瀏覽器中執行 JavaScript 程式碼。
    • Disabled:代理程式永遠不會在瀏覽器中執行 JavaScript 程式碼。

除了一一針對上述項目做設定外,也可以在同一設定頁面的左側,直接點選三個快捷的主題,每個主題會針對上述的項目自動選擇對應的選項。

  • 安全模式(Secure Mode):以審核為導向的開發模式,也是建議的選擇。
  • 代理導向開發(Agent-Driven Development):降低審核次數,由代理自行決定是否需要人類介入審查。
  • 自訂模式(Custom Configuration):由使用者自行根據前述選項依需求個別設定。

介面佈局:Editor vs. Agent Manager

Antigravity 與傳統 IDE 最大的不同在於其「雙介面」設計,開發者可以透過 使用快捷鍵 Ctrl + Shift + M 快速切換。

1. 編輯器視角 (Editor View)

這是開發者最熟悉的空間。它保留了 VS Code 的外觀,包括位於左側的 Activity Bar(及緊鄰於其右側的Side Bar)、位於中央區域的主編輯區、位於右側的聊天機器人對話框以及位於下方的資訊面板(包括Problems, Output, Debug Console, Terminal, Ports),如下圖所示:

在Activity Bar裡包含了Explorer, Code Search, Source Control, Run and Debug, Remote Explorer, Extensions, Testing等,除了使用者可以自行新增、修改、刪除之外,所有在Agent Manager Mode委由代理人執行而新增的檔案,也都能在對應的項目裡查閱。

2. 代理管理器視角 (Agent Manager View)

這是 Antigravity 專為高階任務編排與監控設計的獨立視圖,當你從 Editor View 切換到 Agent Manager View 時,介面會從原始碼編輯轉向「任務管理」,以下是該模式的核心介面摘要:


  • 收件匣 (Inbox):你可以將其視為在單一位置追蹤所有對話的方式。當你指派任務給代理人(Agents)後,這些任務會出現在「收件匣」中。點擊收件匣即可取得目前所有對話的清單,點選任何一則對話,則能在中央主要區塊查看完整的往來訊息記錄、任務進度、代理人的產出內容,甚至是代理人是否正在等待你審核批准任務等。這是一個非常便利的功能,方便你日後隨時返回查看先前處理過的任務。
  • 開啟新對話 (Start Conversation):點擊此按鈕即可於中央主要區塊開啟新的對話。這會直接帶領你進入標示著「詢問任何事 (Ask anything)」的輸入框。另外可以調整跟對話相關的設定,例如:對話框右上角的下拉式選單中,可以選擇此對話要應用於Playground(類似實驗沙盒)或是指定的工作區(Workspace)。對話框的左下方則可以如一般的聊天對話一般,設定要使用較縝密的規劃模式(Plan)或是快速回應模式(Fast),在其右側的下拉式選單則可以挑選想要使用的大語言模型(編輯此文章之時,有Gemini 3 Pro, Flash, Claude Sonnet 4.5, Opus 4.5, GPT-OSS 120B可供使用)。
  • 工作區 (Workspaces):你可以跨任何你想要的工作區進行開發。你可以隨時添加更多工作區,並在開始對話時選擇特定的工作區來執行任務。
  • 試驗場 (Playground):這是一個讓你與代理人輕鬆開啟對話的絕佳方式。如果你隨後希望將對話轉換為「工作區」以對檔案進行更嚴格的控管,也可以隨時轉換。你可以將其視為一個「草稿區 (Scratch Area)」。
  • 知識 (Knowledge)與瀏覽器 (Browser):代理人在執行你委任的工作時,所產生的知識產物或開啟的網頁都可以在對應的選項中查閱。

結論

Google Antigravity 不僅僅是代碼生成工具的升級,它代表了一種全新的開發典範:開發者從「代碼撰寫者」轉變為「任務策劃者與審核員」。這種轉變雖然降低了編程的入門門檻,但也對開發者的系統架構設計能力與邏輯審查能力提出了更高要求。

在下一篇文章中,我們將透過一個實務案例,演示如何利用 Antigravity 的瀏覽器控制功能,在不手動撰寫任何 CSS/HTML 的情況下,讓代理人自主完成一個響應式網頁的設計與測試。


參考資料

Comments

Popular posts from this blog

Project Aura:Google 與 XREAL 的智慧眼鏡戰略

Google 2025 全方位 AI 手冊:40 項改變工作與生活的核心技巧