Copilot, ChatGPT, Gemini, Claude LLM 分析報告
四大大型語言模型 (LLM) 免費版本在三大應用場景下的比較分析報告 前言 隨著人工智慧技術的迅速發展,大型語言模型 (Large Language Models, LLMs) 已成為日常生活與工作中不可或缺的工具。Microsoft Copilot、OpenAI ChatGPT、Google Gemini 以及 Anthropic Claude 四大主流 LLM,皆提供免費版本,廣泛應用於旅遊規劃、創意寫作、文件摘要等多種場景。本文旨在以繁體中文,針對上述四款 LLM 的免費版本,在三個常見大眾應用場景下(旅遊規劃查詢、創意寫作、文件摘要與重點整理)進行實際測試與比較,並從正確性與實用性、語言表達、創意深度、回應速度與互動體驗等四大指標,全面分析其表現,最終給出整體評估與最佳模型推薦。 一、測試設計與方法論 1.1 整體比較框架 本研究採用「同場同題」測試法,針對三個應用場景,設計具體且多句的繁體中文提示,確保每個模型在相同條件下接受挑戰。每個場景均以四項指標(正確性與實用性、語言表達、創意深度、回應速度與互動體驗)進行量化與質性評估,並以表格呈現比較結果,後續輔以詳細分析說明。 1.2 免費版本功能與限制 Microsoft Copilot: 免費版整合於 Windows 11、Edge 瀏覽器及 Bing 搜尋,支援繁體中文,無需付費即可使用大部分核心功能,包括旅遊規劃、文件摘要、基礎創意寫作與圖像生成 (DALL-E 3)。 OpenAI ChatGPT: 預設使用 GPT-4o Mini 模型。支援繁體中文,提供不限量的基礎對話。進階模型(如 GPT-4o)每日有動態速率限制。 Google Gemini: 預設使用 Gemini 2.5 Flash 模型。支援繁體中文,日常任務不限次數。更強大的 Gemini 2.5 Pro 模型每日限制使用 5 次。 Anthropic Claude: 提供免費版本(Claude Sonnet 4),標準上下文視窗達 20 萬 tokens,非常適合處理長篇文章。每五小時有訊息數量限制。 ...