4-1 透过回顾 AI 代理谈 MCP
2025年5月12日
在这个章节中,我们将与大家探讨目前 AI 社群中最热门的话题之一:MCP (Model Context Protocol)。我们会先介绍 MCP 是什么、为什么需要 MCP,以及在实际使用 Cursor 时,如何透过整合不同的 MCP 伺服器来大幅提升执行不同任务的效率与生产力。
在章节的第一单元,我们会先花一些时间回顾 AI 代理,因为要理解 MCP 的存在价值,必须先从 AI 代理谈起。透过 AI 代理的视角,我们才能更清楚地理解 MCP 的优势。
什么是 AI 代理?
我们在前几章节中已经提到,AI 代理是指在不需要人类介入的情况下,根据指定的目标自主完成相关任务。当你设定一个目标后,AI 代理会根据该目标进行规划、推理,列出达成目标所需的各项任务,并逐一完成。完成后,AI 代理会检查是否已达成目标,若尚未达成,则在过程中进行调整,直到目标实现为止。
我们在前几章节中曾展示过一个例子:假设今天的目标是完成某个函式 (function)。AI 代理会根据这个目标,第一步扫描整个程式码库,理解程式码库的风格;接着根据该风格及函式的需求,实作函式的程式码;然后根据函式需求,撰写相关的单元测试 (unit test) 程式码;再使用刚完成的函式执行测试。如果测试过程中出现错误或未通过的测试,AI 代理会回头修正错误或修改函式,直到所有测试都通过为止。
在这个过程中,唯一需要人类介入的部分是最初输入「完成该函式」的目标,其余皆由 Cursor 的 AI 代理自动完成,包括执行任务、修正错误,直到目标达成。
当然,完成任务 (例如函式) 后,身为工程师仍需扮演检查的角色。然而,与过去使用自动补全或 AI 聊天模式相比,AI 代理让我们需要做的事情更少,效率更高,生产力也更强。
从技术角度理解 AI 代理
若从技术角度高层次地看待 AI 代理,我们推荐参考 Google 之前发表的 AI 代理白皮书。该白皮书中提供了一个简易的架构图,显示 AI 代理的执行环境包含几个重要元素:统筹层 (orchestration layer)、模型 (model) 及工具 (tools) 这三大核心要件。
在统筹层中,又包含记忆功能、推理功能等不同面向。将这个架构对应到 Cursor 的脉络,我们可以这样理解:
- 模型:指的是我们熟知的各种 AI 模型,例如大型语言模型 (LLM),包括 GPT 模型、Claude 模型,或 Google 推出的 Gemini 模型。
- 统筹层:在使用 Cursor 时,Cursor 主要扮演统筹层的角色。虽然 Cursor 有自己的模型,但大多数使用者仍会透过 Cursor 对接其他模型 (如上述的 GPT、Claude 等)。因此,Cursor 在这里主要负责处理记忆、推理与任务规划等功能。
工具的重要性
在 AI 代理的执行环境中,还有另一个核心元件——工具。然而,在前几章节中,我们没有特别强调工具在 Cursor 中的角色。
相信你可能会问:这里提到的「工具」究竟是什么?当我们实际对接到不同工具时,又能带来什么样的效果?以下透过几个具体例子来说明。
对接专案管理工具 (如 Linear 或 Jira)
假设 AI 代理能对接到 Linear 或 Jira 这类专案管理工具,AI 代理就能直接从这些平台抓取某个任务(task) 的资讯,并根据该资讯确认需求。比起在 Cursor 的对话框中手动输入需求,若能直接透过任务连结或任务编号提供资讯,Cursor 即可自动抓取相关需求内容,大幅节省时间。
对接浏览器操作工具 (如 Playwright)
假设完成一个全端 (full-stack) 功能后,我们希望 Cursor 帮忙执行 E2E 测试并撰写相关测试程式码。然而,Cursor 本身并没有操作浏览器的功能,所以只靠 Cursor 是做不到的。不过,若能对接到像 Playwright 这样的工具,Cursor 就能透过与浏览器的互动,实际完成 E2E 测试。
对接 GitHub 以自动化 PR 流程
我们在第三章提到,Cursor 可根据 Git 提交纪录自动撰写 PR (Pull Request) 描述,但最终仍需工程师手动将描述复制贴上到 GitHub 或 GitLab 等平台以提交 PR。若能将 GitHub 对接到 Cursor,则在撰写完 PR 描述后,Cursor 可以直接在 GitHub 上发 PR,省去手动操作的步骤,从而进一步提升效率。
透过这三个例子,希望大家能感受到,虽然 Cursor 在撰写设计文件、程式码或 PR 描述方面已提供很多帮助,但若想进一步拓展 AI 代理的能力,必须对接到我们日常工作中常用的工具。然而,Cursor 本身并未内建这些工具,因此需要一个方法让 Cursor 能与这些工具整合。
MCP 的角色
让 Cursor 对接到不同工具,正是这个章节要介绍的主题——MCP(Model Context Protocol)。MCP 的设计目的在于让 Cursor 或其他 AI 应用程式能以标准化方式对接到不同工具。MCP 全名为「Model Context Protocol」,目前已被视为业界统一的标准协定。
MCP 最早由 Antrhopic 于 2024 年底提出,至 2025 年初,连主要竞争对手 OpenAI、Google 也加入支援 MCP 协定。因此,现今谈到让 AI 应用程式对接工具时,MCP 是业界首要提及的标准。
在下一单元中,我们将详细介绍 MCP 的具体内容,以及如何透过不同的 MCP 伺服器让 Cursor 对接到各种工具,进而提升工作效率与生产力。
此系列文章为 《给工程师的 Cursor 工作流 — 透过 AI 代理全方位提升开发生产力》 搭配的教材。希望透过这系列文章,将过去协助导入 AI 工具及使用 Cursor 的经验扩展并分享给想提升生产力的读者。如果对课程感兴趣的读者,可以加入 E+ 成长计划,观看影片学习。