Alliance DAO 研究员:深入浅出近期 AI 领域火热的 MCP 概念
编译:深潮TechFlow
导读
昨日,Solana 上的 AI相关代币 $Dark 上线 Binance Alpha,截止目前市值已经来到4000万美元左右。
在最新的加密 AI 叙事中,$Dark 与“MCP”(模型上下文协议)密切相关,而这也是近期谷歌等 Web2 科技公司正在关注和探索的领域。
但在目前,能够清晰讲清楚MCP这个概念和叙事影响的文章并不多。
下文是 Alliance DAO 研究员 Mohamed ElSeidy 的一篇关于 MCP 协议深入浅出的文章,以非常通俗的语言讲述了 MCP 的原理和定位,或许对我们快速了解最新的叙事有所帮助。
深潮 TechFlow 对全文进行了编译。
在我于Alliance的这些年里,我见证了无数创始人构建了他们自己的专用工具和数据集成,这些都被嵌入到他们的AI代理和工作流程中。然而,这些算法、形式化和独特的数据集被锁在定制的集成背后,极少有人会使用。
随着模型上下文协议(Model Context Protocol, MCP)的出现,这种情况正在迅速改变。MCP被定义为一种开放协议,它标准化了应用程序如何与大型语言模型(LLM)进行通信并提供上下文。我非常喜欢的一个比喻是:“对于AI应用程序来说,MCP就像硬件中的USB-C”;它是标准化的、即插即用的、多功能的,并且具有变革性。
为什么选择MCP?
大型语言模型(如Claude、OpenAI、LLAMA等)非常强大,但它们受限于当前可以访问的信息。这意味着它们通常存在知识截止点,不能独立浏览网络,也无法直接访问你的个人文件或专用工具,除非进行某种形式的集成。
特别是,在此之前,开发者在将LLM连接到外部数据和工具时面临三个主要挑战:
-
集成复杂性:为每个平台(如Claude、ChatGPT等)构建单独的集成需要重复努力并维护多个代码库。
-
工具碎片化:每种工具功能(例如,文件访问、API连接等)都需要自己的专用集成代码和权限模型。
-
分发受限:专用工具被限制在特定平台,限制了它们的覆盖面和影响力。
MCP通过提供一种标准化的方法,使任何LLM都能通过通用协议安全地访问外部工具和数据源,从而解决了这些问题。现在我们了解了MCP的作用,让我们看看人们正在用它构建什么。
人们正在用MCP构建什么?
MCP生态系统目前正处于创新爆发期。以下是我在Twitter上发现的一些开发者展示其作品的最新示例:
-
AI驱动的故事板:一种MCP集成,使Claude能够控制ChatGPT-4o,自动生成吉卜力风格的完整故事板,无需任何人工干预。
-
ElevenLabs语音集成:一个MCP服务器,通过简单的文本提示,让Claude和Cursor访问整个AI音频平台。该集成强大到足以创建可以进行外拨电话的语音代理。这展示了MCP如何将当前AI工具扩展到音频领域。
-
使用Playwright进行浏览器自动化:一个MCP服务器,使AI代理能够控制网页浏览器,而无需截图或视觉模型。这通过标准化方式使LLM直接控制浏览器交互,创造了网页自动化的新可能性。
-
个人WhatsApp集成:一个连接个人WhatsApp账户的服务器,使Claude能够搜索消息和联系人,并发送新消息。
-
Airbnb搜索工具:一个Airbnb公寓搜索工具,展示了MCP的简便性和创建与网络服务交互的实用应用的能力。
-
机器人控制系统:一个用于机器人的MCP控制器。该示例弥合了LLM与物理硬件之间的差距,展示了MCP在物联网应用和机器人领域的潜力。
-
Google Maps和本地搜索:将Claude连接到Google Maps数据,创建一个可以查找和推荐本地企业(如咖啡店)的系统。这一扩展使AI助手能够提供基于位置的服务。
-
区块链集成:Lyra MCP项目将MCP功能带到StoryProtocol和其他web3平台。这允许与区块链数据和智能合约进行交互,为通过AI增强的去中心化应用打开了新的可能性。
这些示例尤其引人注目之处在于其多样性。自MCP推出以来的短短时间内,开发者已经创建了涵盖创意媒体制作、通信平台、硬件控制、位置服务和区块链技术的集成。这些各种不同的应用遵循同一标准化协议,展示了MCP的多功能性及其成为AI工具集成通用标准的潜力。
如果想要查看全面的MCP服务器集合,可以访问GitHub上的官方MCP服务器库。在使用任何MCP服务器之前,请仔细阅读免责声明,并谨慎对待运行和授权的内容。
承诺与炒作
面对任何新技术,值得问的是:MCP是否真正具有变革性,还是仅仅是另一个过度炒作、最终会消退的工具?
在观察过众多初创企业后,我相信MCP代表了AI发展的一次真正的转折点。与许多承诺革命但仅带来渐进变化的趋势不同,MCP是一种生产力提升,解决了阻碍整个生态系统发展的基础设施问题。
它的特别之处在于,它并不试图替代现有的AI模型或与之竞争,而是通过将它们连接到所需的外部工具和数据,使它们更加有用。
尽管如此,关于安全性和标准化的合理担忧仍然存在。正如任何协议在初期阶段一样,随着社区在审计、权限、认证和服务器验证方面摸索最佳实践,我们可能会看到成长的烦恼。开发者需要信任这些MCP服务器的功能,不能盲目信任它们,尤其是在它们变得丰富时。本文讨论了一些因盲目使用未经仔细审查的MCP服务器而暴露的最近漏洞,即使是在本地运行时。
AI的未来在于情境化
最强大的AI应用将不再是独立的模型,而是通过像MCP这样的标准化协议连接起来的专业能力生态系统。对于初创公司来说,MCP代表了一个构建适合这些不断增长的生态系统的专业组件的机会。这是一个利用您独特知识和能力的机会,同时从基础模型的大量投资中获益。
展望未来,我们可以预期MCP将成为AI基础设施的基本组成部分,就像HTTP之于网络一样。随着协议的成熟和采用的增长,我们很可能会看到专门的MCP服务器市场的出现,使AI系统能够利用几乎任何想象得到的能力或数据源。
您的初创公司是否尝试过实施MCP?我很想在评论中听到您的经验。如果您在这个领域构建了有趣的东西,请通过@alliancedao与我们联系并申请。
附录
对于那些有兴趣了解MCP实际工作原理的人,以下附录提供了其架构、工作流程和实施的技术细分。
MCP的幕后
类似于HTTP标准化了网络访问外部数据源和信息的方式,MCP为AI框架做到了这一点,创造了一种通用语言,使不同的AI系统能够无缝沟通。让我们来探索它是如何做到的。
MCP架构和流程
主要架构遵循客户端-服务器模型,由四个关键组件协同工作:
-
MCP主机:包括桌面AI应用如Claude或ChatGPT,IDE如cursorAI或VSCode,或其他需要访问外部数据和功能的AI工具。
-
MCP客户端:嵌入在主机中的协议处理器,维护与MCP服务器的一对一连接。
-
MCP服务器:通过标准化协议暴露特定功能的轻量级程序。
-
数据源:包括文件、数据库、API和服务,MCP服务器可以安全访问这些数据。
现在我们已经讨论了这些组件,来看一下它们在典型工作流程中的交互:
-
用户交互:用户在MCP主机(例如Claude Desktop)中提问或发出请求。
-
LLM分析:LLM分析请求并确定需要外部信息或工具来提供完整的响应。
-
工具发现:MCP客户端查询连接的MCP服务器以发现可用的工具。
-
工具选择:LLM根据请求和可用功能决定使用哪些工具。
-
权限请求:主机向用户请求执行所选工具的权限,以确保透明性和安全性。
-
工具执行:在获得批准后,MCP客户端将请求发送到适当的MCP服务器,服务器利用其对数据源的专业访问来执行操作。
-
结果处理:服务器将结果返回给客户端,客户端将其格式化以供LLM使用。
-
响应生成:LLM将外部信息整合成全面的响应。
-
用户展示:最终,响应呈现给终端用户。
这种架构的强大之处在于,每个MCP服务器专注于特定领域,但使用标准化的通信协议。这样,开发者无需为每个平台重建集成,只需一次性开发工具即可服务于整个AI生态系统。
如何构建您的第一个MCP服务器
现在让我们看看如何使用MCP SDK在几行代码中实现一个简单的MCP服务器。
在这个简单的例子中,我们希望扩展Claude Desktop的能力,让它能够回答诸如“中央公园附近有哪些咖啡店?”这样的问题,信息来源于谷歌地图。您可以轻松扩展此功能以获取评论或评分。但现在,我们专注于MCP工具find_nearby_places,它将允许Claude直接从谷歌地图获取这些信息,并以对话的方式呈现结果。
正如您所见,代码非常简单。首先,它将查询转换为谷歌地图API搜索,然后返回结构化格式的顶级结果。这样,信息被传递回LLM以便进一步决策。
现在我们需要让Claude Desktop知道这个工具,因此我们在其配置文件中注册它,如下所示:
macOS路径:
~/Library/Application Support/Claude/claude_desktop_config.json
Windows路径:
%APPDATA%\Claude\claude_desktop_config.json
就这样,你完成了!现在你已经成功扩展了Claude的功能,可以实时从谷歌地图中查找位置。
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
你也可能喜欢
教皇葬礼将“暗流涌动”?泽连斯基:希望顺便和特朗普聊聊
梵蒂冈的一份声明显示,美乌两国领导人可能将坐在仪式的前排或靠近前排的位置,彼此相邻,二者会擦出何种火花?
加密货币价格
更多








