手机厂商为什么不做MCP
Table of Contents
一年多前,正是ChatGPT刚爆发那会,和朋友聊天,聊到在应用层面有什么比较好的机会。
我思考了一会,觉得最大的机会是手机厂商推出一套协议,应用定义好自己可以提供的服务,通过大模型串联起用户的意图,自动调用各个应用完成用户的任务。
我当时觉得这几乎是手机厂商下一步必然要走的战略,可一年多过去了,居然还一点动静都没有,对此我是相当不解。首先,对于应用开发者来说,这个成本是很低的,只需要定义一个配置文件就行了。其次,从技术角度来看,几乎没有任何难度,手机厂商拥有系统级的权限,执行一系列自动化操作毫无难度。我是不相信没有人想到这个的,我还没自大到认为自己已经拥有超越精英的眼光。
正好昨天看到一篇关于MCP的文章,又让我对这个事情好奇了起来,于是决定再好好地思考一下。先简单复习一下MCP的基本概念吧。
Anthropic推出的MCP(Model Context Protocol)协议,它是一种让LLM应用程序与外部数据源和工具无缝对接的开放式协议。下面从本质定位、技术特点对比、核心挑战、创新价值、发展前景以及技术实现要点等方面对MCP进行了详细阐述。
- MCP本质定位
- MCP是大模型调用外部服务的一种方式,类似于Function Calling,旨在扩展大模型能力,通过对接外部服务和数据来增强回答能力,目前仍在发展阶段,影响力尚未达到“变革性”水平。
- 技术特点对比
- 调用方式:MCP采用RPC请求,Function Calling采用HTTP API请求。
- 接入复杂度:MCP需实现RPC服务,配置较复杂;Function Calling只需写API接口,配置简单。
- 核心挑战
- 最大难点在于大模型的意图识别,需要解决用户随机提问如何匹配到合适外部服务的问题,目前采用用户配置文件方式,由Claude自动识别调用。
- MCP的创新价值
- 定义了标准且完善的协议规范,对大模型生态协同具有重要指导意义,类似于VS Code的LSP协议在编程领域的地位。
- 发展前景分析
- 能否成为行业标准取决于第三方服务的接入数量和主流大模型/应用的支持程度。目前仅支持桌面版Claude,不支持网页版,但应用场景丰富,未来发展潜力大。
- 技术实现要点
- 服务端(MCP Server):通过描述信息定义服务能力,设置请求处理逻辑,启动本地监听服务。
- 客户端接入:提供配置界面,进行服务发现与能力获取、意图识别与服务调用,以及RAG处理。
和我的设想作为类比,客户端就相当于手机厂商开发的入口App,比如“Siri”,它用来接收用户的输入,然后进行意图识别,再调用支持“MCP协议”的App服务。服务端就是各个实现“MCP协议”的App,他们用来提供大模型调用的服务,可以是执行一个网络请求,也可以是打开一个页面,或者是给一个视频点赞。
为什么不是手机厂商推出“MCP”?
- 成本可能是最大的原因,端侧的算力还不够,如果全都用云端,真正运行起来将是一笔巨大的成本,而这个成本短时间无法从用户身上收回。
- 意图识别可能比想象中更难,因为在实际使用中,用户的输入是无法预测的,要想完全覆盖各种各样的输入范式,可能需要非常庞大的工作量。
- 安全问题,如果每次执行服务都需要用户手动确认,那整个流程就会很别扭,但是如果不让用户确认,用户可能会感觉不安全。
- 隐私问题,为了服务执行的准确性,大模型必然会读取大量的用户数据,这可能无法通过国内的隐私政策。
路漫漫其修远兮。虽然困难重重,但是这个目标我觉得不会错,希望能早点看到这一天的到来,到时候我也能吹吹牛逼,这是我n年前的想法,这肯定是抄袭了我的idea。
在前文[[20250113-什么是内网穿透]]里提到可以通过ipv6进行远程访问实现内网穿透,明天再详细了解一下ipv6