手机厂商为什么不做MCP

Table of Contents

一年多前，正是ChatGPT刚爆发那会，和朋友聊天，聊到在应用层面有什么比较好的机会。

我思考了一会，觉得最大的机会是手机厂商推出一套协议，应用定义好自己可以提供的服务，通过大模型串联起用户的意图，自动调用各个应用完成用户的任务。

我当时觉得这几乎是手机厂商下一步必然要走的战略，可一年多过去了，居然还一点动静都没有，对此我是相当不解。首先，对于应用开发者来说，这个成本是很低的，只需要定义一个配置文件就行了。其次，从技术角度来看，几乎没有任何难度，手机厂商拥有系统级的权限，执行一系列自动化操作毫无难度。我是不相信没有人想到这个的，我还没自大到认为自己已经拥有超越精英的眼光。

正好昨天看到一篇关于MCP的文章，又让我对这个事情好奇了起来，于是决定再好好地思考一下。先简单复习一下MCP的基本概念吧。

Anthropic推出的MCP（Model Context Protocol）协议，它是一种让LLM应用程序与外部数据源和工具无缝对接的开放式协议。下面从本质定位、技术特点对比、核心挑战、创新价值、发展前景以及技术实现要点等方面对MCP进行了详细阐述。

MCP本质定位
- MCP是大模型调用外部服务的一种方式，类似于Function Calling，旨在扩展大模型能力，通过对接外部服务和数据来增强回答能力，目前仍在发展阶段，影响力尚未达到“变革性”水平。
技术特点对比
- 调用方式：MCP采用RPC请求，Function Calling采用HTTP API请求。
- 接入复杂度：MCP需实现RPC服务，配置较复杂；Function Calling只需写API接口，配置简单。
核心挑战
- 最大难点在于大模型的意图识别，需要解决用户随机提问如何匹配到合适外部服务的问题，目前采用用户配置文件方式，由Claude自动识别调用。
MCP的创新价值
- 定义了标准且完善的协议规范，对大模型生态协同具有重要指导意义，类似于VS Code的LSP协议在编程领域的地位。
发展前景分析
- 能否成为行业标准取决于第三方服务的接入数量和主流大模型/应用的支持程度。目前仅支持桌面版Claude，不支持网页版，但应用场景丰富，未来发展潜力大。
技术实现要点
- 服务端（MCP Server）：通过描述信息定义服务能力，设置请求处理逻辑，启动本地监听服务。
- 客户端接入：提供配置界面，进行服务发现与能力获取、意图识别与服务调用，以及RAG处理。

和我的设想作为类比，客户端就相当于手机厂商开发的入口App，比如“Siri”，它用来接收用户的输入，然后进行意图识别，再调用支持“MCP协议”的App服务。服务端就是各个实现“MCP协议”的App，他们用来提供大模型调用的服务，可以是执行一个网络请求，也可以是打开一个页面，或者是给一个视频点赞。

为什么不是手机厂商推出“MCP”？

成本可能是最大的原因，端侧的算力还不够，如果全都用云端，真正运行起来将是一笔巨大的成本，而这个成本短时间无法从用户身上收回。
意图识别可能比想象中更难，因为在实际使用中，用户的输入是无法预测的，要想完全覆盖各种各样的输入范式，可能需要非常庞大的工作量。
安全问题，如果每次执行服务都需要用户手动确认，那整个流程就会很别扭，但是如果不让用户确认，用户可能会感觉不安全。
隐私问题，为了服务执行的准确性，大模型必然会读取大量的用户数据，这可能无法通过国内的隐私政策。

路漫漫其修远兮。虽然困难重重，但是这个目标我觉得不会错，希望能早点看到这一天的到来，到时候我也能吹吹牛逼，这是我n年前的想法，这肯定是抄袭了我的idea。

在前文[[20250113-什么是内网穿透]]里提到可以通过ipv6进行远程访问实现内网穿透，明天再详细了解一下ipv6