EdgeClaw:端云两栖龙虾框架¶
Ch04.426 EdgeClaw:端云两栖龙虾框架¶
📊 Level ⭐⭐ | 5.1KB |
entities/edgeclaw-bemit-lobster.md
EdgeClaw:端云两栖龙虾框架¶
面壁智能联合清华大学、OpenBMB社区开源的Agent框架,主打"端云两栖"——兼顾云端模型智商与本地模型忠诚。配套发布EdgeClaw Box硬件产品。 GitHub: https://github.com/Openbmb/edgeclaw
- 云端API派:能力强但数据裸奔 + Token成本无底洞
- 本地模型派:数据安全但能力受限
相关实体¶
- 我用 Skillmd 做了一个简历生成器
- Aliyun Agentrun 2Line Integration
- Computer Use 45X More Expensive Than Structured Apis
- 2 Year 25 Ai Projects Summary
- Agent 从能用到管好中间差了什么
→ 原文存档
深度分析¶
"二选一"框架本身是伪命题,端云协同才是真实需求。 文章明确指出云端API派和本地模型派各自代表的需求(智商vs忠诚)并不互斥,OPC(Professional Copilot)用户真正需要的是在同一工作流中根据数据敏感度动态切换调用目标,而不是在两个系统之间做非此即彼的架构选择。这是EdgeClaw最核心的产品定位依据 。
隐私路由的三级分类(S1/S2/S3)是实现端云协同的关键机制。 该框架的核心创新在于将数据按敏感度分为三级处理路径:S1公开数据直连云端最强模型、S2敏感信息脱敏后上云、S3绝密信息强制本地处理。这一路由逻辑并非简单的"敏感就本地",而是由本地引擎(MiniCPM)作为路由器决定数据流向——本地模型负责判断数据属于哪一级别,而非让用户手动分类。这一设计降低了使用门槛,同时保证了安全策略的自动执行 。
MiniCPM端侧模型承担了"零Token消耗"的高频琐事处理。 在商业场景中,信息抽取、文本清洗、数据质检等任务占Agent调用量的相当比例,但本身不涉及敏感数据。通过内置MiniCPM系列端侧模型处理这些任务,EdgeClaw实现了大量Agent调用的Token成本归零,且具备断网工作能力。这在数据质检场景("百万条音频天文账单")中体现得尤为明显:本地98%+云端2%的比例意味着绝大多数计算在本地完成 。
商业场景的量化效果揭示了端云协同的真实价值空间。 文档给出的四个场景均以数量级效果为卖点:FA投研3小时备忘录、冷库盘点效率提升10倍、数据质检成本降数量级、财务审计几天→分钟级。这些场景的共同特征是任务中包含高敏感原始数据(BP、合同、审计底稿)和需要强推理的外部知识(行业报告、监管规则)的混合,端云协同架构恰好同时满足数据安全和智力输出的双重要求 。
实践启示¶
在构建企业Agent系统时,优先设计数据分级路由策略,而非直接选择云端或本地模型。 EdgeClaw的三级分类(S1/S2/S3)提供了一个可复用的数据治理框架:在系统设计早期明确"什么数据可以上云、上云前需要什么处理",比事后在安全和性能之间做权衡要高效得多。建议参考此分类标准评估企业内部的数据资产,制定相应的路由策略 。
用本地小模型处理"过滤层"任务,将云端大模型聚焦在高价值推理环节。 信息抽取、去重、格式清洗、摘要等任务虽然技术含量不高,但调用频率极高。使用MiniCPM类端侧模型承担这些任务,可将云端API的Token消耗压缩到整体计算量的极小比例,同时提升系统在弱网环境下的可用性 。
在选型Agent框架时,优先考察其对混合数据场景的原生支持程度。 传统框架要求用户在"数据安全但能力弱"和"能力强但数据外泄风险"之间做架构级选择。EdgeClaw的设计表明,真正的企业级需求是"数据不动、智力流动"——原始数据保留在本地,只有经过脱敏处理的语义/特征才上云。这一原则应作为企业选型的评估标准,而非单纯比较模型能力或部署方式 。
针对特定垂直场景(如投研、审计、质检),建议构建"本地解析+云端增强"的Pipeline而非单一模型调用。 EdgeClaw的FA投研场景展示了这一模式的实际效果:本地负责财务BP解析(保密),云端负责行业报告召回和推理(公开)。这种Pipeline设计的核心是将数据流和智力流解耦,分别选择最优执行环境,而非用一个大模型试图解决所有问题 。
→ 原文存档