How to Build an AI-Native Startup¶
Ch04.449 How to Build an AI-Native Startup¶
📊 Level ⭐⭐ | 4.3KB |
entities/ai-native-startup-cyberfund-guide.md
How to Build an AI-Native Startup¶
深度分析¶
核心框架:AI 原生公司的操作系统¶
Stepan Gershuni 在 cyber.fund 发布的这篇创始人指南,提出了 AI 原生创业公司的核心操作系统:Context·Agents·Evals·Skills。与传统公司"雇更多人"的扩张模式不同,AI 原生公司的核心差异在于学习速度——每天快一点,几周后差距开始拉开,几个月后只有一家会活下来。
七步操作系统¶
-
先画地图:把公司重复发生的工作列出来(20-40 项),按自主程度分级。频率胜过重要性——高频工作才能积累足够样本优化评估系统。
-
把记忆装进代码库:Context 是「操作记忆库」——模型会换代,但那层提炼("客户说再考虑考虑=价格太高")是跟着公司走的。Anthropic MCP 将 context 从 15 万 token 压缩到 2000 token(↓98.7%)。原始数据与提炼数据必须分离。
-
选最轻的那个:脚本→AI辅助人工→工作流→智能体,用最轻工具处理当前工作。Harness 六步:预检→计划→审批→执行→验证→记录。安全边界在代码层,不在提示词。
-
什么叫做对了:Skills(可复用技能)+ Evals(评估系统)是引擎。没有 eval,每次迭代都是口味之争。核心指标是接受率(<70% → 不提升自主度)。
-
创始人先上:Jack Dorsey 在 Block 每天花几小时亲自使用工具后才决定重组。入职第一天就要有真实输出。招聘测判断力,不测知识。
-
每周进化:内环优化现有工作,外环探索新方向。硬规则:智能体不能直接写生产。真正瓶颈是"能否写出 eval",不是模型能力。
-
护城河:评论者认为 Gershuni 漏掉了最根本的东西——判断什么值得编码是一种无法被方法论覆盖的稀缺能力。先跑起来的公司学习速度指数级领先。
关键洞察¶
- 频率 > 重要性:低频工作无论多重要,样本量不够无法优化。C.H. Robinson 从全自主退回起草人审批的案例说明:量太大时单条错误路由代价被总量淹没。
- Context 压缩:同一模型,读了三个月提炼 context 的公司 vs 刚接 API 的公司,输出质量差距不是一个级别。
- 溯源是信任基础:每个智能体总结必须能追溯到源头,没有溯源信任会崩溃。
- Replit 教训:提示词指令不是安全边界,只有代码层面限制才是。
护城河再思考¶
评论者的核心反驳:Gershuni 把问题框定为"执行纪律",但真正的瓶颈是自我认知诚实度——创始人能否承认自己 80% 的时间在做 L3 的事。判断什么值得编码本身是稀缺能力。
如果 OS 真是护城河,先发公司的学习速度指数领先后来者。但历史上每次"指数差距不可逆"的论断最后都被范式跳跃打断。
实践启示¶
- 从高频低风险工作开始自动化——工单分类比董事会战略决策更适合优先自动化
- context 压缩优先——先做提炼数据层(决策/反对意见/风险),不要让原始数据淹没智能体
- eval 先行——在调提示词之前,先建立接受率评估体系
- 安全边界写进代码——生产删除权限、合并门槛必须在代码层实现
- 创始人先用——在会议室讲 PPT 之前,先在真实 context 下现场演示
相关实体¶
- Agent Harness Architecture Design Production Guide
- Schemaflow Openai Cookbook Staged Agentic Workflow
- How To Build Audio Transcription Agent
- Gaode Ai Native 7X24 Pipeline Self Healing
- Harness Engineering Comprehensive Guide Conardli
→ 原文存档 - how frontier teams are reinventing ai-native development - MOC