A recent experience with ChatGPT 5.5 Pro | Gowers's Weblog¶
Ch01.115 A recent experience with ChatGPT 5.5 Pro | Gowers's Weblog¶
📊 Level ⭐ | 4.2KB |
entities/a-recent-experience-with-chatgpt-55-pro-gowerss-weblog.md-> 原文存档
相关实体¶
深度分析¶
这是一篇极具标志性的数学 AI 实验记录。Timothy Gowers(菲尔兹奖得主,剑桥大学教授)让 ChatGPT 5.5 Pro 挑战开放数学问题,并在不到两小时内得到了 Isaac Rajagopal(MIT 学生)认为"几乎肯定正确"的证明——这实际上已经是发表级别的数学成果。 核心事件:Nathanson 在论文《Diversity, Equity and Inclusion for Problems in Additive Number Theory》中提出关于 h 倍 sumset 上界的问题。ChatGPT 5.5 Pro 将原有的指数上界改进为指数为 k^α(α>1/2)的上界,随后进一步将上界改进为关于 k 的多项式 O(k^{10h³})。Gowers 坦承自己的数学输入为零——整个证明几乎全由 ChatGPT 完成。 关键洞察:Isaac Rajagopal 指出,ChatGPT 提出的"利用 h²-解离集来控制低阶关系"这一想法是"完全原创的",属于那种"花一两周苦思才能想出来"的创意。 这篇博文的核心论点:LLM 已经能够解决"中等难度的开放问题",这意味着:
- 过去导师给博士生"相对简单的开放问题"作为起步训练的做法已失效
- 初级博士生必须找到新的方式证明自己的价值
- 数学研究中的"组合式"问题特别适合 LLM,因为这类问题高度集中在"用已知技术组合出新结果" 但 Gowers 也指出其他数学领域(前向推理、直觉判断)可能不同,且 LLM 仍只是工具,真正的价值在于"能够判断 LLM 何时出错"的能力。
实践启示¶
对数学研究的影响 1. 研究门槛的变化:LLM 已经能够独立完成"PhD 级别"的问题扩展。这意味着仅靠"解决一个开放问题"已不足以区分人类数学家的贡献。研究的价值将越来越依赖于提出正确问题的能力,而不是解决问题。 2. 技能的可迁移性:Gowers 指出,真正精通数学的人(能够独立解决难题)也更容易在 AI 辅助下取得突破——因为他们能判断 AI 输出何时出错。这与编程中的"好程序员更擅长 vibe coding"逻辑相同。 3. 工具接近性问题:当前高端 LLM(如 ChatGPT 5.5 Pro)仍价格昂贵,只有少数人能访问。这创造了新的不平等——可能形成"哪些学生有最强 AI 访问权"的竞争格局。 对数学教育的警示 4. 训练方式的转变:传统 PhD 训练依赖"给一个 gentile problem"让新生建立信心,但这类问题现在 LLM 也能解决。新晋研究者需要学会与 LLM 协作,而非仅依赖独立解决问题来建立信心。 5. 数学直觉的价值:LLM 在组合式问题上表现出色,但缺乏"前瞻性"推理——不知道哪些方向值得探索。这种判断力仍必须来自人类数学家。 对 AI 辅助研究的建议 6. Ping-pong 验证法(来自评论区):让两个 AI 互相验证对方的证明——AI1 输出 TeX,AI2 检查并找错误,再反馈给 AI1 修复。这能大幅提高证明可靠性。 7. 人类认证的必要性:arXiv 拒绝 AI 生成内容是合理的,但或许需要建立新的"AI 产出数学库",配合人类数学家的认证机制(最好是通过证明助手的形式化验证)。
延伸阅读¶
→ 原文存档¶
→ 原文存档