A recent experience with ChatGPT 5.5 Pro | Gowers's Weblog¶

Ch01.115 A recent experience with ChatGPT 5.5 Pro | Gowers's Weblog¶

📊 Level ⭐ | 4.2KB | entities/a-recent-experience-with-chatgpt-55-pro-gowerss-weblog.md

-> 原文存档

深度分析¶

这是一篇极具标志性的数学 AI 实验记录。Timothy Gowers（菲尔兹奖得主，剑桥大学教授）让 ChatGPT 5.5 Pro 挑战开放数学问题，并在不到两小时内得到了 Isaac Rajagopal（MIT 学生）认为"几乎肯定正确"的证明——这实际上已经是发表级别的数学成果。 核心事件：Nathanson 在论文《Diversity, Equity and Inclusion for Problems in Additive Number Theory》中提出关于 h 倍 sumset 上界的问题。ChatGPT 5.5 Pro 将原有的指数上界改进为指数为 k^α（α>1/2）的上界，随后进一步将上界改进为关于 k 的多项式 O(k^{10h³})。Gowers 坦承自己的数学输入为零——整个证明几乎全由 ChatGPT 完成。 关键洞察：Isaac Rajagopal 指出，ChatGPT 提出的"利用 h²-解离集来控制低阶关系"这一想法是"完全原创的"，属于那种"花一两周苦思才能想出来"的创意。这篇博文的核心论点：LLM 已经能够解决"中等难度的开放问题"，这意味着：

过去导师给博士生"相对简单的开放问题"作为起步训练的做法已失效
初级博士生必须找到新的方式证明自己的价值
数学研究中的"组合式"问题特别适合 LLM，因为这类问题高度集中在"用已知技术组合出新结果" 但 Gowers 也指出其他数学领域（前向推理、直觉判断）可能不同，且 LLM 仍只是工具，真正的价值在于"能够判断 LLM 何时出错"的能力。

实践启示¶

对数学研究的影响 1. 研究门槛的变化：LLM 已经能够独立完成"PhD 级别"的问题扩展。这意味着仅靠"解决一个开放问题"已不足以区分人类数学家的贡献。研究的价值将越来越依赖于提出正确问题的能力，而不是解决问题。 2. 技能的可迁移性：Gowers 指出，真正精通数学的人（能够独立解决难题）也更容易在 AI 辅助下取得突破——因为他们能判断 AI 输出何时出错。这与编程中的"好程序员更擅长 vibe coding"逻辑相同。 3. 工具接近性问题：当前高端 LLM（如 ChatGPT 5.5 Pro）仍价格昂贵，只有少数人能访问。这创造了新的不平等——可能形成"哪些学生有最强 AI 访问权"的竞争格局。 对数学教育的警示 4. 训练方式的转变：传统 PhD 训练依赖"给一个 gentile problem"让新生建立信心，但这类问题现在 LLM 也能解决。新晋研究者需要学会与 LLM 协作，而非仅依赖独立解决问题来建立信心。 5. 数学直觉的价值：LLM 在组合式问题上表现出色，但缺乏"前瞻性"推理——不知道哪些方向值得探索。这种判断力仍必须来自人类数学家。 对 AI 辅助研究的建议 6. Ping-pong 验证法（来自评论区）：让两个 AI 互相验证对方的证明——AI1 输出 TeX，AI2 检查并找错误，再反馈给 AI1 修复。这能大幅提高证明可靠性。 7. 人类认证的必要性：arXiv 拒绝 AI 生成内容是合理的，但或许需要建立新的"AI 产出数学库"，配合人类数学家的认证机制（最好是通过证明助手的形式化验证）。

延伸阅读¶

→ 原文存档 ¶

→ 原文存档