3月31日消息,近日,比利时布鲁塞尔自由大学(VUB)数据分析实验室发布重磅研究成果,证实商用大型语言模型已具备独立生成原创数学证明的能力。
OpenAI旗下ChatGPT-5.2(Thinking)成功破解了一项此前悬而未决的数学猜想,同时催生了名为“vibe-proving”的全新AI推理方法,相关预印本论文已于2026年2月21日发表在arXiv平台。
此次研究聚焦的核心命题,是数学家Ran与Teng在2024年提出的一项数学猜想。在数学领域,猜想是基于规律与重复验证被认为成立,但尚未经过严谨形式化证明的命题,只有完成完整有效的逻辑论证,猜想才能正式升格为定理。
研究团队介绍,整个证明过程历经7轮与ChatGPT的对话交互,形成了4版逐步迭代完善的论证版本。其中,ChatGPT核心承担了证明路径探索、核心结构搭建的工作,人类研究人员则全程把控推理的正确性与逻辑完整性。
研究团队将这种大模型辅助梳理、探索复杂理论构想的模式,命名为“vibe-proving”,并提出这一方法有望复刻AI辅助编程(vibe-coding)的快速发展路径,从基础工具快速向近自动化的理论探索演进。
“此前很多人认为,AI系统的创造力本质上只能局限于对训练数据的重新组合,我们的研究恰好打破了这一误解。”VUB教授VincentGinis表示。参与研究的博士后研究员BrechtVerbeken也坦言,虽早已预判ChatGPT能助力数学难题证明,但其实际表现出的效率仍远超预期。
尽管AI在此次证明中发挥了核心作用,研究团队仍反复强调,人类的参与与最终验证不可或缺,尤其是补全证明逻辑缺口、完成最终严谨校验的环节。
VUB教授Andres Algaba指出,AI将大幅加快数学猜想候选证明的生成速度,未来行业的核心瓶颈会转向人类验证环节,而语言模型同样有望在这一领域提供助力。
这项成果也标志着,大语言模型的能力边界已从辅助编程、文本创作,正式拓展至需要深度原创推理的理论数学研究领域。