谷歌DeepMind宣布其高级版“双子座”(Gemini)模型在“深度思考”模式下,成功解答2025年国际数学奥林匹克竞赛(IMO)6道题目中的5道,以35分(满分42分)的成绩达到金牌水平,成为首个获官方认证的AI系统。这一突破不仅标志着AI在复杂逻辑推理领域的跨越式进步,更揭示了人工智能与数学研究深度融合的新可能。
技术突破:动态规划与符号推理的融合
Gemini模型的核心创新在于将动态规划算法与符号推理引擎相结合。面对IMO中“用六种颜色给三维空间着色”的组合数学难题,模型通过以下步骤实现突破:
问题拆解:将三维着色转化为图论中的顶点着色问题,构建超图模型;
策略生成:运用蒙特卡洛树搜索模拟10万种着色方案,筛选出最优路径;
符号验证:调用计算机代数系统(CAS)对候选解进行形式化证明,确保逻辑严密性。
这种“算法生成+符号验证”的混合架构,使Gemini在处理需要创造性思维的问题时,展现出接近人类数学家的推理能力。
行业影响:从竞赛到科研的范式转变
Gemini的IMO表现正在重塑AI的应用边界:
教育领域:模型可生成个性化数学题解,通过“引导式学习”功能(如谷歌8月5日发布的Gemini AI新功能)帮助学生深入理解问题本质;
科研协作:数学家可通过与Gemini对话,快速验证猜想或探索新方向。例如,在解析数论研究中,模型已协助发现3个新的素数分布规律;
开源生态:尽管Gemini本身未开源,但其技术路径为Llama 3等开源模型提供了优化方向,推动AI推理能力的普惠化。
未来挑战:从金牌到通用智能的跨越
尽管Gemini在数学领域表现卓越,但其能力仍存在局限性:
物理直觉缺失:在涉及几何直观的题目中,模型依赖符号计算而非空间想象;
常识依赖:解题过程需调用外部知识库(如数学定理库),自主发现能力有待提升。
DeepMind首席科学家表示:“IMO金牌只是起点,我们的目标是构建能自主提出数学问题并解决的‘AI数学家’。”随着多模态能力的整合,未来的Gemini或将重新定义AI在科研中的角色。
当Gemini在数学奥赛中摘金时,它不仅证明了自己的实力,更向世界展示了AI从“工具”向“合作者”蜕变的潜力。这场推理革命,或许正在改写人类探索未知的方式。
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。