AI数学家的极限在哪里? - FT中文网
登录×
电子邮件/用户名
密码
记住我
请输入邮箱和密码进行绑定操作:
请输入手机号码,通过短信验证(目前仅支持中国大陆地区的手机号):
请您阅读我们的用户注册协议隐私权保护政策,点击下方按钮即视为您接受。
人工智能

AI数学家的极限在哪里?

弗格森:如果模型能够学会掌握复杂的计算,它们就可能解答迄今一直难住我们的题。
00:00

{"text":[[{"start":7.17,"text":"本文作者是剑桥大学(University of Cambridge)理论宇宙学家、印孚瑟斯-剑桥人工智能中心(Infosys-Cambridge AI Centre)主任"}],[{"start":14.33,"text":"数学曾经被认为相对安全,不会受到即将到来的人工智能(AI)自动化洪流的冲击。聊天机器人或许能够按照要求生成文本、代码和图像,但数学所需的深度推理应该超出其能力。因此,OpenAI和DeepMind最近在国际数学奥林匹克竞赛(IMO)上获得的金牌,让像我这样的数学教授突然感到不那么安全了。"}],[{"start":37.7,"text":"AI会像已经在编写代码一样进行数学证明吗?毕竟,两者有明显的相似之处:两者都是高度结构化的“语言”,具有明确的约定和有限的“词典”。两者都有巨大的例题库,可以利用这些例题的已知解法训练AI。"}],[{"start":55.400000000000006,"text":"然而,尽管尖端AI数学模型生成的结果令人印象深刻,但生成式AI仍难以解答另一类数学问题:简单计算。问“5.11减5.9等于多少?”,得到的答案各不相同。今天早上,OpenAI最新的GPT5模型给出了-0.79的正确答案。但是把这个问题作为一项计算的一部分表述,你可能会得到一个不同的答案。"}],[{"start":81.4,"text":"我们应该如何看待这样的AI模型,它可以超越高中阶段奥林匹克竞赛对手,却不能总是做对小学水平的加减法?为了理解这一点,思考一下擅长数学意味着什么是有帮助的。"}],[{"start":94.96000000000001,"text":"数学的教学方式是向学生展示一道题,演示解题所需的方法,然后布置例题。能力较弱的学生需要大量例题,有时最后只记住了方法但不理解它。能力最强的学生只需要一两个例题就能掌握概念并将其应用于解答新题。"}],[{"start":113.15,"text":"最优秀的数学家的特点是具有概念化和一般化的能力。优秀的数学家解答难题;伟大的数学家能够找到使难题变简单的方法。"}],[{"start":123.21000000000001,"text":"AI模型的优势在于它们的速度和以极高的数量进行“练习”的能力。这意味着它们可以解答非常难但与它们之前见过的题有一些相似之处的题,但在面对新题时可能会犯难。这对理论数学来说尤其是个问题。当你解答更深奥的题时,可用于训练的例题数量大幅减少。"}],[{"start":144.9,"text":"这些都是神经网络领域众所周知的问题。它们擅长插值法(生成“介于”它们以前见过的情形之间的答案),不擅长外推法(生成超出它们训练集的答案)。"}],[{"start":157.16,"text":"在数学中,听起来相似的题使这变得格外难。例如:“你能够在一个体积为64的立方体中最多放下多少个体积为1的立方体?”和“你能够在一个体积为64的球体中最多放下多少个体积为1的球体?”它们听起来很相似,但其中一个很容易解答(立方体可以在一个4x4x4的方块内严丝合缝地堆叠在一起),另一个则很棘手(球体无法恰到好处地堆叠)。"}],[{"start":186.62,"text":"这意味着AI在应用数学和宇宙学中的使用仍然受限。我们可以把我们已经知道如何做的事情用AI来实现自动化。但到目前为止,计算方面几乎没有进展。"}],[{"start":199.38,"text":"然而,有可能更多的训练将解决这个问题,而不再需要外推法。如果可以喂给AI模型足够多的复杂计算,它们或许可以在不需要任何人类水平的灵感的情况下解答迄今难住我们的题。"}],[{"start":213.54,"text":"在我的专业被问的一个问题是:“一个速度极快、训练极好但无思考能力的数学家有多强大?”我们正在找寻答案。"}],[{"start":222.56,"text":"译者/何黎"}]],"url":"https://audio.ftmailbox.cn/album/a_1755773134_7663.mp3"}

版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。

SpyGPT将颠覆詹姆斯•邦德的世界

在开源数据与机器学习工具的加持下,难题不再是信息匮乏,而是信息过载。

年度关键词:Tradwife

围裙审美被Maga运动放大,借怀旧之名呼唤回到男人主宰一切的年代。

ChatGPT能帮你度过中年危机吗?

数以百万计的人开始把生成式人工智能当作心理治疗师使用。亨利•曼斯也来试一试。

2025年十大佳片

从乌克兰战壕到伊朗的秘密拍摄,从对美国的假想核打击到“白头神探”重启版。

一周新闻小测:2025年12月20日

您对本周的全球重大新闻了解如何?来做个小测试吧!

罗伯特•莱纳,导演与演员,1947—2025

这位电影人创作了有史以来最受喜爱的多部喜剧,包括《当哈利遇到莎莉》,并在多种类型片领域皆臻其功。
设置字号×
最小
较小
默认
较大
最大
分享×