OpenAI宣布,其尚未发布的推理模型在国际数学奥林匹克竞赛(IMO)中摘得金牌,这一消息在数学竞赛界引发了轩然大波。
当大多数高中生正享受着远离学校和作业的惬意时光时,来自世界各地的顶尖数学学子们却在IMO赛场上全力以赴。IMO被视为数学竞赛界的巅峰之战。同时,人工智能实验室也携其大型语言模型(LLM)参赛,据研究员亚历山大·魏(Alexander Wei)在社交媒体上分享的消息,OpenAI的一款尚未发布的模型凭借高分斩获了金牌。
OpenAI的这款模型在六道题目中答对了五道,以35分(满分42分)的高分荣获金牌。魏表示“每道题的评分都由三位前IMO奖牌得主独立完成,最终得分需经全体一致同意后方可确定。”这些题目涵盖了代数和微积分预科知识,要求参赛者具备创造性思维。因此,LLM能够推理出冗长而复杂的证明过程,无疑是一项令人瞩目的成就。
然而,这一消息的发布时机却遭到了批评,因为它掩盖了人类参赛者的光芒。据非营利组织人工智能治理与安全研究所的负责人米哈伊尔·萨明(Mikhail Samin)在社交媒体上透露,IMO曾要求与该组织正式合作验证结果的AI实验室推迟一周发布任何消息,以免抢了孩子们的风头。OpenAI表示,他们并未与IMO正式合作验证结果,而是与个别数学家合作独立验证了分数,因此不受任何协议的约束。Mashable已向萨明发送私信请求置评。
但有传言称,此举让组织者感到不悦,他们认为OpenAI的行为“粗鲁”且“不合时宜”。这些说法均基于萨明的传言,他还晒出了一张名为约瑟夫·迈尔斯(Joseph Myers)的人的类似评论截图,此人疑似是两次IMO金牌得主。Mashable已联系迈尔斯请求置评,但他尚未公开确认截图的真实性。
对此,OpenAI研究员诺姆·布朗(Noam Brown)回应称,他们在IMO闭幕式后公布了结果,以尊重IMO组织者的要求。布朗还表示,OpenAI并未与IMO取得联系,暗示他们并未就推迟公布结果达成任何协议。
与此同时,据报道,谷歌DeepMind确实与IMO进行了合作,并于今天下午宣布,“经过深思熟虑的Gemini高级版本在国际数学奥林匹克竞赛中达到了金牌标准。”根据公告,DeepMind的模型“由IMO协调员使用与学生解决方案相同的标准进行了正式评分和认证”。你可以对这份声明进行深入解读,但发布时间绝非巧合。
别人或许追捧《比弗利娇妻》,但对我们而言,精英数学竞赛的得体举止才是我们津津乐道的高潮。