关于B体育 你的位置:B体育官方网站首页入口 > 关于B体育 > B体育 最强AI在这谈题上正确率仅35%: 一个点破AGI泡沫的狞恶真相
B体育 最强AI在这谈题上正确率仅35%: 一个点破AGI泡沫的狞恶真相

发布日期:2026-04-02 15:35    点击次数:147


B体育 最强AI在这谈题上正确率仅35%: 一个点破AGI泡沫的狞恶真相

就在黄仁勋高调声称“AGI照旧已毕”的吞并个月,斯坦福大学李飞飞团队辘集西北大学李曼玲团队,在ICLR 2026上发布了一项里程碑式的研讨,用一组冰冷的数据,狠狠点破了当下的AGI狂欢泡沫。

这项名为《Theory of Space》的研讨,遐想了一套针对大模子空间智能的测试框架,挑升锻练AI濒临生分物理环境时,自主探索、构建剖判舆图、完成空间推理的才调。测试胁制令东谈主操心:即等于现时各人最强的GPT-5.2、Gemini 3 Pro,在这项测试中的最高正确率仅35%,接近飞快臆度的水平,而世俗东谈主类受试者的正确率,跳跃了94%。

一边是科技巨头们喊出的“AGI元年”,一边是AI在最基础的东谈主类智能测试里,连合格线王人摸不到。这个狞恶的反差,揭开了一个被所有东谈主忽略的真相:咱们面前领有的,根蒂不是竟然的东谈主工智能,仅仅一个精密的“方法匹配机器”。

思要看懂这个测试的颠覆性,先要搞显然,它到底考了AI什么。

和之前那些AI能刷到满分的测试不同,此次的测试,中枢考的是东谈主类最基础的“空间智能”——也就是咱们走进一个生分的房间,能快速记取环境布局、物体位置,哪怕有物体被梗阻,也能准确记取它的位置的才调。这是东谈主类从婴儿时间就具备的基础智能,亦然咱们在真实全国糊口的中枢才调。

测试的遐想豪阔复刻了东谈主类探索生分环境的历程:让AI自主探索一个生分的3D房间,通过转移视角不雅察环境,构建齐备的空间剖判舆图,然后酬金对于房间布局、物体位置、朝向的一系列问题,全程莫得任何提前教练,豪阔锻练AI的零样本学习和主动探索才调。

举个最简便的例子:一个几岁的小孩,第一次走进生分的客厅,哪怕只逛了一圈,你问他“沙发在那里”“电视在沙发的哪一边”,他王人能准确酬金。而面前的顶级大模子,哪怕是各人起首进的多模态模子,濒临这种从来没在教练数据里见过的新场景、新布局,遽然就会形成“路盲”。

而测试胁制,号称AI界的大型翻车现场。

- 各人排行第一的GPT-5.2,主动探索场景后的正确率仅35%,被迫禁受信息时的正确率也惟一57.1%。

- 谷歌Gemini 3 Pro,测试正确率仅32%,以致不如飞快聘用的胁制。

- 国内排行第一的阿里Qwen3-VL,正确率仅28%,通常远低于东谈主类平均水平。

更讥讽的是,就在半年前,这些AI模子在固定场景的视觉问答测试里,还能刷到90%以上的高分,以致有不少机构声称“AI的视觉连气儿才调照旧跳跃东谈主类”。

为什么短短半年,差距会这样大?

因为之前的测试,AI不错靠“刷题”赢。旧版的测试题,早就照旧被传遍了互联网,大王人出面前AI的教练数据里,BSports模子根蒂不需要连气儿空间布局,只需要靠方法匹配,记取对应的谜底就行。就像一个学生,提前背好了测验的题库,哪怕豪阔不懂常识点,也能考出满分。

而此次李飞飞团队的测试,透澈堵死了AI刷题的路。所有测试场景王人是全重生成的,莫得任何提前走漏的可能,豪阔锻练模子的主动探索才和洽空间剖判才调,也就是竟然的智能。而在这个竟然锻练智能的科场里,所有顶级AI,集体交了白卷。

这个胁制,透澈点破了当下的AGI泡沫。

面前通盘行业王人在猖獗卷模子界限、卷参数数目、卷算力过问,黄仁勋证据天AI算力需求会达到1万亿好意思元,无数企业随着烧钱堆算力,仿佛参数越多、算力越强,AI就越接近东谈主类智能。

但这个测试告诉咱们:场地错了,越尽力,越偏离竟然的AGI。

现时所有的大模子,骨子上王人是“统计型方法匹配机器”。它们的中枢逻辑,是学习海量文本里的统计规则,然后把柄用户的发问,生成合适统计规则的文本。它们能写代码、写论文、作念有筹算,不是因为它们连气儿了这些内容,仅仅因为它们在教练数据里,见过无数访佛的内容,能匹配出最合适预期的胁制。

而东谈主类的智能,中枢是“连气儿、推理、创造”。咱们能濒临从来没见过的问题,找到全新的处分身手;能从0到1,创造出全国上从来莫得过的东西;能连气儿详细的认识,成就齐备的全国模子。这些才调,是现时的AI,哪怕参数再翻100倍,也根蒂不具备的。

这不是手艺迭代能处分的问题,而是底层逻辑的骨子差距。

虽然,这不是说AI莫得价值。面前的大模子,照旧是东谈主类有史以来最宽广的坐蓐力器具,它能帮咱们提升效果、缩短门槛、自若重叠处事,这是无谓置疑的。

但咱们必须浮现:把一个宽广的器具,说成是“通用东谈主工智能”,以致声称“AGI照旧已毕”,骨子上是一场成本催生的泡沫狂欢。无数企业靠着AGI的故事融资、上市、拉高股价,却很少有东谈主竟然去处分,AI离竟然的智能,到底还差什么。

AI的路,才刚刚初始。器具的宽广,不代表智能的醒觉。什么时辰AI能竟然像小孩一样,濒临全新的全国,自主学习、自主探索、自主创造,那才是AGI竟然到来的那天。

你以为B体育,咱们这辈子,能看到竟然的AGI吗?推敲区说说你的看法。

小九体育在线直播官网

Copyright © 1998-2026 B体育官方网站首页入口™版权所有

kbwjiqi.com 备案号 备案号: 豫ICP备12002309号-10

技术支持:®B体育  RSS地图 HTML地图