就用“半成品”？Qwen拿下AIME满分，OpenAI的抓马瞬间不香了

88彩

热点资讯

产品展示

你的位置：88彩 > 产品展示 > 就用“半成品”？Qwen拿下AIME满分，OpenAI的抓马瞬间不香了

发布日期：2025-11-22 13:47 点击次数：152

得，各位，咱今天把那些明星八卦先放一边，聊点真正硬核的，能让你后半夜睡不着觉那种。

就在OpenAI那帮人为了自家“皇位”由谁来坐，还在上演比美剧还精彩的《继承之战》时，隔壁那个叫Qwen的，一直不吭声，结果在大家都没注意的深夜里，直接把一颗王炸甩在了牌桌上。

这感觉，就像你还在跟人吵架谁是武林盟主，人家一个扫地僧拎着半截扫帚，就把《九阴真经》最后一页给解出来了。

没开玩笑，说的就是Qwen3那个还在娘胎里的“早期预览版”。

官方自己都说，这玩意儿还在训练，是个半成品。

结果呢？

转手就在AIME’25，一个能让数学系博士都抓破头皮的竞赛上，直接干了个满分。

100%，一分没丢，愣是把之前由GPT-5系列牢牢霸占的榜首给掀了。

这消息刚出来，我第一反应就是“扯淡吧？”

。

这年头，AI吹牛皮不上税，谁家发布会不说自己秒天秒地？

直到我亲自上手，打开那个叫Qwen Chat的玩意儿，准备好好盘一盘这位新科“数学状元”。

我这人手黑，没跟它客气，直接上了一道能把人送走的IMO真题，就是那种你看完题目就想把出题人祖宗十八代都问候一遍的数论题。

我点上烟，泡上茶，就等着看它怎么死机。

结果呢，我这边茶还没喝两口，大概也就五分钟，一个逻辑链完整到变态、步骤严谨到令人发指的答案，就“啪”地一下，拍我脸上了。

那一刻，讲真，我后背有点凉。

这不是单纯的计算，这是一种冷酷的、没有人情味儿的、绝对的逻辑穿透力。

它不像一个天才，会灵感迸发，它像一部机器，一部为终极真理而生的、无情的机器。

但最有意思的来了。

我换了个路子，寻思你既然脑子这么好使，来点文艺的，用代码给我画个3D太阳系总行吧？

结果它给我看的东西，差点没把我当场送走。

画面里，孤零零四颗星球，搁那儿装深邃。

它还特别“贴心”地做了几个按钮，说是能控制行星转速。

你猜怎么着？

那几颗球，它压根就不会动！

就跟博物馆里的陈列品一样，假装自己在公转，实际上连自转都懒得演。

我当时就乐了，直接跟它挑明：“我说老铁，太阳系啥时候缩编了？再说了，你这公转自转的效果是不是忘装发动机了？”

它倒也听劝，态度极好地修改了，很快把八大行星给补上了，画面也弄得花里胡哨的。

可那个最要命的问题，还是没解决。

星球们依旧是宇宙中最靓的“静物”。

这个翻车现场，简直绝了。

它恰恰把这个“满分怪物”的底裤给扒了：一个严重偏科、脑子时而超神时而短路的“半成品”天才。

它可以在抽象逻辑的世界里封神，但在需要理解点人类“常识”和动手能力的活儿上，它就立马露怯，会偷懒，会犯一些蠢得可爱的错误。

这才是最让人细思极恐的地方。

一个完美的AI，那是科幻片。

一个在某些地方强到逆天，在另一些地方又漏洞百出的AI，这才是现实。

所以，阿里云（Qwen的东家）为啥要这么干？

把一个优缺点这么扎眼的玩意儿这么早推出来？

这就是摆在台面上的阳谋。

当所有人的目光都还聚焦在OpenAI的内部宫斗时，Qwen用一种近乎粗暴的方式告诉全世界：这牌桌上，不止一个庄家。

它在用行动摧毁OpenAI建立起来的技术神秘感，同时向所有开发者喊话：别等那个又贵又傲娇的“神”了，我这有个能力差不多、甚至某些地方更强的，虽然它现在还有点傻，但我愿意让你看着它长大。

每一次这样的“预览版”发布，都是一场精准的心理战。

当所有人都跑去测试它的数学题，嘲笑它画的太阳系有多离谱时，它的用户、数据、影响力，都在像滚雪球一样疯涨。

所以，别再只盯着那个“AIME满分”的成绩单了。

分数只是个引子，真正的好戏，在分数之外。

它预示着，在这场关于人类未来的AI棋局里，剧情随时可能反转，而那个一直被视为主角的，如果再继续沉迷于内部的权力游戏，一不留神，可能连牌桌都找不着了。

毕竟，这个时代，从来不等任何人。

上一篇：DNF：赛季制“独立服务器”火了！从零开始专属打造，操作+氪金并举

下一篇：国人最低估的蜀国武将！杨仪被称“残局翻盘之神”？真相曝光