算力困局:千问登顶背后的技术博弈与效率革命

2024年的AI行业,有一个问题正在从幕后走向台前:算力到底够不够用?

去年这个时候,国产大模型出海最大的尴尬是:免费送都没人用。海外开发者宁可花高价订阅GPT-4,也不愿意碰国产模型。那会儿行业讨论的是“谁家模型跑分更高”“谁家上下文窗口更长”。技术能力是核心壁垒。算力困局:千问登顶背后的技术博弈与效率革命 IT技术

更关键的是,这不是爬上去的。千问3.6Plus发布1天,直接冲上第一,连续4天霸榜。OpenRouter是什么?全球最大的AI模型API超市,GPT、Claude、Gemini全在上面。千问能从这群巨头手里抢下第一,说明国产模型真的能打了。

但就在千问登顶的同一天,另一条新闻让整个行业倒吸一口凉气。OpenAI的奥特曼在接受专访时坦承:Sora被关停,纯粹是因为算力不够。

Sora,OpenAI今年力推的视频生成模型,发布时全网刷屏,“AI要革了影视行业的命”的论调铺天盖地。结果还没火几个月,说没就没了。奥特曼的原话是:Sora不在公司最高优先级的名单里。翻译一下就是——好东西,但养不起。

算力消耗的数学题

为什么OpenAI会说算力不够?先看一组数据。训练视频模型消耗的算力,比文字模型高几十倍。生成一段1分钟的视频,背后可能是几百万Token的计算量。Sora作为视频生成模型,天然就是“烧钱大户”。

OpenAI的算力资源是什么级别?背后站着微软,Azure云服务的算力应该是业界最充足的。连这种金主爸爸撑腰的公司都说算力不够,其他公司还怎么活?

这就是当前AI行业的核心矛盾:需求端彻底爆发,但供给端的算力根本跟不上。千问调用量飙升,意味着市场对AI能力的需求正在指数级增长。但全球的GPU产能就那么多,扩建数据中心需要时间,电力供应也是瓶颈。

奥特曼的选择很现实:与其把算力砸在Sora上陪跑,不如集中资源训练GPT-5。Sora这种“烧钱大户”,只能忍痛砍掉。GPT系列才是OpenAI的现金牛,这个优先级不能乱。

效率革命的三个阶段

如果把AI行业的发展分成三个阶段,逻辑很清晰:

第一阶段拼模型能力。谁的参数多、谁的成绩单漂亮,谁就能拿融资。2022年到2023年上半年是这个阶段的主旋律。

第二阶段拼应用场景。谁能落地、谁能赚钱,谁就能活下去。去年开始进入这个阶段,投资人开始问商业化路径。

第三阶段拼算力效率。谁能用同样的资源干更多的事,谁就能在价格战中活下来。现在正在进入这个阶段。

OpenAI关停Sora,不是因为技术不行,是算力性价比算不过来。千问能登顶,也不是因为技术吊打GPT-4,是性价比更高。用户很现实:模型能力差不多,谁便宜用谁。

低价策略的隐忧

但这里有个问题:千问的低价策略能持续多久?

1.4万亿Token的单日调用量,对算力的消耗是天文数字。千问的价格比GPT-4便宜一大截,这种“低价走量”的策略,利润空间被压得薄如纸。

换句话说,千问这是在用价格换市场份额。但这套玩法的持续性,完全取决于阿里的算力储备还能撑多久。如果哪天阿里云也喊算力不够了,千问的价格还能这么香吗?

更关键的是:调用量高不等于技术领先。千问在调用量上赢了,不代表在复杂推理、创意写作这些高价值场景也赢了。GPT-4在这些领域还是领先。长期用低价换市场,可能会陷入“有市无利”的困境——份额有了,但没钱投入下一代研发。

AI行业的瓶颈,已经从“模型不够聪明”变成了“算力不够用了”。下一步拼什么?不是比谁的技术更牛,而是比谁的算力效率更高。对从业者来说,这既是挑战,也是机会。谁能率先突破算力效率的瓶颈,谁就能在下一阶段占据主动。