小米罗福莉披露推理需求激增百倍,算力角逐步入新纪元

在2026中关村论坛年会人工智能主题日的开源前沿论坛上,小米MiMo大模型负责人罗福莉发表主题演讲。她指出,随着大模型能力持续跃升以及agent框架的深度集成,系统对推理资源的需求呈现指数级扩张态势。

token消耗量逼近十倍跃升,年度增幅或达百倍

据其披露,过去数月间,单个模型的token生成量已实现近十倍增长。基于当前发展速度,她预测2024年全行业推理相关的token总量可能迎来百倍级突破。

竞争维度全面升级,算力与能源成决胜关键

罗福莉强调,当前产业格局已发生根本性转变,企业间的较量不再局限于算法与参数规模,而是延伸至底层算力基础设施、专用推理芯片部署效率乃至能源使用成本控制等多个维度。