Cursor公布Composer 2核心技术路径:双阶段训练驱动编码能力跃迁

3月25日,Cursor正式发布Composer 2技术白皮书,首次公开其完整模型训练架构与评估体系。该模型以底座模型Kimi K2.5为基础,采用MoE稀疏激活结构,总参数量达1.04万亿,激活参数为320亿,具备高效推理潜力。

分阶段训练策略:预训练与强化学习协同进化

训练流程分为两个关键阶段:首阶段在海量代码数据上进行继续预训练,系统性增强模型对编程语言、框架及常见模式的理解深度;第二阶段引入大规模强化学习机制,模拟真实开发环境中的多工具协同操作,涵盖文件编辑、终端调用与代码检索等核心行为。

自研评估体系亮相:真实任务驱动性能验证

报告同步披露了自研基准测试系统CursorBench的构建逻辑——其数据源取自工程团队实际编码会话,而非人工构造的合成任务,确保评估结果贴近生产场景。在该基准下,底座模型Kimi K2.5得分为36.0,经两阶段训练后,Composer 2得分达到61.3,性能提升逾70%。

成本与效率双重优化:实现帕累托前沿突破

Cursor强调,尽管模型能力显著增强,其推理开销仍显著低于行业某领先大模型的API服务,在准确率与部署成本之间达成理想平衡,展现出面向规模化应用的可行性与经济性。