M2.7 展示了自主代理自我进化能力,完成了 100 多轮分析、代码修订与测试循环。在性能基准上,M2.7 在 SWE-Pro 上达到 56.22%,在 Multi-SWE-bench 上达到 52.7%;在 MLE Bench 上平均奖励率为 66.6%,接近 Gemini 3.1 的性能水平。

M2.7 展示了自主代理自我进化能力,完成了 100 多轮分析、代码修订与测试循环。在性能基准上,M2.7 在 SWE-Pro 上达到 56.22%,在 Multi-SWE-bench 上达到 52.7%;在 MLE Bench 上平均奖励率为 66.6%,接近 Gemini 3.1 的性能水平。
声明:文章不代表币圈网立场和观点,不构成本站任何投资建议。内容仅供参考!
免责声明:本站所有内容仅供用户学习和研究,不构成任何投资建议.不对任何信息而导致的任何损失负责.谨慎使用相关数据和内容,并自行承担所带来的一切风险.