根据 Anthropic 在 X 上的公告,Mythos Preview 在 64% 的下一步研究决策中表现优于人类,这一比例较 2024 年的 22% 有了显著提升。该公司向 Claude 展示了研究会话:在这些会话中,人类研究人员偏离了轨道,要求模型在当时确定正确的下一步。