LLM Agent 拜占庭共识测试揭示去中心化协调瓶颈
LLM代理在拜占庭环境下达成共识能力受限
苏黎世联邦理工学院研究团队在论文《Can AI Agents Agree?》中评估了大语言模型代理在存在潜在作恶节点条件下的协同决策表现。该研究聚焦去中心化系统中的核心难题——拜占庭容错,即在部分参与者不可信的情况下实现一致行动,这与区块链共识机制所应对的问题本质一致。
多规模模拟验证共识稳定性
实验采用 Qwen3-8B 与 Qwen3-14B 模型,在 4、8、16 个代理组成的全连接网络中进行数百次模拟。各代理通过反复广播提案并参与投票,部分设定为恶意节点以干扰决策过程。结果显示,即便无任何恶意节点,整体有效共识率仅为 41.6%;其中,Qwen3-14B 表现优于 Qwen3-8B,达 67.4%,而后者仅为 15.8%。
群体规模扩大加剧协调困难
随着代理数量增加,达成一致的难度明显上升。在 4 个节点时共识成功率为 46.6%,至 16 个节点时降至 33.3%。加入恶意节点后,失败模式主要表现为超时和无法收敛(活性丧失),而非数据被篡改,表明系统更易陷入僵局而非被操控。
提示词影响显著降低可信度
值得注意的是,仅在提示词中加入「可能存在恶意节点」的描述,便使 Qwen3-14B 的成功率从 75.4% 下降至 59.1%,即便实际环境中不存在任何攻击行为。这一现象揭示模型对威胁感知的高度敏感性,可能影响其在真实协作场景中的可靠性。
结论:共识非当前涌现能力
研究指出,目前大语言模型代理尚不具备可信赖的共识涌现能力,尤其在高复杂度、高不确定性环境中。对于依赖稳健协调机制的去中心化应用部署,应保持审慎态度,避免过度依赖此类智能体的自主协同表现。
声明:文章不代表币圈网立场和观点,不构成本站任何投资建议。内容仅供参考!