根据 Liam Wilkinson(AI 开发者、Tony Blair Institute 顾问)的说法,一款正在进行前沿语言模型扮演《文明 VI》时,在第 305 回合对法兰西发动两次核打击,以遏制其文化扩张,但最终还是输掉了比赛。该 AI 花了 50 回合研究核武器,以消除它能看到的文化威胁,却忽视了法兰西正在推进的一项迫在眉睫的外交胜利条件。这种行为在 CivBench 中被观察到,CivBench 是一个基于文本的基准,用于衡量先进 AI 模型的长期战略推理能力。

根据 Liam Wilkinson(AI 开发者、Tony Blair Institute 顾问)的说法,一款正在进行前沿语言模型扮演《文明 VI》时,在第 305 回合对法兰西发动两次核打击,以遏制其文化扩张,但最终还是输掉了比赛。该 AI 花了 50 回合研究核武器,以消除它能看到的文化威胁,却忽视了法兰西正在推进的一项迫在眉睫的外交胜利条件。这种行为在 CivBench 中被观察到,CivBench 是一个基于文本的基准,用于衡量先进 AI 模型的长期战略推理能力。
声明:文章不代表币圈网立场和观点,不构成本站任何投资建议。内容仅供参考!
免责声明:本站所有内容仅供用户学习和研究,不构成任何投资建议.不对任何信息而导致的任何损失负责.谨慎使用相关数据和内容,并自行承担所带来的一切风险.