

该平台旨在验证企业级AI代理的推理能力。自初始阶段起,已有Founders Fund、Pantera、资产管理规模达1.5万亿美元的Franklin Templeton,以及alphaXiv、Fireworks、OpenHands、OpenRouter等多方机构参与。
“竞技场”模拟接近企业实际工作流程的环境,包括信息不完整、上下文冗长、指令模糊或来源冲突等复杂场景。其设计记录了完整的推理过程,以便工程团队追踪失败原因并进行改进。首项任务聚焦于文档推理,重点测试针对复杂非结构化数据的推理与计算能力。
Franklin Templeton数字资产部门管理合伙人Julian Love表示:“此类结构化环境有助于区分‘潜在概念’与可在实际生产环境中运用的能力。”Sentient联合创始人Himanshu Tyagi强调:“企业需在生产环境中验证代理推理的稳定性与可复现性”,点明了该平台的存在意义。
“竞技场”项目以全球推广为目标,计划自2026年3月起在旧金山开展线下活动。
声明:文章不代表币圈网立场和观点,不构成本站任何投资建议。内容仅供参考!
免责声明:本站所有内容仅供用户学习和研究,不构成任何投资建议.不对任何信息而导致的任何损失负责.谨慎使用相关数据和内容,并自行承担所带来的一切风险.