小米电动汽车推出世界模型框架,在 Waymo 基准测试中实现 28.48 PSNR
根据 Beating monitor,小米宣布了小米 EV 世界模型(JointWM 架构),集成了 3D 重建和视频生成模块,用于自动驾驶仿真。该框架以 3D 几何作为物理支撑来锚定场景,而生成模块则补全视觉细节并预测未观测区域。系统在 Waymo 重建精度测试中达到了 28.48 PSNR,并在 nuScenes 零样本泛化中保持领先表现。生成速度在单视图为 0.19 秒、三视图处理为 0.46 秒,支持最多 1 分钟的视频生成——比自回归基线 Epona 快 5.6 倍。该方案已部署在三个场景中:使用超过 100,000 个合成数据片段训练感知模型、为边缘案例构建高保真闭环仿真,以及为应用内驾驶指南提供具备生成式视频指令的支持。
声明:文章不代表币圈网立场和观点,不构成本站任何投资建议。内容仅供参考!