苹果AI团队提出新3D生成技术LiTo,实现单图高保真三维重建
苹果AI团队发布新型3D生成技术LiTo
苹果人工智能研究团队于ICLR 2026会议发表最新研究成果,提出名为LiTo(表面光场标记化)的3D生成方法。该技术能够仅凭一张二维图像生成具有完整几何结构和精确视角依赖外观的3D模型,尤其在切换观察角度时,仍能保持镜面高光、菲涅耳反射等复杂光影效果的一致性。
突破传统3D重建的技术瓶颈
以往大多数3D重建方法通常只能处理物体的几何形状或其漫反射特性之一,难以同时还原随视角变化的动态光影细节。而LiTo首次将物体的几何结构与视角相关的外观信息统一编码至同一套3D潜在空间中,通过潜在流匹配机制,在单张输入图像条件下完成高质量生成。
训练数据与解码策略优化
研究团队使用数千个3D对象作为训练基础,每个对象在150个不同视角及三种光照条件下进行渲染,构建了丰富多样的视觉样本集。解码器采用随机子样本抽取策略,有效提升对完整几何与外观特征的建模能力,增强生成结果的稳定性与还原度。
性能超越现有方法
实验对比表明,LiTo在视觉质量与对原始输入图像的还原精度方面均显著优于当前主流方法TRELLIS,展现出更强的泛化能力与细节保留能力。该成果为数字内容创作、虚拟现实及工业设计等领域提供了更高效、更真实的3D生成解决方案。论文由Jen-Hao Rick Chang、Xiaoming Zhao(并列第一作者)、Dorian Chan与Oncel Tuzel共同撰写,已公开于arXiv平台。
声明:文章不代表币圈网立场和观点,不构成本站任何投资建议。内容仅供参考!