性能基准显示,GPQA Diamond(研究生级别的科学推理)达到 86.9%,超越 Claude 4.5 Haiku 的 73.0% 以及 GPT-5 mini 的 82.3%。MMMU-Pro(多模态推理)达到 76.8%。早期采用者包括客服平台 Gladly,该平台称在生产工作负载中实现 60% 的成本降低和 99.6% 的成功率,以及 JetBrains,将 Flash-Lite 集成到 IDE 辅助工具中。

性能基准显示,GPQA Diamond(研究生级别的科学推理)达到 86.9%,超越 Claude 4.5 Haiku 的 73.0% 以及 GPT-5 mini 的 82.3%。MMMU-Pro(多模态推理)达到 76.8%。早期采用者包括客服平台 Gladly,该平台称在生产工作负载中实现 60% 的成本降低和 99.6% 的成功率,以及 JetBrains,将 Flash-Lite 集成到 IDE 辅助工具中。
声明:文章不代表币圈网立场和观点,不构成本站任何投资建议。内容仅供参考!
免责声明:本站所有内容仅供用户学习和研究,不构成任何投资建议.不对任何信息而导致的任何损失负责.谨慎使用相关数据和内容,并自行承担所带来的一切风险.