Google Gemini 3.1 Flash-Lite 正式上线：输入价格比 Claude 4.5 Haiku 便宜 75%，GPQA 得分 86.9%

据 Beating 称，Google Gemini 3.1 Flash-Lite 于 5 月 8 日从预览转为正式可用（GA），成为 Gemini 3 系列中最便宜、最快的模型。输入定价为每百万 tokens 0.25 美元，输出为每百万 tokens 1.50 美元——输入成本比 Claude 4.5 Haiku（1.00 美元）低 75%，输出成本比其低 70%（5.00 美元）。该模型具备 100 万 token 的上下文窗口，并实现 363 tokens/秒的吞吐量，比其前身 Gemini 2.5 Flash 快 45%。

性能基准显示，GPQA Diamond（研究生级别的科学推理）达到 86.9%，超越 Claude 4.5 Haiku 的 73.0% 以及 GPT-5 mini 的 82.3%。MMMU-Pro（多模态推理）达到 76.8%。早期采用者包括客服平台 Gladly，该平台称在生产工作负载中实现 60% 的成本降低和 99.6% 的成功率，以及 JetBrains，将 Flash-Lite 集成到 IDE 辅助工具中。

声明：文章不代表币圈网立场和观点，不构成本站任何投资建议。内容仅供参考！

Google Gemini 3.1 Flash-Lite 正式上线：输入价格比 Claude 4.5 Haiku 便宜 75%，GPQA 得分 86.9%

相关阅读