据 JD Cloud 称,MiniMax M3 于今日正式上线(6 月 1 日),该公司用于 JoyBuilder 的模型开发平台已立即与新模型集成。借助 JD Cloud 的自有推理框架和优化技术,包括 PD 分离部署、KV Cache 和推测采样,该平台在推理吞吐量和响应效率方面取得了显著提升。