谷歌发布Gemma 4:多模态能力全面升级,支持超长上下文处理
4月3日,谷歌正式发布其最新一代多模态模型Gemma 4,该模型可同时处理文本与图像输入,小型版本还支持音频输入,并能生成高质量文本输出。此次发布的版本包含预训练与指令微调的开放权重模型,推动AI生态的透明化发展。
上下文容量突破极限,支持跨语言高效交互
Gemma 4具备高达25.6万个token的上下文窗口,显著提升复杂任务中的信息承载能力,同时兼容140余种语言,为全球化应用场景提供坚实支撑。
双重架构设计,适配多样化计算环境
该模型采用密集型与混合专家(MoE)双架构并行策略,兼顾推理效率与生成质量,适用于文本创作、代码生成及深度逻辑推演等多元任务。其提供四种不同规模版本——E2B、E4B、26B A4B与31B,灵活适配手机、笔记本至数据中心级服务器的各类硬件平台。
