阿里千问推出Qwen3.5-Omni:全模态能力实现跨越式突破
3月30日,阿里千问正式发布新一代全模态大模型Qwen3.5-Omni,该系列涵盖Plus、Flash与Light三种规格的Instruct版本,具备256k超长上下文支持能力,可处理超过10小时的音频输入及长达400秒的720P(1FPS)音视频流。
多模态训练规模空前,原生融合文本视觉与音视频数据
模型基于海量文本、图像及逾一亿小时的音视频资料进行原生多模态预训练,在跨模态感知与内容生成方面展现出显著优势,全面强化对复杂场景的理解与响应能力。
语言覆盖范围拓展,语音交互能力实现质的飞跃
相较于前代Qwen3-Omni,Qwen3.5-Omni在多语言支持上取得重大进展,现可识别113种语种与方言的语音输入,并支持36种语种与方言的语音合成输出,大幅增强全球化应用场景下的实用性。
