一、核心基础信息
1. 发布与开源详情
- 正式发布/开源时间:2026年2月16日(除夕)
- 首发旗舰型号:Qwen 3.5-397B-A17B(Qwen 3.5-Plus)
- 开源协议:Apache 2.0(完全宽松,支持免费商用、二次开发、修改分发)
- 开源范围:全系列模型权重、推理代码、训练框架、多模态工具、API示例;覆盖MoE旗舰、稠密中小模型、多模态专用版
- 获取渠道:魔搭社区、Hugging Face、GitHub、阿里云百炼平台同步上线
2. 核心架构与参数
- 旗舰架构:MoE稀疏专家+Gated Delta Networks(GDN)门控线性注意力
- 总参3970亿,单次推理仅激活170亿(约5%),显存占用降低60%,32k上下文吞吐量较Qwen3提升8.6倍
- GDN替代部分Softmax Attention,长序列复杂度从O(n²)降至O(n),推理效率大幅提升
- 多模态:原生Early Fusion(预训练阶段融合文本/图像/视频Token,非后期拼接)
- 上下文长度:基础32k,可扩展至256k/1M
- 语言覆盖:201种语言/方言,词表25万,小语种编码效率提升60%
二、Qwen 3.5 全系列版本(含开源状态)
| 型号 |
参数规模 |
架构 |
模态 |
开源状态 |
核心定位 |
| Qwen 3.5-397B-A17B |
397B总/17B激活 |
MoE |
文本/图像/视频 |
✅ 开源 |
旗舰,复杂推理、智能体、多模态 |
| Qwen 3.5-72B |
72B |
稠密 |
文本/图像 |
✅ 开源 |
企业级通用、代码开发 |
| Qwen 3.5-14B |
14B |
稠密 |
文本/图像 |
✅ 开源 |
中端部署、边缘场景 |
| Qwen 3.5-7B |
7B |
稠密 |
文本/图像 |
✅ 开源 |
轻量应用、移动端 |
| Qwen 3.5-VL |
对应规模 |
稠密/MoE |
多模态专用 |
✅ 开源 |
图像分析、视频理解 |
三、与 Qwen 3、Qwen 2.5 核心对比(全方位维度)
1. 基础信息对比
| 维度 |
Qwen 3.5 |
Qwen 3 |
Qwen 2.5 |
| 发布时间 |
2026年2月16日 |
2025年4月29日 |
2025年3月28日 |
| 旗舰型号 |
397B-A17B(MoE) |
235B-A22B(MoE) |
72B(稠密) |
| 开源协议 |
Apache 2.0(全系列) |
Apache 2.0(全系列) |
Apache 2.0(全系列) |
| 开源范围 |
MoE旗舰+稠密全系列+多模态专用 |
MoE旗舰+稠密全系列 |
稠密全系列+全模态专用(Omni) |
| 核心架构 |
MoE+GDN门控线性注意力 |
MoE+标准注意力 |
稠密+Thinker-Talker双核 |
| 激活策略 |
低激活(17B/397B,约5%) |
低激活(22B/235B,约9%) |
全参数激活 |
2. 能力与效率对比
| 维度 |
Qwen 3.5 |
Qwen 3 |
Qwen 2.5 |
| 多模态 |
原生Early Fusion,支持2小时视频、GUI交互、视觉智能体 |
后期Adapter融合,图像/视频基础理解 |
全模态(文本/图像/音频/视频),端侧适配 |
| 上下文长度 |
32k(基础)/256k/1M |
32k(基础)/128k |
32k(基础)/64k |
| 语言覆盖 |
201种语言/方言 |
119种语言/方言 |
90+种语言/方言 |
| 推理效率 |
32k吞吐量较Qwen3提升8.6倍,显存降60% |
较Qwen2.5提升3-5倍 |
基础稠密模型效率 |
| 编程能力 |
复杂算法、视觉编程、代码调试,对标GPT-5.2 |
代码生成、调试,接近Gemini 2.5 Pro |
基础代码生成、轻量开发 |
| 智能体能力 |
原生MCP协议、工具调用、UI自动化 |
基础工具调用、简单Agent |
基础Agent、轻量自动化 |
3. 性能与应用对比
| 维度 |
Qwen 3.5 |
Qwen 3 |
Qwen 2.5 |
| 基准表现 |
MMLU-Pro 89.8、数学推理、多模态SOTA |
MMLU-Pro 89.5、代码能力突出 |
全模态评测OmniBench领先 |
| 成本优势 |
API输入每百万Token低至0.8元,部署成本低 |
成本较Qwen2.5降低40% |
端侧部署成本低,适配移动端 |
| 核心场景 |
复杂推理、视觉智能体、长视频分析、企业级多模态 |
通用推理、代码开发、中型企业应用 |
端侧应用、全模态交互、轻量办公 |
四、关键差异总结(代际演进)
1. Qwen 3.5 vs Qwen 3
- 架构升级:新增GDN门控线性注意力,稀疏率从9%降至5%,效率再提升3倍以上
- 多模态革新:从后期Adapter融合升级为原生Early Fusion,视频支持从分钟级扩展至2小时,新增视觉智能体能力
- 能力边界:语言覆盖从119种增至201种,上下文长度扩展至1M,推理性能全面超越Qwen3-Max
- 开源生态:全系列同步开源,新增多模态专用版,适配更多本地推理工具
2. Qwen 3 vs Qwen 2.5
- 架构突破:从纯稠密架构升级为MoE稀疏架构,首次实现“高总参、低激活”,效率大幅提升
- 能力跃迁:小模型(如Qwen3-4B)性能超越Qwen2.5-7B,旗舰模型对标国际闭源第一梯队
- 多模态:从全模态端侧适配,升级为多模态深度理解,支持更复杂的图文推理
- 开源:全系列采用Apache 2.0开源,覆盖MoE与稠密全谱系,开发者生态更完善
3. Qwen 3.5 vs Qwen 2.5
- 代际差距:架构从稠密→MoE+GDN,模态从后期融合→原生Early Fusion,效率从全激活→低激活高吞吐
- 能力维度:语言、多模态、推理、智能体能力全面跃升,综合性能接近GPT-5.2、Gemini 3 Pro
- 应用场景:从端侧轻量应用,扩展至企业级复杂推理、视觉智能体、长视频处理等高端场景
五、总结
Qwen 3.5 作为Qwen系列的最新一代,以2026年2月16日全系列开源为起点,通过MoE稀疏架构+GDN门控注意力+原生多模态的组合,实现了“能力、效率、成本”的三重突破。相比Qwen 3,其效率与多模态能力大幅升级;相比Qwen 2.5,完成了从稠密到稀疏、从基础多模态到原生融合的代际跨越,成为当前开源生态中性能与实用性兼具的旗舰基座,适配从科研到生产的全场景落地。http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837