签到成功

知道了

CNDBA社区CNDBA社区

qwen 3.5 开源 大模型 说明

2026-02-25 09:15 861 0 转载 大模型
作者: dave

一、核心基础信息

1. 发布与开源详情

  • 正式发布/开源时间2026年2月16日(除夕)
  • 首发旗舰型号Qwen 3.5-397B-A17B(Qwen 3.5-Plus)
  • 开源协议Apache 2.0(完全宽松,支持免费商用、二次开发、修改分发)
  • 开源范围:全系列模型权重、推理代码、训练框架、多模态工具、API示例;覆盖MoE旗舰、稠密中小模型、多模态专用版
  • 获取渠道:魔搭社区、Hugging Face、GitHub、阿里云百炼平台同步上线

2. 核心架构与参数

  • 旗舰架构MoE稀疏专家+Gated Delta Networks(GDN)门控线性注意力
    • 总参3970亿,单次推理仅激活170亿(约5%),显存占用降低60%,32k上下文吞吐量较Qwen3提升8.6倍
    • GDN替代部分Softmax Attention,长序列复杂度从O(n²)降至O(n),推理效率大幅提升
  • 多模态原生Early Fusion(预训练阶段融合文本/图像/视频Token,非后期拼接)
  • 上下文长度:基础32k,可扩展至256k/1M
  • 语言覆盖:201种语言/方言,词表25万,小语种编码效率提升60%

二、Qwen 3.5 全系列版本(含开源状态)

型号 参数规模 架构 模态 开源状态 核心定位
Qwen 3.5-397B-A17B 397B总/17B激活 MoE 文本/图像/视频 ✅ 开源 旗舰,复杂推理、智能体、多模态
Qwen 3.5-72B 72B 稠密 文本/图像 ✅ 开源 企业级通用、代码开发
Qwen 3.5-14B 14B 稠密 文本/图像 ✅ 开源 中端部署、边缘场景
Qwen 3.5-7B 7B 稠密 文本/图像 ✅ 开源 轻量应用、移动端
Qwen 3.5-VL 对应规模 稠密/MoE 多模态专用 ✅ 开源 图像分析、视频理解

三、与 Qwen 3、Qwen 2.5 核心对比(全方位维度)

1. 基础信息对比

维度 Qwen 3.5 Qwen 3 Qwen 2.5
发布时间 2026年2月16日 2025年4月29日 2025年3月28日
旗舰型号 397B-A17B(MoE) 235B-A22B(MoE) 72B(稠密)
开源协议 Apache 2.0(全系列) Apache 2.0(全系列) Apache 2.0(全系列)
开源范围 MoE旗舰+稠密全系列+多模态专用 MoE旗舰+稠密全系列 稠密全系列+全模态专用(Omni)
核心架构 MoE+GDN门控线性注意力 MoE+标准注意力 稠密+Thinker-Talker双核
激活策略 低激活(17B/397B,约5%) 低激活(22B/235B,约9%) 全参数激活

2. 能力与效率对比

维度 Qwen 3.5 Qwen 3 Qwen 2.5
多模态 原生Early Fusion,支持2小时视频、GUI交互、视觉智能体 后期Adapter融合,图像/视频基础理解 全模态(文本/图像/音频/视频),端侧适配
上下文长度 32k(基础)/256k/1M 32k(基础)/128k 32k(基础)/64k
语言覆盖 201种语言/方言 119种语言/方言 90+种语言/方言
推理效率 32k吞吐量较Qwen3提升8.6倍,显存降60% 较Qwen2.5提升3-5倍 基础稠密模型效率
编程能力 复杂算法、视觉编程、代码调试,对标GPT-5.2 代码生成、调试,接近Gemini 2.5 Pro 基础代码生成、轻量开发
智能体能力 原生MCP协议、工具调用、UI自动化 基础工具调用、简单Agent 基础Agent、轻量自动化

3. 性能与应用对比

维度 Qwen 3.5 Qwen 3 Qwen 2.5
基准表现 MMLU-Pro 89.8、数学推理、多模态SOTA MMLU-Pro 89.5、代码能力突出 全模态评测OmniBench领先
成本优势 API输入每百万Token低至0.8元,部署成本低 成本较Qwen2.5降低40% 端侧部署成本低,适配移动端
核心场景 复杂推理、视觉智能体、长视频分析、企业级多模态 通用推理、代码开发、中型企业应用 端侧应用、全模态交互、轻量办公

四、关键差异总结(代际演进)

1. Qwen 3.5 vs Qwen 3

  • 架构升级:新增GDN门控线性注意力,稀疏率从9%降至5%,效率再提升3倍以上
  • 多模态革新:从后期Adapter融合升级为原生Early Fusion,视频支持从分钟级扩展至2小时,新增视觉智能体能力
  • 能力边界:语言覆盖从119种增至201种,上下文长度扩展至1M,推理性能全面超越Qwen3-Max
  • 开源生态:全系列同步开源,新增多模态专用版,适配更多本地推理工具

2. Qwen 3 vs Qwen 2.5

  • 架构突破:从纯稠密架构升级为MoE稀疏架构,首次实现“高总参、低激活”,效率大幅提升
  • 能力跃迁:小模型(如Qwen3-4B)性能超越Qwen2.5-7B,旗舰模型对标国际闭源第一梯队
  • 多模态:从全模态端侧适配,升级为多模态深度理解,支持更复杂的图文推理
  • 开源:全系列采用Apache 2.0开源,覆盖MoE与稠密全谱系,开发者生态更完善

3. Qwen 3.5 vs Qwen 2.5

  • 代际差距:架构从稠密→MoE+GDN,模态从后期融合→原生Early Fusion,效率从全激活→低激活高吞吐
  • 能力维度:语言、多模态、推理、智能体能力全面跃升,综合性能接近GPT-5.2、Gemini 3 Pro
  • 应用场景:从端侧轻量应用,扩展至企业级复杂推理、视觉智能体、长视频处理等高端场景

五、总结

Qwen 3.5 作为Qwen系列的最新一代,以2026年2月16日全系列开源为起点,通过MoE稀疏架构+GDN门控注意力+原生多模态的组合,实现了“能力、效率、成本”的三重突破。相比Qwen 3,其效率与多模态能力大幅升级;相比Qwen 2.5,完成了从稠密到稀疏、从基础多模态到原生融合的代际跨越,成为当前开源生态中性能与实用性兼具的旗舰基座,适配从科研到生产的全场景落地。http://www.cndba.cn/cndba/dave/article/131837

http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837
http://www.cndba.cn/cndba/dave/article/131837

用户评论
* 以下用户言论只代表其个人观点,不代表CNDBA社区的观点或立场
dave

dave

关注

人的一生应该是这样度过的:当他回首往事的时候,他不会因为虚度年华而悔恨,也不会因为碌碌无为而羞耻;这样,在临死的时候,他就能够说:“我的整个生命和全部精力,都已经献给世界上最壮丽的事业....."

  • 2297
    原创
  • 3
    翻译
  • 729
    转载
  • 201
    评论
  • 访问:10510088次
  • 积分:4627
  • 等级:核心会员
  • 排名:第1名
精华文章
    热门文章
      Copyright © 2016 All Rights Reserved. Powered by CNDBA · 皖ICP备2022006297号-1·

      AI QQ群