截至 2025 年 12 月,阿里巴巴通义千问(Qwen)团队已开源 Qwen3 系列共 12 款模型,涵盖 纯语言(Dense/MoE)、多模态、安全、语音、代码、检索 等多个方向。以下是完整汇总表格,并附各模型简要概述:
✅ Qwen3 全系列开源模型总览表
| 模型名称 | 类型 | 参数规模 | 主要能力 | 开源状态 | 适用场景 |
|---|---|---|---|---|---|
| Qwen3-0.6B | Dense LLM | 0.6B | 基础文本生成、对话 | ✅ 开源(Apache 2.0) | 手机端、嵌入式设备 |
| Qwen3-1.7B | Dense LLM | 1.7B | 轻量级通用任务 | ✅ 开源 | 边缘计算、教育应用 |
| Qwen3-4B | Dense LLM | 4B | 对话、简单编程 | ✅ 开源 | 本地开发、小型服务 |
| Qwen3-8B | Dense LLM | 8B | 代码/数学/多语言 | ✅ 开源 | 开发者日常使用 |
| Qwen3-14B | Dense LLM | 14B | 高性能通用推理 | ✅ 开源 | 企业级部署 |
| Qwen3-32B | Dense LLM | 32B | 强大综合能力 | ✅ 开源 | 替代旧版 72B 模型 |
| Qwen3-30B-A3B | MoE LLM | 总 30B / 激活 ~3B | 高效复杂推理 | ✅ 开源 | 平衡成本与性能 |
| Qwen3-235B-A22B | MoE LLM | 总 235B / 激活 ~22B | 顶级语言理解 | ✅ 开源 | 科研、高阶任务 |
| Qwen3-Omni-30B-A3B | 全模态 MoE | 总 ~35B / 激活 ~3B | 文本+图像+音频+视频端到端理解与生成 | ✅ 开源 | 多模态智能体、音视频助手 |
| Qwen3-VL-235B-A22B | 视觉语言(VL) | 总 235B / 激活 ~22B | 图像/视频理解、OCR、VQA、空间推理 | ✅ 开源 | 视觉问答、文档分析、机器人视觉 |
| Qwen3-Embedding | 文本表征模型 | - | 高质量向量嵌入(支持 119 语言) | ✅ 开源 | 语义搜索、RAG |
| Qwen3-Reranker | 排序模型 | - | 精准重排序(提升检索精度) | ✅ 开源 | 搜索引擎后处理 |
✅ 所有模型均采用 宽松开源协议(如 Apache 2.0),可免费商用,支持 Hugging Face、ModelScope 等平台下载。
📌 各类模型详细概述
🔹 1. 纯语言模型(8 款)
- 包含 6 款 Dense + 2 款 MoE。
- 支持 混合推理模式:通过
/think或enable_thinking=True切换“深思”与“快答”。 - 训练数据达 36 万亿 tokens,覆盖 119 种语言和大量代码/教科书。
- 小模型性能惊人:Qwen3-4B ≈ Qwen2.5-72B;Qwen3-30B-A3B 可在消费级 GPU 运行。
🔹 2. 全模态模型:Qwen3-Omni
- 全球首个开源的端到端全模态大模型,支持:
- 输入:文本、图像、音频(19 种语言)、视频
- 输出:文本 + 语音(10 种语言)
- 延迟低至 211ms(音频流式响应)
- 提供 Instruct / Thinking / Captioner 三个子版本
- 适用于 智能客服、会议转录、无障碍交互 等场景
🔹 3. 视觉语言模型:Qwen3-VL
- 基于 Interleaved-MRoPE + DeepStack + 时间戳对齐 三大技术创新
- 支持 长视频理解(4K/60fps)、2D/3D Grounding、图表解析
- 在 MLVU(84.3)、RealWorldQA(89.7) 等基准超越 Gemini 2.5 Pro
- 提供 Instruct(轻量) 和 Thinking(深度推理) 两个版本
🔹 4. 检索增强模型(2 款)
- Qwen3-Embedding:生成高质量语义向量,支持多语言文本检索
- Qwen3-Reranker:对候选结果进行精排,显著提升 RAG 系统准确率
- 二者常配合使用,构成 高效检索流水线
🌐 获取方式
- Hugging Face:https://huggingface.co/Qwen
- ModelScope(魔搭):https://modelscope.cn/models/qwen
- GitHub:https://github.com/QwenLM/Qwen3
💡 小结
Qwen3 已构建 完整的开源 AI 基础设施栈:
- 语言层:从 0.6B 到 235B 全覆盖
- 多模态层:Omni(全模态) + VL(视觉语言)双轨并进
- 应用层:Embedding + Reranker 支撑 RAG,Coder 支撑编程(虽未列但 Qwen3-Coder 也已开源)
这标志着 Qwen3 不仅是“最强开源语言模型”,更是 首个覆盖“语言+视觉+语音+检索”的全栈开源大模型家族。



