阿里巴巴旗下平头哥半导体(T-Head Semiconductor)推出的 PPU(Parallel Processing Unit)芯片 是其面向大模型时代的自研AI加速器,标志着阿里在“算力自主可控”战略上的关键突破。http://www.cndba.cn/dave/article/131795http://www.cndba.cn/dave/article/131795http://www.cndba.cn/dave/article/131795
http://www.cndba.cn/dave/article/131795
http://www.cndba.cn/dave/article/131795
一、阿里PPU芯片详细介绍
1. 基本定位
- 类型:专用AI加速芯片(非传统GPU,但功能对标NVIDIA H20/A800)
- 目标场景:大模型推理为主,兼顾中小规模训练;覆盖云端与边缘智算中心
- 研发主体:平头哥半导体(阿里达摩院孵化)
- 首次公开曝光:2025年9月央视《新闻联播》报道中国联通三江源智算中心项目
2. 核心参数(据央视及官方披露)
| 项目 |
参数 |
| 制程工艺 |
国产7nm(由中芯国际代工)+ 2.5D先进封装 |
| 显存容量 |
96GB HBM2e |
| 显存带宽 |
700 GB/s |
| PCIe接口 |
PCIe 5.0 ×16 |
| 功耗(TDP) |
400W |
| FP16算力 |
≈120 TFLOPS(基础版,侧重推理)高级版未完全公开,推测接近200 TFLOPS |
| 生态兼容性 |
兼容CUDA生态,支持PyTorch/TensorFlow等主流框架平滑迁移 |
| 互联技术 |
自研高速片间互联(速率对标NVLink,但未命名) |
3. 技术亮点
- 混合架构设计:结合定制计算单元与通用张量核心,优化Transformer类模型计算。
- 高显存配置:96GB HBM2e 显存可支持千亿参数模型单卡推理或大batch训练。
- 低迁移成本:通过软件层模拟CUDA API,大幅降低开发者从英伟达切换的门槛。
- 全栈协同:与阿里云、通义大模型(Qwen)、PAI平台深度集成,形成“芯片–模型–云”闭环。
4. 商业部署
- 已用于阿里云内部AI服务(如通义千问推理、视频生成等)
- 对外落地于中国联通三江源绿电智算中心(单项目部署16,384张PPU卡,总算力1945P)
- 推动阿里云AI实例价格下降约50%,提升国产算力性价比
二、与华为昇腾910B对比
| 维度 |
阿里 PPU |
华为 昇腾910B |
| 发布时间 |
2025年(正式商用) |
2023年底量产,2024年大规模交付 |
| 制程工艺 |
中芯国际7nm |
中芯国际N+2(≈7nm),良率早期仅40%(2025年初提升) |
| FP16峰值算力 |
~120 TFLOPS(推理优化) |
256–376 TFLOPS(官方数据,训练导向) |
| INT8算力 |
未公开 |
512–640 TOPS |
| 显存容量 |
96GB HBM2e |
64GB HBM2e |
| 内存带宽 |
700 GB/s |
392–400 GB/s |
| 功耗 |
400W |
310–350W |
| 软件生态 |
兼容CUDA,支持主流AI框架无缝迁移 |
自研CANN + MindSpore,需重写或适配模型 |
| 互联能力 |
片间带宽700 GB/s(集群扩展性强) |
HCCS互联,带宽约392 GB/s |
| 典型客户 |
阿里云、中国联通、部分政企 |
政务云、车企(如比亚迪)、国家超算中心 |
| 战略路径 |
“兼容替代”:快速切入现有生态 |
“自主闭环”:构建全栈信创体系 |
三、关键差异分析
✅ 阿里PPU优势:
- 显存更大、带宽更高 → 更适合长上下文、大batch推理(如AIGC、视频生成)
- 生态友好 → 开发者无需重写代码,迁移成本极低
- 成本更低 → 据招银国际测算,BOM成本比H20低40%,推动云服务降价
✅ 华为昇腾910B优势:
- 理论算力更强 → 在纯训练任务中吞吐量更高
- 全栈优化深 → 芯片+编译器+CANN+MindSpore协同调优,系统效率高
- 信创首选 → 在政务、国防、电力等强安全要求领域占主导
四、总结:不是谁“更强”,而是“谁更适合”
| 场景 |
推荐选择 |
| 互联网公司、AI创业公司、需要快速上线模型 |
阿里PPU(生态兼容、部署快) |
| 政府、国企、对安全可控有强制要求 |
华为昇腾910B(全栈国产、信创认证) |
| 极致训练性能(如千亿模型预训练) |
目前仍依赖英伟达H100/H20,国产尚在追赶 |
| 高性价比推理(如客服机器人、内容审核) |
PPU更具成本优势 |
💡 正如行业观察所言:“英伟达是瑞士军刀,国产芯片正在打造手术刀。”
阿里PPU和华为昇腾910B代表了中国AI芯片两条不同但互补的突围路径——开放兼容 vs 自主闭环。
http://www.cndba.cn/dave/article/131795
http://www.cndba.cn/dave/article/131795http://www.cndba.cn/dave/article/131795
http://www.cndba.cn/dave/article/131795
http://www.cndba.cn/dave/article/131795