截至 2026 年,主流商用智能体开发平台(Agent Development Platform)的 SLA(服务等级协议) 通常聚焦于 平台核心服务的可用性,如控制台、API 网关、推理引擎、工作流调度器等。由于智能体平台属于新兴 PaaS 产品,其 SLA 标准尚未完全统一,但头部厂商已形成较为一致的行业实践。
一、主流商用智能体平台 SLA 水平(公开信息汇总)
| 厂商 / 平台 | 公开 SLA 承诺 | 部署模式 | 备注 |
|---|---|---|---|
| 腾讯云智能体平台 | 99.95% | 公有云 / 专有云 | 金融级高可用架构,支持多 AZ 部署 |
| 阿里云百炼(Bailian) | 99.9% | 公有云 / 私有化 | 依赖 PAI 底座,SLA 与模型推理服务绑定 |
| 百度智能云千帆 Agent 平台 | 99.9% | 公有云 | 明确在 SLA 协议中定义“失败请求”与赔偿机制 |
| Dify(企业版 SaaS) | 99.5%(未写入合同) | SaaS / 私有部署 | 社区反馈实际可用性约 99.3%~99.7%,企业版可协商更高 SLA |
| Coze(字节跳动) | 无正式 SLA | SaaS | 免费/标准版不承诺可用性,仅适合非关键业务 |
| Kymo AI / FastGPT Pro | 可定制(99.9% 起) | 私有化为主 | 通过合同约定,常用于政企项目 |
✅ 行业共识:
- 公有云 SaaS 版本:普遍承诺 99.9%(三个 9)
- 金融/政务级私有化或专属云:可达成 99.95% ~ 99.99%(三个半到四个 9)
- 免费或社区版:无 SLA 保障
二、SLA 条款示例(可直接用于合同或服务协议)
以下为符合行业惯例、具备法律可执行性的 智能体平台 SLA 条款示例,适用于企业客户采购场景:
服务等级协议(SLA)示例条款
1. 定义
- “服务”:指厂商提供的智能体开发平台核心功能,包括但不限于:
- Web 控制台访问
- 智能体创建、调试、发布 API
- 工作流引擎调度服务
- 内置工具调用网关(如 RAG、数据库连接器)
- “服务周期”:一个自然月。
- “不可用时间”:指在服务周期内,客户无法成功调用上述服务且错误由厂商基础设施故障导致的连续时间(以分钟计)。计划内维护(提前 48 小时通知)不计入。
2. 可用性承诺
厂商承诺,在每个服务周期内,服务的月度可用性不低于 99.9%。
计算公式:
可用性 = (总分钟数 - 不可用时间) / 总分钟数 × 100%
(注:一个月按 43,200 分钟计算,99.9% ≈ 允许宕机 ≤ 43.2 分钟)
3. 赔偿机制
若月度可用性未达到承诺标准,客户可在次月第 5 个工作日起 30 日内 提交赔偿申请。赔偿以 服务抵扣券(Service Credit) 形式发放,比例如下:
| 月度实际可用性 | 赔偿比例(当月服务费用) |
|---|---|
| ≥ 99.9% | 无赔偿 |
| < 99.9% 且 ≥ 99.0% | 10% |
| < 99.0% 且 ≥ 95.0% | 25% |
| < 95.0% | 50% |
注:单月赔偿总额不超过当月服务费用的 50%;抵扣券仅可用于续订本平台服务。
4. 免责情形
以下情况不视为服务不可用,不触发赔偿:
- 客户侧网络、设备或配置问题;
- 第三方服务(如大模型 API、短信服务、客户自有数据库)故障;
- 客户未按文档规范使用平台(如超频调用、非法 payload);
- 不可抗力(如地震、战争、政府行为);
- 厂商提前通知的计划内维护窗口。
三、给客户的建议
- 优先选择明确写入合同的 SLA:口头承诺无效,必须体现在《服务协议》附件中。
- 区分“平台可用性”与“智能体效果稳定性”:SLA 通常只保“系统能用”,不保“输出正确”。
- 私有化部署可谈判更高 SLA:如要求 99.95%,需配套冗余架构(双活、自动 failover)。
- 监控自身调用链:建议集成 Prometheus + Grafana 或云厂商 APM 工具,留存可用性数据。






