[咨询] 如何签署网络服务有效性条款SLA 服务监控网站搜集
在博客大巴最近的机房续约,机房搬迁和CDN的协议中,都遇到了下服务有效性条款的服务级别协议(Service Level Agreement, SLA)问题。在之前的很多服务合同中,国内的IDC大多是这样定义的: 服务中断1个小时,赔偿2倍时间的服务。这样计算:一个月下来如果网络陆陆续续中断了15天,才赔一个月的服务? 比较一下国外相应服务的条款:
Nirvanix的SLA条款
Amazon S3服务的SLA条款
服务有效时间百分比每自然月 下月服务补偿百分比
大于等于99%同时小于99.9% 10%
低于99% 25%
另外一个问题就是监控的依据:
无论是基于服务商还是基于客户自身,都有一定问题。国内也不知道哪里有比较低成本的监控服务,而监控的细节就更成问题了,还有基于南北电信/网通部署不同的监控点等问题。
更新:2008-08-29
经过1个月的整理,机房的监控主要需要2个方面,即时统计和详细截取;
1 即时监控:主要的目的是用于确定事故的起始点和报警,这方面我们参考了山寨科学家的叽歪监控, 配合Nagios的E-Mail alert发送到手机邮箱报警,时间可以精确到2分钟,这时候Nagios的Cacti统计也有助于从宏观发现事故的特点和原因;
2 细节截取:出现问题的时候,还需要一个详细的事故数据,需要分析当时各个地区的ping tracerout情况等,结合基调网络的多点统计报表,这类统计成本较高,对即时性要求可以低一些;