[咨询] 如何签署网络服务有效性条款SLA 服务监控网站搜集


博客大巴最近的机房续约,机房搬迁和CDN的协议中,都遇到了下服务有效性条款的服务级别协议(Service Level Agreement, SLA)问题。在之前的很多服务合同中,国内的IDC大多是这样定义的: 服务中断1个小时,赔偿2倍时间的服务。这样计算:一个月下来如果网络陆陆续续中断了15天,才赔一个月的服务? 比较一下国外相应服务的条款:
Nirvanix的SLA条款
Amazon S3服务的SLA条款

服务有效时间百分比每自然月 下月服务补偿百分比
大于等于99%同时小于99.9% 10%
低于99% 25%

另外一个问题就是监控的依据:
无论是基于服务商还是基于客户自身,都有一定问题。国内也不知道哪里有比较低成本的监控服务,而监控的细节就更成问题了,还有基于南北电信/网通部署不同的监控点等问题。

更新:2008-08-29
经过1个月的整理,机房的监控主要需要2个方面,即时统计和详细截取;
1 即时监控:主要的目的是用于确定事故的起始点和报警,这方面我们参考了山寨科学家叽歪监控, 配合Nagios的E-Mail alert发送到手机邮箱报警,时间可以精确到2分钟,这时候Nagios的Cacti统计也有助于从宏观发现事故的特点和原因;
2 细节截取:出现问题的时候,还需要一个详细的事故数据,需要分析当时各个地区的ping tracerout情况等,结合基调网络的多点统计报表,这类统计成本较高,对即时性要求可以低一些;

大家都是怎么解决的? 请指教。

目前搜集到的一些监控网站和功能:
http://www.uptime.com.cn/ 有超时报警(免费1个域名);
http://17cdn.com/ 有分省,分服务商和按时间的CDN统计功能(3个域名)

国外的:
试用过iptonic:
http://site24x7.com
http://internetsupervision.com/: 免费15天,之后会降低监控频率到1天一次;
http://www.gomez.com/
WebPerform: 有中文版

最后选定是:基调网络的带宽检测服务

作者:车东 发表于:2008-06-13 22:06 最后更新于:2008-08-29 16:08
版权声明:可以转载,转载时请务必以超链接形式标明文章 的原始出处和作者信息及本版权声明

Comments

我的经验是这样:
自已在服务器端安装比如
nagios单机监控图形工具
,并编写辅助的通知函数到mail,sms,im。有了日志就有了提示,可以方便知道服务器到底断了多长时间。
如果再细一点,发送的邮件信息,可以使用脚本作定期的汇总出报表,这个各家需求不一样,需要定制。IDC方面,一般都会配有监控,他们对中断时间都会很清楚,但不会告知用户的可能性很大。就北京而言。

提供国内商业服务第一名的当属基调网络,我们用的就是他们的服务,特别是CDN监测,非常准确。

Gomez啥呀,数据太不准确了,而且服务器在美国,碰到重要事件访问都访问不了,自己的网站都监测不了,还监控别人的呢。

目前比较小的网站基本用不起国外的监测服务,价格比较贵。

国外有名的监测厂商有keynote(www.keynote.com)和gomez(www.gomez.com) 但他们在中国的监测点都比较少。

国内有基调网络(www.networkbench.com),发展迅速,是新浪 腾讯 人民网等网站的监控服务商。

如果自己各地有服务器,可以自己写一些脚本,安装到几个服务器上,我目前就是自己写脚本,然后通过飞信免费发短信来监测

还有博睿www.bonree.com在监测细节上做的绝对行业领先,而且公司布点也是最广的。分布在全国各个省会城市以及二级城市都有监测节点。

那个博睿啊,监测不稳定,通过病毒木马来安装自己的软件。我的机器就中过它的病毒。

发表一个评论

(如果你此前从未在此 Blog 上发表过评论,则你的评论必须在 Blog 主人验证后才能显示,请你耐心等候。)

相关文章

关于

此页面包含了发表于2008年06月13日 晚上10时15分的 Blog 上的单篇日记。

此 Blog 的前一篇日记是 山寨技术交流会: 博客大巴 / VeryCD / 客齐集 / 联络家 / CDNUnion

此 Blog 的后一篇日记是 Google Reader的好友推荐分享: Blog内容缓释

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36