性能扩展问题要趁早DBA notes » Che, Dong's shared items in Google Reader

作者:Fenng 发布在 dbanotes.net.

与国内的 Web 2.0 Startup 技术人员相比,国外技术人员更乐于分享。分享也是一种更好的宣传手段,如果不是看到了这篇 Scaling an early stage startup, 或许我就不会知道这位 Mark Maunder (他还有个中文名字:马孟德) 以及他的 FeedJet

一般来说,一个刚刚发布的 Web 应用,因为用户量并不多,性能问题可能并不是很明显。可一旦宣传展开,用户增长或许不是线性的而是暴增(从几十个到几万个,相比之下怎不是暴增?),这时候如果遇到性能问题,毫无疑问会影响初期用户的信任。

Maunder 文档中列举了一个扩展过程,相信这些例子也是他实际遇到的。毕竟 Startup 都是一两个人打通关,不可能所有技术都面面俱到的精通。下面记录一点。

错误的设置

数据库服务器的参数配置问题:导致 MySQL 消耗了大量资源。Apache Keepalive 的设置为不合理,修改为 off。我想这个前提应该还是要选择自己最擅长的技术路线。如果错误的选择另一条不熟悉的技术路线,那么遇到技术时解决问题的速度怕是更让用户恼火。对于 Apache 还应该知道 Httpd.Worker 比 Prefork 消耗更多内存 (httperf 来进行 Benchmark) ,内存也是蛮贵的。

尽可能的缓存动态内容

尽可能的利用数据库的 Cache,利用其他 Cache 工具,如 MemCacheD,来减轻对磁盘的 IO 压力。为了节省成本,很多站点都是用的低速大容量的磁盘,所以,充分利用 Cache 是一个网站成功的必然条件。这样的软件BerkeleyDB 的最高事务处理记录是 90000 事务/秒。

剥离图片与CSS 到单独的服务器

说白了,也是为了减轻磁盘的压力。现在很多 Web 2.0 站点都把图片放到 Amazon S3 上,省心了不少。当然,国内还没这样的服务。

阻止内容引用"窃贼"

现在连那些大站点都在阻止图片被第三方引用,小站点更要提防被大站引用,很容易耗光网站的容量。另外一个要注意的是网络爬虫的频率。

在线观看这篇 Scaling an early stage startup。顺便说一下,最近在 Scribd 上看到了不少有意思的文档。

--EOF--

相关文章|Related Articles

评论数量(2)|Add Comments

本文网址:http://www.dbanotes.net/arch/scaling_an_early_stage_startup.html

17:40 Blogger即将支持OpenID » WebLeOn's Blog
Blogger in Draft的官方Blog上刚刚宣布,Draft版本的Blogger已经开始支持使用OpenID登录来添加评论。而在此之前,Blogger仅仅允许使用Google ID或者以匿名的方式对Blog Post发表评论。


Google目前仅仅把这项功能添加到了测试版本的Blogger,也就是Blogger in Draft中。他们希望作更多的测试,并听取用户对这个功能的意见。不过我想OpenID已经经历了很多网站较长时间的考验,在安全、功能以及用户的接受程度上应该是不会有太多的问题。

所以我们应该在不久的将来就可以看到这个功能被一直到Blogger的主站,到时候我这个Blog当然也将会支持这个新的功能。而我更加关心的,还是Blogger的InPage Comment,这个我期待了好多年的功能,不知道什么时候能上线。

^==Back Home: www.chedong.com

^==Back Digest Home: www.chedong.com/digest/

<== 2007-11-30
  十二月 2007  
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
==> 2007-12-02