22:50 monit: 系统服务的监控/重启 » del.icio.us/chedong
配置实例: You are welcome to cut & paste configuration into your own monitrc control file. NB! please check and edit as needed, some ip-addresses and paths mentioned here may or will differ from your system.
19:57 网速测试软件:SpeedTest mini脚本 » 车东[Blog^2]

speedtest.net/mini.php这里有个SpeedTest:网络宽带速度测试软件工具可以下载。解包后,将index-php.html命名成index.php就可以测试了:
http://www.chedong.com/speedtest/,感兴趣的话请运行一下,并通过留言告诉我你的所在地,ISP服务商(电信/网通,拨号还是ADSL)和测试的下载/上传速度数值,谢谢。

WikiPedia 技术架构学习分享DBA notes » Che, Dong's shared items in Google Reader

&copy作者:Fenng 发布在 dbanotes.net

维基百科(WikiPedia.org)位列世界十大网站,目前排名第八位。这是开放的力量。

来点直接的数据:

架构示意图如下:
WikiPedia_arch.png Copy @Mark Bergsma

GeoDNS

在我写的这些网站架构的 Blog 中,GeoDNS 第一次出现,这东西是啥? "A 40-line patch for BIND to add geographical filters support to the existent views in BIND", 把用户带到最近的服务器。GeoDNS 在 WikiPedia 架构中担当重任当然是由 WikiPedia 的内容性质决定的--面向各个国家,各个地域。

负载均衡:LVS

WikiPedia 用 LVS 做负载均衡, 是章文嵩博士发起的项目,也算中国人为数不多的在开源领域的骄傲啦。LVS 维护的一个老问题就是监控了,维基百科的技术人员用的是 pybal.

图片服务器:Lighttpd

Lighttpd 现在成了准标准图片服务器配置了。不多说。

Wiki 软件: MediaWiki

对 MediaWiki 的应用层优化细化得快到极致了。用开销相对比较小的方法定位代码热点,参见实时性能报告,瓶颈在哪里,看这样的图树展示一目了然。另外一个十分值得重视的经验是,尽可能抛弃复杂的算法、代价昂贵的查询,以及可能带来过度开销的 MediaWiki 特性。

Cache! Cache! Cache!

维基百科网站成功的第一关键要素就是 Cache 了。CDN(其实也算是 Cache) 做内容分发到不同的大洲、Squid 作为反向代理. 数据库 Cache 用 Memcached,30 台,每台 2G 。对所有可能的数据尽可能的Cache,但他们也提醒了 Cache 的开销并非永远都是最小的,尽可能使用,但不能过度使用。

数据库: MySQL

MediaWiki 用的DB 是 MySQL. MySQL 在 Web 2.0 技术上的常见的一些扩展方案他们也在使用。 复制、读写分离......应用在 DB 上的负载均衡通过 LoadBalancer.php 来做到的,可以给我们一个很好的参考。

运营这样的站点,WikiPedia 每年的开支是 200 万美元,技术人员只有 6 个,惊人的高效。

参考文档:

Wikimedia architecture (PDF)
Todd Hoff 的文章

--EOF--

相关文章|Related Articles

评论数量(1)|Add Comments

本文网址:http://www.dbanotes.net/opensource/wikipedia_arch.html

我无法访问的国外优秀网站月光博客 » Che, Dong's shared items in Google Reader

  今天发现一个奇怪的现象,就是blogspot和googlepages都可以直接正常访问了,联系到前几天youtube的正常,不禁令人浮想联翩,希望未来能有更多的国外优秀网站能够从中国访问,当然,目前还有很多国外的优秀的Web 2.0网站服务还是经常断断续续无法访问的,这里我就总结一下经常无法访问的国外优秀网站列表。

  Google Blogger (测试地址) - Google于2003年收购的免费博客(网志)服务,用户使用这个服务可以不用安装任何软件程序,就可以直接轻松地建立、发布、维护Blog。不过这个优秀的服务在中国不能访问的时间远远多于能访问的时间。

  Google Pages Creator测试地址) - Google于2006年2月推出的一个免费网页寄存服务,可以免费网里面放静态页面和图片,还可以在线进行网页编辑,不通HTML的人也可以使用这个服务轻松创建自己的网页,不过国内好多人使用Google Pages Creator存储一些网站图标或徽标以节省自己的带宽,这个服务在国内也经常无法访问。

  FeedBurner测试地址) - FeedBurner是一个2004年建立的RSS Feed管理服务商,为博客作者提供定制的RSS托管和管理服务,并提供统计分析和广告服务,FeedBurner很快就成为世界上最大的Feed(订阅)托管服务商,并于2007年5月被Google以1亿美元现金收购。2007年8月,FeedBurner所烧录的Feed地址在中国无法访问了

  YouTube测试地址) - YouTube是于2005年2月建立的一个视频分享网站,用户可以轻松上传和分享自己的录像片段,视频片段可以轻松放入个人Blog和其它网站,很快YouTube就成为世界上最大的视频共享网站,并于2006年10月被Google以十六点五亿美元收购。在YouTube发布繁体中文版的时候,YouTube在国内无法访问了两个星期之后又可以访问了

  Flickr测试地址) - Flickr是一个2002年成立的照片图片分享网站,用户可以上传和分享自己的数码照片,照片可以很简单的被Blog等网站引用,经过几年的发展,Flickr逐步成为世界最大的照片分享网站,并于2005年3月被美国雅虎公司收购。2007年6月,Flickr的图片无法从中国访问

  Wikipedia测试地址) - 维基百科(Wikipedia)是一个基于wiki技术的多语言的百科全书,其目标及宗旨是为世界提供自由的百科全书,让世界人民用自己的语言自己创作一个全世界最大的知识宝库,这个知识宝库的中文版2005年无法从中国访问,之后英文版的维基百科全书也遭到了同样的命运。

  WordPress测试地址) - WordPress是一种使用PHP语言和MySQL数据库开发的博客(Blog)系统,由于其功能强大,插件众多,易于安装、维护和使用,因此WordPress已经成为主流的Blog搭建平台。WordPress提供了免费的博客空间供没有主机的用户使用,这个空间在发布不久后即无法从中国访问。

  My Opera测试地址) - Opera是一个快速且易用的网络浏览器,MyOpera则是由Opera公司营运的免费博客和相册服务。自2007年5月后无法从国内访问。




《我无法访问的国外优秀网站》的相关评论留言

相关文章


^==Back Home: www.chedong.com

^==Back Digest Home: www.chedong.com/digest/

<== 2007-11-03
  十一月 2007  
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    
==> 2007-11-05