Internet Archive(IA) 这个站点大家应该都不陌生。IA 旨在建立所有互联网站点的"档案库",如果说 Google 是互联网的数据库的话,那么 IA 就是互联网的数据仓库了,定期对每个 Web 页面保存快照,数据量之大可想而知。
先看看 IA 每天需要面对的处理能力:
存储超过 850 亿个 Web 页面;
每天大约 600 万次的下载;
Wayback Machine 收到大约 1000 万次点击,每秒钟要处理 100-200 个点击;
每天10万次左右通过 URL 查找;
每天 400 万次返回请求;
存储的内容包括本文、音频、视频...等各种 Web 可见的格式。
显然 IA 需要的是一种前所未有的存储解决解决方案--廉价、可靠、低功耗...总之用起来要省钱。IA 的志愿者不得不考虑自己动手建立符合他们需要的存储系统,这下子可不简单,2004 年,第一个 100GB 容量的近线存储投入使用 。IA 的志愿者之一 Saikley 干脆抽身而出成立了 Capricorn Technologies 公司,专为类似组织提供存储解决方案。前面提到的 100TB 容量的产品即为该公司 GB 系列的产品。现在 IA 已经采用 PS(PowerStore) 系列的 PetaBox,是量身定做的,装机容量 1.5T,目前容量已经超过 3PB(怕是远远超过 3PB 了)。PS 系列产品每节点原始容量可以达到 3T,使用日立 Deskstar 硬盘,仅仅占 1U 的机柜空间。IA 也在站点上介绍了定制的这台 PetaBox 的一些规格要求以及参数。
PetaBox 也是 Linux 在企业级应用取得成功的一个范例。
PetaBox 存储产品给存储界带来了不小的震撼。每 GB 的成本仅仅是 2 美元。这还是 2005 年的价格,现在应该更便宜了。搜索了一下,这家公司目前还没有进入中国。
PetaBox 系统通过一个集中式的 PXE 启动服务器运行在 Debian 或是 Fedora Linux ,通过 Nagios 进行整个环境的监控。 管理成本也并不高--每 PB 一个人。
--EOF--
早晨收到 Steven Feuerstein (Oracle PL/SQL Guru)署名的一封邮件。介绍了他的得意之作 Qnxo 工具的一些变化。
Steven 开发了 Qnxo 工具 ,这个工具名字的四个字母取自 Quality in, Excellence Out,是一款旨在提高 PL/SQL 代码质量与开发速度的工具。去年 Quest 公司收购他的 Qnxo ,重新命名为 Quest CodeGen Utility (QCGU) ,并将其免费,对,Freeware! 预计将在今年的上半年推出 1.5 版,届时将通过 ToadWorld.com 发布。目前是 1.4 版,可以在 QCGU.net 下载,并可以获得正式 License (原来的 Qnxo 并不是免费的,只是提供了 30 天试用期)
我曾经试用过 Qnxo, 对于 Oracle 开发人员来说,通过该软件的确能够学到很多良好 PL/SQL 编程习惯。这样好产品,现在还变成免费的,值得尝试用用。
--EOF--
题外话:Steven Feuerstein 期待与美国现任总统小布什会面的事情还没有结果。
Today is our third birthday and my, how we've grown.
Our customer base is 161% bigger than it was this time last year, we've welcomed a bunch of fine new publishers (maybe even you?), and we've won some awards. Today, FeedBurner turns three and the flame-o-con burns brightly among other fast-growing companies. We strongly feel that we're supporting the best darn collection of publishers on the steam-powered pipes n' tubes of the Internets.
So from the whole team, huge thanks to all of you for helping us continue grow up big and strong. While we may be wearing out the knee-patches on our corduroys that much more quickly, we haven't yet outgrown our commitment to provide services that help you engage with your audience. We just hope you can forgive us the once-yearly indulgence of devouring birthday cake with our fingers.
But as a wise mentor once told us, merely stating your beliefs isn't always enough; sometimes you really must “speak from the data.” In that spirit, we present the following chart to help you more clearly see FeedBurner's story unfold scientifically over time.
前几天我还在说Dreamhost主机价格多么昂贵,现在,Dreamhost主机竟然发生了大规模停机现象。真是“质次价高”啊。
根据我的观察,今天下午就发生停机现象,我知道的所有的DreamHost主机几乎都无法访问。初步排除并非GFW的原因,因为从各方的反馈看,国外的用户也无法访问。
目前已经是深夜,从DreamHost的主页上可以看到两天消息,说他们机房的大厦管理处说需要停电,不过电力恢复后,核心路由器的刀片仍然故障,目前正在想办法更换那个路由器刀片。
看来,DreamHost的机房管理还是比较混乱的,以后使用DreamHost主机还真有不小风险,价格又高,机房管理也混乱。我在抉择一年虚拟主机到期后,是否需要考虑更换主机了。
不过话说回来,DreamHost再差劲,也比国内的IDC强,我服务器目前所在的机房,上个月搞了我好几次,动不动就网络故障,来一次就断上几个小时,估计设备也长期没有维修,所以才故障频频。(感谢rojoro的xzheng的提示)
更新:目前有多个服务器已经恢复。
二月 2007 | ||||||
一 | 二 | 三 | 四 | 五 | 六 | 日 |
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 |