作者:Fenng 发布在 dbanotes.net.
采取 Windows 技术路线的 Web 2.0 站点并不多,除了 MySpace ,另外就是这个 PlentyOfFish。这个站点提供 "Online Dating” 服务。一个令人津津乐道的、惊人的数据是这个只有一个人(创建人Markus Frind)的站点价值 10 亿,估计要让很多人眼热,更何况 Markus Frind 每天只用两个小时打理网站--可操作性很强嘛。
之所以选择 Windows .NET 的技术路线是因为 Markus Frind 不懂 LAMP 那一套东西,会啥用啥。就这样,也能支撑 超过 3000 万的日点击率(从这个数字也能看出来人类对自然天性的渴望是多迫切)。Todd Hoff 收集了很多关于 PlentyOfFish 架构的细节。记录一下感兴趣的部分。
PlentyOfFish 比较特殊的一个地方是 几乎不需要 Cache,因为数据变化过快,很快就过期。我不知道这是因为 ASP.NET 的特点带来的架构特点,还是业务就是这个样子的。至于图片,则是通过 CDN 支撑的。对于动态出站(outbound)的数据进行压缩,这耗费了 30% 的 CPU 能力,但节省了带宽资源。我最近才知道,欧美的带宽开销也不便宜。
微软 Windows 网络负载均衡(Network Load Balancing) 的一个缺陷是不能保持 Session 状态(我没有用过这玩意儿,不能确认),价格也不便宜,而且复杂;网络负载均衡对 Windows 架构的站点又是必须--IIS 的总连接数是有限制的。PlentyOfFish 用的是 ServerIron (Conf Refer),ServerIron 使用简单,而且功能比 NLB 更丰富。
一共三台 SQL Server,一台作为主库,另外两台只读数据库支撑查询。数据库性能监控用的是“Windows 任务管理器"。因为 Cache没啥用,所以要花大力气优化 DB。每个页面上调用 DB 次数越少越好,越简单越好,这是常识,不过不是每个人都体会那么深而已。
微软好不容易找到了一个宣传案例,所以在 Channel 9 上有一个 PlentyOfFish 的访谈。
PlentyOfFish 取自天涯何处无芳草(Plenty of fish in the sea)的意思,还挺有文化的。从这一点上看,比国内那些拉皮条的网站好一些。
--EOF--
相关文章|Related Articles
评论数量(0)|Add Comments
P2P下载,建立在互联网最本真的理念P2P之上。所谓P2P,Person to Person,最好的解释就是大仲马《三个火枪手》中著名的那句话:One for All,All for One(我为人人,人人为我)。
互联网不是诞生于服务器对客户端架构的,而是客户端对客户端。美国人当时非常担心苏联如果击溃了中央情报系统,整个军事系统该如何办。后来他们想出来让每个支点上的情报系统在必要的时刻可以成为中央情报中心的架构,即我们今天所谓的网络:network。解决群龙无首的最好方案就是让所有的龙都有个首,这是互联网的本义。
但互联网之后的道路,却是开始向服务器对客户端的架构发展。一台中心服务器提供信息,诸多客户端环绕四周。下载这个应用同样如此:服务器上存在一个100M的文件(也许是一个游戏?),所有的客户端(用户电脑)都和这台服务器以某种协议(http或者ftp)相连,获取该服务器上的一个拷贝。在这种模式下,我们可以视下载为一次拷贝过程。
如果只有10台客户端电脑,这种下载问题是不大的。但如果是一个极热门的文件,有10万台客户端电脑连了上来,可以想见对服务器以及带宽构成了多大的压力。所以,在P2P下载出现之前,下载的人越多,自然下载的速度就越慢。这个道理很普通,人人明白。
Here comes the P2P!
这是一种全新的传输协议。同前面的下载模式不同(需要高性能服务器和高带宽资源),这种传输协议使得信息发布者利用普通的客户端电脑就能迅速有效地把发布的资源传向其他的使用者(术语叫peer,所以p2p下载又称为peer to peer)。
信息发布者制作一个很小的文件,这个文件通常被叫做“种子”(torrent)。种子文件里提供数据分块和校验信息以及tracker服务器地址等内容。数据分块是一个非常重要的概念。我们假设那个100M的文件被分成100块,每个块的大小为1M,那么下载者B从发布者A那里每下载完1M,就同时进行了1M的上传供下载者C下载。在这样一个模式下,我们可以看到,任何一个下载者都有可能成为其他下载者的上传者,而任何一个上传者也同样拥有下载的权利。更进一步的是,在网络中弥漫的不是100M的文件,而是1M的块状文件。所以,P2P下载有“下载者越多下载速度越快”的美誉。
除了上述BT下载流派外,P2P下载还催生了一个叫“Napster”的mp3共享工具。不过,Napster利用它自己的中心服务器来把两个点连接起来从而造成了它的致命弱点:最后被判侵犯版权而彻底没落。但之后的电驴(也有叫电骡的)则跨越了这个技术上的缺陷,电驴有无数个这样的服务器——即客户端电脑。这样的充当服务器的用户们仅需要运行一个小小的程序并共享出他们几KB的因特网连接,就可以为成百上千甚至更多的其它用户服务。
和BT不同的是,电驴会对使用者按照上传下载比率以及登陆顺序进行综合排序进行资源交换。有一些人使用电驴的变种:不上传仅下载,被称为”吸血骡“。
网上有传言,使用BT下载会损伤自己的硬盘,而使用电驴则不会。这个传言事实上没有被最后证实,但有理由相信很多人深信不疑:毕竟使用BT的时候,硬盘转动的声音会极响。
我始终认为P2P下载是某种意义上的互联网本真精神的回归:所有的客户端电脑都是服务器。但这个下载模式遭到如下两个方面的攻击:
一、盗版问题。传统行业,特别是唱片行业,对P2P下载的攻击尤甚。因为如果我有一张唱片,通过P2P方式的发布出去,显然再掏钱购买的人就少了。但法学教授莱斯格争辩说,在现实生活中,将唱片借给朋友也是很常见的事情。我不禁想起,当年电影电视工业深怕录像机造成大量节目私自刻录而硬是将这项技术尘封近百年的历史,到头来,它们发现,录像机是催生了他们的衍生产品:可以出售录像带了。到了今天,DVD可是一项大买卖。
二、网路问题。电信基础服务商从来没停止过对BT传输对网速带来负担的抱怨。据说,BT传输已经占到网上所有数据传输的70%以上。电信服务商想尽了办法来封杀BT,但后者也在不断完善自己的技术躲避(不是改良)服务商的封杀。
本站作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
Copyright© 2007 作者及版权归属: 魏武挥 at ItTalks-魏武挥的blog (数字指纹:数字指纹:18531a57ccc95fdb8ecb9482f1a61a8c
很多致力于搜索引擎排名的人士认为买卖链接会降低互联网上链接的质量。如果你纯粹为了你的访问者或流量而不是为搜索引擎买卖链接,有一个简单的方法(nofollow属性)可以做到这一点。谷歌对买卖链接的立场是相当明确的。我们也在使用算法或手工相当准确地发现买卖的链接。出售链接的网站会失去搜索引擎的信任。2006年9月:在一次John Battelle对我的采访中,我提到"谷歌一直认为通过销售链接而影响搜索引擎的行为违背了我们的质量准则" 。
搜索引擎讨厌这种付费链接的流行。谷歌的站长指南禁止购买只是为了提高搜索排名的链接。其它搜索引擎(包括Ask, MSN及雅虎),只要他们是模仿谷歌基于链接的搜索排名的搜索引擎,都劝阻买卖链接。其他搜索引擎也有对买卖链接的特别评论,例如,微软搜索引擎代表在最近的一次采访中评论说:
实际情况是,大多数付费链接是 a.) 显然是不客观的;b.) 往往是无关紧要的。如果你问付费链接的影响,我的答案是,绝对有较大的风险。我们将不会容忍任何对用户体验没有增加多大价值并试图有效地欺骗我们的系统的假链接。
问:这就是为什么我们看到一些卖链接的网站在谷歌的工具栏上的PageRank较低的原因?
答:是的。如果一个站点在卖链接,它会影响我们对该网站的价值的判断,或直接导致我们对该站失去信任。
问:如果一个网站通过卖链接来传递PageRank,并且该网站自己的PageRank在谷歌工具栏被降低了,网站所有者可以做什么来补救?
答:网站所有者可以停止违背网络管理员指南的行为,并在谷歌的站长中心控制台提交复议请求。在提出复议请求之前,请确保所有售出的链接不再传递PageRank或者删除它们。
问:谷歌是不是在告诉网站管理员如何管理自己的网站?
答:不是。我们给每个想使他们的网站在谷歌上有良好表现的网站管理员提出参考。正如我在2007年6月的主题演讲视频中所说,网站管理员可以随心所欲地创建它们的网站,但是谷歌保留保障我们的索引质量和相关性的权利。据我们所知,所有主要的搜索引擎都采取了同样的立场。
问:谷歌是不是在试图打压其他用来增加网站流量的广告形式?
答: 没有,完全不是这回事。我们的站长指南明确指出,你可以使用链接的手段来获得有针对性的流量。事实上,我在2007年8月的演讲中,特意举了几个完全符合我们的指南的非谷歌广告的例子。我们只是希望付费链接能自己让搜索引擎知道它们是付费的,这样它们就不会影响搜索引擎的运作。
问:我知道有一个网站似乎是在买卖链接。我怎样才能把这一信息告诉谷歌?
答:请阅读我们在2007早期的一篇关于如何报告付费链接的贴子。我们已经在短短几个月内收到了数以千计的举报,但我们欢迎有更多的举报。我们非常感谢你们的反馈,因为它帮助我们采取直接行动,并改善现有的检测算法。我们也使用该数据来训练用以检测违反我们质量准则的付费链接的新算法。
问:我可以得到更多的信息吗?
答:当然可以。我今年早些时候写了关于付费链接问题的更多解答。如果你还有问题,你可以随时加入我们的站长帮助小组的讨论。
十二月 2007 | ||||||
一 | 二 | 三 | 四 | 五 | 六 | 日 |
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |