22:57 投票: 你使用的那种Blog发布平台 What Blog Platforms Do You Use? - [POLL] » del.icio.us/chedong
专业个人blog平台投票: WP自己搭建的目前36% 是MT的6倍 blogger第二25% 如果加上WordPress.com的hosting服务15%,WP超过了50%
PlentyOfFish 网站架构学习DBA notes » Che, Dong's shared items in Google Reader

作者:Fenng 发布在 dbanotes.net.

采取 Windows 技术路线的 Web 2.0 站点并不多,除了 MySpace ,另外就是这个 PlentyOfFish。这个站点提供 "Online Dating” 服务。一个令人津津乐道的、惊人的数据是这个只有一个人(创建人Markus Frind)的站点价值 10 亿,估计要让很多人眼热,更何况 Markus Frind 每天只用两个小时打理网站--可操作性很强嘛。

之所以选择 Windows .NET 的技术路线是因为 Markus Frind 不懂 LAMP 那一套东西,会啥用啥。就这样,也能支撑 超过 3000 万的日点击率(从这个数字也能看出来人类对自然天性的渴望是多迫切)。Todd Hoff 收集了很多关于 PlentyOfFish 架构的细节。记录一下感兴趣的部分。

带宽与CPU

PlentyOfFish 比较特殊的一个地方是 几乎不需要 Cache,因为数据变化过快,很快就过期。我不知道这是因为 ASP.NET 的特点带来的架构特点,还是业务就是这个样子的。至于图片,则是通过 CDN 支撑的。对于动态出站(outbound)的数据进行压缩,这耗费了 30% 的 CPU 能力,但节省了带宽资源。我最近才知道,欧美的带宽开销也不便宜。

负载均衡

微软 Windows 网络负载均衡(Network Load Balancing) 的一个缺陷是不能保持 Session 状态(我没有用过这玩意儿,不能确认),价格也不便宜,而且复杂;网络负载均衡对 Windows 架构的站点又是必须--IIS 的总连接数是有限制的。PlentyOfFish 用的是 ServerIron (Conf Refer),ServerIron 使用简单,而且功能比 NLB 更丰富。

数据库

一共三台 SQL Server,一台作为主库,另外两台只读数据库支撑查询。数据库性能监控用的是“Windows 任务管理器"。因为 Cache没啥用,所以要花大力气优化 DB。每个页面上调用 DB 次数越少越好,越简单越好,这是常识,不过不是每个人都体会那么深而已。

微软好不容易找到了一个宣传案例,所以在 Channel 9 上有一个 PlentyOfFish 的访谈

PlentyOfFish 取自天涯何处无芳草(Plenty of fish in the sea)的意思,还挺有文化的。从这一点上看,比国内那些拉皮条的网站好一些。

--EOF--

相关文章|Related Articles

评论数量(0)|Add Comments

本文网址:http://www.dbanotes.net/arch/plentyoffish_arch.html

09:00 Why New Media之十四:P2P下载 » It Talks-魏武挥的blog

P2P下载,建立在互联网最本真的理念P2P之上。所谓P2P,Person to Person,最好的解释就是大仲马《三个火枪手》中著名的那句话:One for All,All for One(我为人人,人人为我)

互联网不是诞生于服务器对客户端架构的,而是客户端对客户端。美国人当时非常担心苏联如果击溃了中央情报系统,整个军事系统该如何办。后来他们想出来让每个支点上的情报系统在必要的时刻可以成为中央情报中心的架构,即我们今天所谓的网络:network。解决群龙无首的最好方案就是让所有的龙都有个首,这是互联网的本义。

但互联网之后的道路,却是开始向服务器对客户端的架构发展。一台中心服务器提供信息,诸多客户端环绕四周。下载这个应用同样如此:服务器上存在一个100M的文件(也许是一个游戏?),所有的客户端(用户电脑)都和这台服务器以某种协议(http或者ftp)相连,获取该服务器上的一个拷贝。在这种模式下,我们可以视下载为一次拷贝过程。

如果只有10台客户端电脑,这种下载问题是不大的。但如果是一个极热门的文件,有10万台客户端电脑连了上来,可以想见对服务器以及带宽构成了多大的压力。所以,在P2P下载出现之前,下载的人越多,自然下载的速度就越慢。这个道理很普通,人人明白。

Here comes the P2P!

这是一种全新的传输协议。同前面的下载模式不同(需要高性能服务器和高带宽资源),这种传输协议使得信息发布者利用普通的客户端电脑就能迅速有效地把发布的资源传向其他的使用者(术语叫peer,所以p2p下载又称为peer to peer)。

信息发布者制作一个很小的文件,这个文件通常被叫做“种子”(torrent)。种子文件里提供数据分块和校验信息以及tracker服务器地址等内容。数据分块是一个非常重要的概念。我们假设那个100M的文件被分成100块,每个块的大小为1M,那么下载者B从发布者A那里每下载完1M,就同时进行了1M的上传供下载者C下载。在这样一个模式下,我们可以看到,任何一个下载者都有可能成为其他下载者的上传者,而任何一个上传者也同样拥有下载的权利。更进一步的是,在网络中弥漫的不是100M的文件,而是1M的块状文件。所以,P2P下载有“下载者越多下载速度越快”的美誉。

除了上述BT下载流派外,P2P下载还催生了一个叫“Napster”的mp3共享工具。不过,Napster利用它自己的中心服务器来把两个点连接起来从而造成了它的致命弱点:最后被判侵犯版权而彻底没落。但之后的电驴(也有叫电骡的)则跨越了这个技术上的缺陷,电驴有无数个这样的服务器——即客户端电脑。这样的充当服务器的用户们仅需要运行一个小小的程序并共享出他们几KB的因特网连接,就可以为成百上千甚至更多的其它用户服务。

和BT不同的是,电驴会对使用者按照上传下载比率以及登陆顺序进行综合排序进行资源交换。有一些人使用电驴的变种:不上传仅下载,被称为”吸血骡“。

网上有传言,使用BT下载会损伤自己的硬盘,而使用电驴则不会。这个传言事实上没有被最后证实,但有理由相信很多人深信不疑:毕竟使用BT的时候,硬盘转动的声音会极响。

我始终认为P2P下载是某种意义上的互联网本真精神的回归:所有的客户端电脑都是服务器。但这个下载模式遭到如下两个方面的攻击:

一、盗版问题。传统行业,特别是唱片行业,对P2P下载的攻击尤甚。因为如果我有一张唱片,通过P2P方式的发布出去,显然再掏钱购买的人就少了。但法学教授莱斯格争辩说,在现实生活中,将唱片借给朋友也是很常见的事情。我不禁想起,当年电影电视工业深怕录像机造成大量节目私自刻录而硬是将这项技术尘封近百年的历史,到头来,它们发现,录像机是催生了他们的衍生产品:可以出售录像带了。到了今天,DVD可是一项大买卖。

二、网路问题。电信基础服务商从来没停止过对BT传输对网速带来负担的抱怨。据说,BT传输已经占到网上所有数据传输的70%以上。电信服务商想尽了办法来封杀BT,但后者也在不断完善自己的技术躲避(不是改良)服务商的封杀。


评论:


相关文章:


Creative Commons License 本站作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
Copyright© 2007 作者及版权归属: 魏武挥 at ItTalks-魏武挥的blog (数字指纹:数字指纹:18531a57ccc95fdb8ecb9482f1a61a8c

18531a57ccc95fdb8ecb9482f1a61a8c)...
05:38 关于通过买卖链接来传递PageRank的最新消息 » 谷歌中文网站管理员博客


原文:Information about buying and selling links that pass PageRank
发表于:2007年12月1日下午12时02分,星期六

我们的目标是通过提供公平和准确的结果为用户提供最好的搜索体验。我们迫切希望与网站管理员一起来实现这一目标, 因为当你生成更好、更便于访问的内容时,对互联网,对我们的索引都有好处; 这反过来又使我们能够提供更多相关的搜索结果给用户。

但是如果一个网站管理员选择买卖链接以操纵搜索引擎排名,我们保留保护我们的索引质量的权利。通过买卖链接来传递PageRank违反了我们的站长指南。这种链接会损害我们搜索的相关性而造成:

- 失实:虚假的流行性以及不是基于实际价值、相关性、或权威性的链接
- 不平等:谷歌的有机搜索结果会变成让钱包最鼓的网站占有不公平的优势

为了遵循谷歌的质量准则,买卖链接应通过"rel=nofollow"或其他技术来屏蔽,例如,重定向到一个在robots.txt中被禁止索引的页面。下面是关于我们对买卖链接来传递PageRank的立场的更多解释:

2003年2月:谷歌官方的质量指南已经建议"不要参与旨在增加你的网站排名或PageRank的链接方案"达数年之久。

2005年9月:我在我的博客上发表了“文本链接和PageRank”一文。

2005年12月:我在我的博客上的另一篇文章讨论过这个问题,并表示:
很多致力于搜索引擎排名的人士认为买卖链接会降低互联网上链接的质量。如果你纯粹为了你的访问者或流量而不是为搜索引擎买卖链接,有一个简单的方法(nofollow属性)可以做到这一点。谷歌对买卖链接的立场是相当明确的。我们也在使用算法或手工相当准确地发现买卖的链接。出售链接的网站会失去搜索引擎的信任。
2006年9月:在一次John Battelle对我的采访中,我提到"谷歌一直认为通过销售链接而影响搜索引擎的行为违背了我们的质量准则" 。

2007年1月:我在我的博客中再次提醒人们: "付费博客文章中的链接应以不影响搜索引擎的方式出现" 。

2007年4月:我们提供了让人们向谷歌举报付费链接的机制。

2007年6月:在西雅图召开的搜索营销博览会(SMX)上,我在我的主题演讲中阐述了付费链接问题。这里是主题演讲讨论的录像节选。它的长度不到一分钟,但强调了谷歌将利用算法和人工方法来检测违反我们的质量准则的付费链接,并表达了将采取更强有力的行动来对付这种链接的决心。

2007年6月:一篇谷歌官方站长博客上的文章指出,"通过买卖链接来操纵结果并欺骗搜索引擎违背了我们的指南" 。该文还介绍了在谷歌网络管理员控制台中用户举报买卖链接的新表格。

2007年6月:谷歌在我们的官方站长文档中补充了关于如何举报买卖链接和什么样的链接计划违反了我们的质量准则的更具体的指导。

2007年8月:在圣何塞的搜索引擎战略(SES)会议上有一个专门关于付费链接的分会场,我描述了谷歌关于买卖链接的官方立场。

2007年9月:在我的博客的一篇文章中,我扼述了SES圣何塞会议,也把我在会上的演讲(powerpoint链接)提供给了广大用户。

2007年10月:谷歌为一篇题为"谷歌清洗了互联网贿赂"的福布斯文章提供评论。

2007年10月:谷歌正式向Search Engine Land证实,我们正在对买卖链接采取强有力的措施,包括降低通过销售链接来传递PageRank的网站的工具栏中的PageRank

2007年10月:我发给搜索引擎杂志的一个电子邮件也明确表示谷歌正在对通过买卖链接来传递PageRank的行为采取更强有力的行动。

我们非常感谢用户对付费连接问题给我们的反馈。一些较普遍的问题是:

问:通过买卖链接传递PageRank的行为违反谷歌的指南吗?为什么?
答:是的,我们已在上面陈述了理由。最近我在我的个人博客中有一个贴子,该贴通过一个例子来说明为什么搜索引擎不希望存在这样的链接。我们标出了在一篇严肃的医学话题(脑肿瘤)文章中的一些链接。写文章的人收了一些钱,撰写了关于脑肿瘤治疗的文章,但他们根本不懂脑肿瘤的治疗。很多情况下,写付费文章的人不会做一点哪怕是最基本的研究(甚至是拼写检查!)。

问:这一问题是谷歌独有吗?
答:不是。所有主要的搜索引擎都反对买卖影响搜索引擎的链接。对于福布斯文章“谷歌清洗了互联网贿赂”,Andy Greenberg也询问了其他搜索引擎的政策,结果是一致的。看一看下面的故事:
搜索引擎讨厌这种付费链接的流行。谷歌的站长指南禁止购买只是为了提高搜索排名的链接。其它搜索引擎(包括Ask, MSN及雅虎),只要他们是模仿谷歌基于链接的搜索排名的搜索引擎,都劝阻买卖链接。
其他搜索引擎也有对买卖链接的特别评论,例如,微软搜索引擎代表在最近的一次采访中评论说:

实际情况是,大多数付费链接是 a.) 显然是不客观的;b.) 往往是无关紧要的。如果你问付费链接的影响,我的答案是,绝对有较大的风险。我们将不会容忍任何对用户体验没有增加多大价值并试图有效地欺骗我们的系统的假链接。

问:这就是为什么我们看到一些卖链接的网站在谷歌的工具栏上的PageRank较低的原因?
答:是的。如果一个站点在卖链接,它会影响我们对该网站的价值的判断,或直接导致我们对该站失去信任。

问:如果一个网站通过卖链接来传递PageRank,并且该网站自己的PageRank在谷歌工具栏被降低了,网站所有者可以做什么来补救?
答:网站所有者可以停止违背网络管理员指南的行为,并在谷歌的站长中心控制台提交复议请求。在提出复议请求之前,请确保所有售出的链接不再传递PageRank或者删除它们。

问:谷歌是不是在告诉网站管理员如何管理自己的网站?
答:不是。我们给每个想使他们的网站在谷歌上有良好表现的网站管理员提出参考。正如我在20076月的主题演讲视频中所说,网站管理员可以随心所欲地创建它们的网站,但是谷歌保留保障我们的索引质量和相关性的权利。据我们所知,所有主要的搜索引擎都采取了同样的立场。


问:谷歌是不是在试图打压其他用来增加网站流量的广告形式?
答: 没有,完全不是这回事。我们的站长指南明确指出,你可以使用链接的手段来获得有针对性的流量。事实上,我在20078月的演讲中,特意举了几个完全符合我们的指南的非谷歌广告的例子。我们只是希望付费链接能自己让搜索引擎知道它们是付费的,这样它们就不会影响搜索引擎的运作。

问:我知道有一个网站似乎是在买卖链接。我怎样才能把这一信息告诉谷歌?
答:请阅读我们在2007早期的一篇关于如何报告付费链接的贴子。我们已经在短短几个月内收到了数以千计的举报,但我们欢迎有更多的举报。我们非常感谢你们的反馈,因为它帮助我们采取直接行动,并改善现有的检测算法。我们也使用该数据来训练用以检测违反我们质量准则的付费链接的新算法。

问:我可以得到更多的信息吗?
答:当然可以。我今年早些时候写了关于付费链接问题的更多解答。如果你还有问题,你可以随时加入我们的站长帮助小组的讨论。


^==Back Home: www.chedong.com

^==Back Digest Home: www.chedong.com/digest/

<== 2007-12-02
  十二月 2007  
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
==> 2007-12-04