Pubcon会议接近尾声时,我发现一 大 堆的文章在谈论Google对子域名和子目录的处理。也许我在会上没有把这一方面说清楚,我在这里再详细谈谈这个主题。
从以往记录来看,使用子域名与子目录的时间几乎是对等的。顺便提示一下,在一个象subdomain.example.com/subdirectory/的网址中 ,子域名是"subdomain",子目录是"subdirectory" (有时也被称为文件夹)。如果您还不清楚,你也许可以阅读一下我的“一个URL的组成部分的辅导材料”。
如 果你把你的内容放在子目录里,通常的原则是所有信息都存储在同一空间里。这可以使找到/编辑/更改代码变得很容易。同时,它也不难把代码从一个地方移到另一个地方。然而,一个子域名往往是一个域名系统(DNS)的别名。子域名的设置对网络管理员新手来说可能有点难,特别是如果"CNAME"对你来说不意味着任何意思。子域名可以分开管理,对你来说可以是一个好事(如果你想转移你网站的一部分,你可以使用DNS来和子域名脱钩),也可以是个头疼的事(DNS的设置相当麻烦,不像使用子目录一样仅仅使用几个命令就可以建立或移动目录)。以我为例,当我开始建我的博客时,我决定用一个子目录(mattcutts.com/blog/),仅仅是想使事情变得简单。
几年来,Google使用了一个所谓的"密集主机(host crowding)"算法,它意味着,对一个域名的每个主机名(hostname)或子域名,Google至多显示两个结果。这种办法(从一个子域名内显 示1-2个结果)一直运行非常良好,但我们也收到这样的投诉:对一些类型的搜索 (如生僻或长尾搜索),Google的一个搜索页面上可能出现很多结果都来自同一个域名的情况。在过去几个星期里,我们改变了我们的算法,使这一现象在未来再也不太可能发生。
这一变化并不会彻底改变有些搜索结果全部来自同一域名的情况;如果某个域名相关性确实非常强,我们仍可能从那个域名中返回多个结果。举例来说,如果一个搜索是[ibm],用户可能确实喜欢并想看到从ibm.com的结果。注意我们的算法变化是一个相当微妙的变化,并没有影响到我们绝大部分的搜索。事实上,这种变化已经存在了几个星期左右,到现在也没有人注意到。:)我在PubCon上谈及此变化的唯一原因是因为有人想听听我对子域名与子目录的意见。
对子域名和子目录,我个人更喜欢子目录。这是因为 我通常倾向于子目录为我的大部分内容提供的方便。一个子域名可有效分离出完全不同的内容。例如,Google为完全不同的产品使用子域名,例如news.google.com或maps.google.com。如果你是一个网络管理员或搜索引擎优化业者新手, 我建议你使用子目录,直到你对你的网站结构有足够的信心。在这一点上,您将可以对你的网站有更好的理解,从而作出正确的决定。
有一阵子,在日本,过劳死非常严重。不过,据说,过劳死的都是课长、部长的主管级中层干部,基层员工和社长之类的高级干部,是鲜有过劳死的。
我记得我真正升为一个主管是2000年的事。在这之前,名义上算是个主管,但实际并不是。我至今仍然记得那一晚的兴奋:从此我有兵了!我拉着我老婆逛了一回书店,很是买了几本所谓主管秘笈的畅销书。
不过,这七八年主管做下来,真是打心眼里觉得:这个位置不好做。
第一个不好做的是:太忙。随着职业的升迁,会越来越忙。不过,真到了社长一级,就不会那么忙了。这是一条抛物线。
为什么会越来越忙?因为面对的事情越来越多。我以开会为例子。
一个基层员工,一天只有一个会(实际上,真得如此频率,这个员工会认为自己会太多)。而一个主管,一天可能N个会,只是面对的都是不同的员工。员工开会的那档子事,在他那里,就是N倍。
emile一直不同意我这个看法,她认为会多是没效率的表现。不过,她现在已经是社长一级的人物了。一个帝国,谁最忙?不是皇帝,是宰相啊!
为什么社长不忙?社长很辛苦是真的,因为他面前的事情都是轻易解决不了的。但一个组织,恐怕不会有n多解决不了的事,所以辛苦归辛苦,但忙是谈不上的。
第二个不好做的是:时刻得带着面具。
人的心情都有好坏,也有很多出神的时候。八小时工作制,哪个员工说自己是满打满做完八小时的,我绝对不相信。他/她能上六小时已经很不错了。
员工有时候会觉得主管很可怕,不能轻易得罪。这只是心态。哪个员工说自己从来不曾得罪过主管恐怕也是稀罕的事。更重要的是,主管才不敢得罪员工(这档子事挺复杂,不展开说)。比如说有个事儿,主管要安排,看到员工A今日心情不佳,算了,给员工B罢,一样。
但主管自己就不同了。员工可不管这套。敲开门就进来,即使你心情再不佳,也得伺候应付着。何故?为人表率嘛。
如果说员工能偷懒两个小时的话,主管只能偷懒一个小时,除非他/她不打算在别人眼里是个好主管。比如我,呵呵。
第三个不好做的是:有责无权。
一个组织最重要的权是两项:财和人。相对于财,人更重要一些。比如说以前的皇帝权好大啊,为什么大?可以生杀(人)予夺(财)呗。
大部分的主管并没有人事权,即使是人事主管。不过,对于人事问题,主管是有影响力的。成天给社长说一个员工的坏话,恐怕也不能说毫无作用。但精明的社长,绝对不会只听主管一人的言语。有时候,说得太过,得把自己都兜进去。
总得来说,如果员工每天面对一件事的话,一个管理十个员工的主管就得面对十件事。主管是执行层的核心,社长才是战略层的核心。即使是高级主管,也是主要面对事,而非人:如何让此人做此事?请注意:此人是前提,轻易动不得。而此事,也基本安排妥当(特别是大事),主管成天头疼的,便是“如何”。
本站作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
Copyright© 2007 作者及版权归属: 魏武挥 at ItTalks-魏武挥的blog (数字指纹:数字指纹:18531a57ccc95fdb8ecb9482f1a61a8c
UT Austin和Sun公司合作搭建了一台有62976个核的超级计算机 Ranger (字面翻译“巡游者”,我给它起中文名为“润哲”,老婆称其为“大电脑” :) ),就坐落UT的pickle工程校区,在我办公室几百步远的地方。这台计算机的理论峰值为每秒504万亿浮点运算,预计今年2月一号投入正式运营,按照理论峰值排序,仅次于美国核武器安全局在LLNL的IBM蓝色基因L超级计算机(按照去年11月top500的报告其理论峰值每秒593万亿浮点运算)。
Ranger “润哲" 超级计算机。图片来自TACC网站
因为工作的关系我是UT的另一台超级计算机Lonestar(孤星,理论峰值62万亿次)的用户并且将来有可能会使用Ranger,所以这个星期4/5在UT的高性能计算中心(TACC)参加了为期两天的培训成为第一批试用Ranger的用户之一, 并进入Ranger的机房零距离接触了这台世界第二的大家伙。
先说说Ranger的硬件:
其实超级计算机并不是很多人想象的主频巨高的类似个人电脑的机器,而是一台由成千上万个CPU通过网络(infiniband, ethernet等)连接起来组成的集群(cluster)。Ranger共有3936个计算节点(node),每个节点的主板上有4个socket,每个socket上插着一个AMD的4核barcelona处理器,每个处理器有8G内存,这样Ranger总计有3936x4x4=62976个核心(每个核心的主频是1.994G)和8Gx4x3936=125TB的内存。
计算节点的主板。图片来自TACC网站。
AMD的barcelona四核和Intel的“伪”quad-core相比的不同是后者没有独立的L2二级缓存, core0/1 和 core2/3之间的通讯需要经过内存,而前者在L2和内存之间加了一个L3三级缓存从而实现了L2的独立,要知道核心对L2/L3/memory的访问速度依次递减大约一个数量级,从而barcelona的核间通信速度大为提高。不仅如此,在每个node的主板上采用了非对称的HyperTransport进行连接(CPU0和CPU3之间没有直接连接),CPU之间的通信不需要通过"local"的内存,这提高了4个CPU之间的通信速度。
世界上最大的Infiniband交换器,上方闲置的插槽预示着Ranger可以进一步扩展CPU数目。图片来自TACC网站。
对超级计算机来说,比单个CPU的主频更重要的性能指标是计算节点之间的连接速率,Ranger采用的是两台topspin270 infiniband 交换机,P2P的fat tree拓扑结构。我用PALLAS MPI(IMB) MPI-I实测的速度可以达到1GB/s以上,已经非常接近硬件的极限:
#---------------------------------------------------
# Benchmarking PingPong
# #processes = 2
# ( 62 additional processes waiting in MPI_Barrier)
#---------------------------------------------------
#bytes #repetitions t[usec] Mbytes/sec
0 1000 1.86 0.00
1 1000 2.16 0.44
2 1000 2.21 0.86
4 1000 2.29 1.67
8 1000 2.17 3.52
16 1000 2.24 6.82
32 1000 2.29 13.31
64 1000 2.36 25.87
128 1000 2.47 49.41
256 1000 2.95 82.70
512 1000 3.16 154.44
1024 1000 3.89 251.30
2048 1000 5.56 351.54
4096 1000 8.04 486.15
8192 1000 16.81 464.85
16384 1000 27.81 561.80
32768 1000 49.79 627.63
65536 640 92.94 672.44
131072 320 140.81 887.70
262144 160 240.18 1040.87
524288 80 445.92 1121.28
1048576 40 883.92 1131.32
2097152 20 2007.03 996.50
4194304 10 3950.14 1012.62
这么大的机器(占地面积大约13mx13m),需要耗费大量的电能来驱动和水冷散热,每年消耗的电费大约是一百万美元,我站在机器中间能听到巨大的噪音并感到炙热的散热气流扑面而来。机器的计算节点采用了易插拔设计,更换节点很容易,维护人员给我们演示了一块刚刚坏掉拔出来的blade,很牛逼的设计是主板中央有个蓝色按钮,按下去那么主板相应的坏掉的硬件边上的灯会亮,发现是内存挂了 :)
其次谈谈软件:
登录Ranger的登录节点和登录其他Linux系统没什么区别。我登录时的界面:
chen@chen:~$ ra
xxxxxxx@ranger.tacc.utexas.edu's password:
Last login: Thu Jan 17 15:00:02 2008 from xxxxxxx.utexas.edu
------------------------------------------------------------------------------
Welcome to the Ranger Opteron Linux Cluster
Texas Advanced Computing Center, The University of Texas at Austin
** Unauthorized use/access is prohibited. **
------------------------------------------------------------------------------
** Welcome Early Users!
--> Ranger uses the modules program to control your user environment. To see
what packages are available, issue: "module avail"
--> Draft User Guide: http://www.tacc.utexas.edu/services/userguides/ranger/
--> Please contact your assigned early-user support liaison with any questions
--> Example SGE job scripts available in /share/doc/sge
--> ** NEW **: the OpenMPI stack is available for testing. To access,
--> issue: "module swap mvapich2 openmpi" from a default login shell.
--> ** System Maintenance **: Ranger will be down beginning Friday,
--> January 11th at 11am (Central) to prepare for final acceptance
--> testing.
--> ** normal queue is currently *closed* to all users.
------------------------------------------------------------------------------
--> ** Notes for OSU MVAPICH Team: (1/15/08): systest queue is now open
------------------------------------------------------------------------------
login4$
系统使用的是CentOS Linux系统(基于RedHat), 登录节点的一些系统信息如下:
login4$ cat /proc/version
Linux version 2.6.9-55.0.9.EL_lustre.1.6.3smp (root@master.ranger.tacc.utexas.edu) (gcc version 3.4.6 20060404 (Red Hat 3.4.6-8)) #2 SMP Mon Dec 17 18:34:43 CST 2007
login4$ cat /proc/meminfo
MemTotal: 32916688 kB
MemFree: 32062484 kB
Buffers: 91164 kB
Cached: 423900 kB
SwapCached: 0 kB
Active: 270068 kB
Inactive: 265000 kB
HighTotal: 0 kB
HighFree: 0 kB
LowTotal: 32916688 kB
LowFree: 32062484 kB
SwapTotal: 4192824 kB
SwapFree: 4192824 kB
Dirty: 392 kB
Writeback: 0 kB
Mapped: 29768 kB
Slab: 161024 kB
CommitLimit: 20651168 kB
Committed_AS: 56416 kB
PageTables: 2292 kB
VmallocTotal: 536870911 kB
VmallocUsed: 11888 kB
VmallocChunk: 536858999 kB
HugePages_Total: 0
HugePages_Free: 0
Hugepagesize: 2048 kB
系统中安装的软件组件:
login4$ module avail
------------ /opt/apps/intel10_1/modulefiles ----------
acml/4.0.1 fftw3/3.1.2 hdf5/1.6.5 mvapich/0.9.9 mvapich2/1.0 netcdf/3.6.2 openmpi/1.2.4---------- /opt/apps/pgi7_1/mvapich2_1_0_1/modulefiles ----------
fftw2/2.1.5 petsc/2.3.3-complexdebug petsc/2.3.3-debug tao/1.9(default)
petsc/2.3.3(default) petsc/2.3.3-cxx slepc/2.3.3(default) tao/1.9-debug
petsc/2.3.3-complex petsc/2.3.3-cxxdebug slepc/2.3.3-debug--------- /opt/apps/pgi7_1/modulefiles ----------
acml/4.0.1 hdf5/1.6.5 mvapich-devel/0.9.9 netcdf/3.6.2
fftw3/3.1.2 mvapich/0.9.9 mvapich2/1.0 openmpi/1.2.4--------- /opt/modulefiles ----------
Linux TACC cluster java/1.4.2 java/1.5.0 java/1.6.0(default)--------- /opt/apps/modulefiles ---------
binutils-amd/070220 gsl/1.10 intel/9.1 pgi/7.1
gotoblas/1.22 intel/10.1(default) mkl/10.0 sun/12---------- /opt/apps/teragrid/modulefiles --------
apache-ant/1.6.5 globus/4.0.1(default) gsissh/4.1 teragrid-basic tgresid/2.0.0
condor/6.7.18(default) globus/4.0.5 gx-map/0.5.3.2 teragrid-dev tgresid/2.0.3(default)
condor/6.9.1 globus/4.1.3 pacman/3.20 tg-policy/0.2 tgusage/2.9
condor-g/6.7.18 globus-4.0 srb-client/3.4.1 tgproxy/0.9.1
Ranger上的编译器主要是Intel compiler(c/c++/fortran)和portland group的c/c++/fortran编译器,使用openmp和MPI(mvapich2)进行并行编程,函数库包括MKL, ACML等。由于Ranger每个节点有16个计算核和32GB内存,这就为openmp/mpi混合(hybrid)编程提供了用武之地,在第二天上午的培训课程中就包括混合并行编程的讲座和lab。
作业调度(batch system)使用的是SGE和NUMA control。
值得一提的是培训中见到了牛人Goto(数值库gotoblas的作者)。我们培训时的lab code中有一段他用C汇编写的timer程序,据说可以把测量精度提高到8个时钟周期。
其他:
感觉TACC的工作人员极度热情,有问必答,还抢着帮我扔用过的纸杯 :) 机房的环境也很开放,打个电话过去就可以带着进入机房内部参观,放置Ranger的building没有保安,机房的墙壁是玻璃的从走廊就可以看到内部。完全是一副为人民服务的作派 :)
并行计算还是很好玩的,等我有时间一定写篇这方面的介绍。
Pressure on Yahoo to outsource search to Google or MSN continues to mount. Breaking Views in today's WSJ slams Jerry Yang's strategy to remake Yahoo into the front page of the Internet. The column calls for activist investors to shake up "discredited management," outsource search, and spin off Asian investments in Alibaba and Yahoo Japan.
The BreakingViews guys can't decide whether they think Yahoo is "the Hamlet of the Web" in existential crisis or "navigating the waters of Internet advertising like a goldfish evading a shark."
Google as Jaws. Now we know who really ate the goldfish in Steven Spielberg's pond.
Click to read the rest of this post...
全球性的开放教育资源(OER, Open Educational Resources)正在迅速涌现。联合国教科文组织支持的一个wiki站点[1]提供了很好的资源导向和相关讨论。像OER Commons这种门户站点已经收入了上万的开放教育资源链接[2]。
其中比较著名的有麻省理工的开放课件(MIT Open Courseware)和Rice University发起的Connexions project。其他广义上的开放教育资源可以包括Wikipedia系列项目和Gutenburg等的开放图书。在线开放的优秀音频视频资源也日趋丰富,例如Librivox的音频图书和Google Video里的一些技术讲座。
有效的中文开放教育资源似乎还很有限。这个开放教育资源离我们有多远的问题首先成了本地化(或翻译)的问题。MIT Open Courseware有中文翻译项目:朱学恒带领的志愿者们作出了巨大的努力,大陆官方也有个相应的项目。除此之外,值得一提的恐怕只有一些IT图书资料(有时侵权了)的志愿翻译。
在这个长路迢迢的本地化之上,是如何有效使用这些开放教育资源的问题。
像传统资源一样,开放教育资源仍然需要相当的、附加的努力来进入学习者的知识结构。尽管优秀的资料可以更有效的传递知识、拙劣的资料也可以应付考试,资料无法代替结构化的和方向性的指导、无法代替师生、同学之间的交流讨论。
这要求我们重新思考教育的本质。教育者不是知识的占有者,而是知识的传播者。教育的核心不是知识,而是知识的传递。在开放资源把知识垄断打破之后,教育就应该(健康地)专注到知识的传递上来。
使用英语的程序开发人员已经熟悉了开放教育资源下的学习模式。开源软件的一个巨大社会效益就是帮助软件人才的培养。然而优秀的程序员们是一个有着非常的探索热情的特殊人群,这个开源学习模式要转移到普通教育上需要巨大的额外努力——也就彰显了教育者的重要性。
教育资源严重短缺是中国的一个严重问题,是中国现代化的真正障碍。然而教育在事实上的国有垄断进一步恶化了这个问题。一方面,应试教育阉割了学生的创造力和自学能力;另一方面,劣质教育泛滥,成了政治权力结构下的敛财工具。
开放教育资源的涌现对所有的发展中国家都是巨大的机会。中国面对这个机会比面对开源软件的时候更茫然——更清楚地反映出了深层的社会问题。让我们呼吁中国政府在义务教育上负起基本的责任,在职业教育和高等教育上消除政治性垄断。同时鼓励社会各界来积极探索开放教育资源的使用,阻止中国在巨大的数码鸿沟后面落后更远。
[1] http://oerwiki.iiep-unesco.org 。资源指南页面见:
http://oerwiki.iiep-unesco.org/index.php?title=OER_useful_resources 。
[2] http://www.oercommons.org 。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
[http://rl.rockiestech.com]
洛基开放文化实验室,使用开源方法来推动社会文化进步
一月 2008 | ||||||
一 | 二 | 三 | 四 | 五 | 六 | 日 |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |