评《千年难题——七个悬赏百万美元的难题》
作者:shanqin(萍踪浪迹)
(感谢sage兄对本文部分内容写作的帮助。)
正文:新近读了Devlin写的《千年难题——七个悬赏百万美元的难题》,简评一番。由于作者本人是Stanford大学数学系教授,让我先入为主地认定这本书很好,但是,读后相当失望。
尽管在Riemann假设,P与NP问题,Navier-Stokes问题BSD猜想以及Hodge猜想等专题写得相当深入浅出,但是在关于Yang-Mills理论的质量隙(mass-gap)与Poincaré猜想方面却写得非常平凡,甚至可以说写得很糟。
数学家从物理中抽出问题,但是却总喜欢过分强调这一问题在相关领域的核心重要性,一些研究卡-丘空间的人喜欢让人以为弦论没有卡-丘空间就无法存活,而在Yang-Mills理论的质量隙这个问题上,Devlin非常偏向于认为这个理论是理解标准模型(Standard Model)的基础。但是,事实上许多物理学家都这么认为,例如Weinberg就认为mass-gap问题不过是数学家的事而已。由于无法确定这个问题对于理论物理到底多重要,我询问了sage兄,为什么Weinberg与Witten对这个问题的重要性的看法相差如此巨大。
sage兄对这个问题的回答如下:
“It is a personal taste. You could think confinement is trivial, since the force is getting stronger and obviously it should confine. Therefore, it is probably not as interesting as finding new particles.
You can think calculating proton mass is a very interesting mathematical problem. We may learn something new about the dynamics of quantum field theory. It is a little bit similar to trying to solve a piece of solid by QED. No new physics. However, there are complicated new solutions of old physics. ”
标准模型中有很多问题都极度重要。如Higgs粒子的存在性,弱电破缺的机制等等,广而言之,标准模型的规范级列问题是否真可以由超对称解决(理论上可以,但是实际上超对称尚未被直接发现)等问题,都非常重要。只不过这些问题中的大多数要在高能加速器上见分晓,因此数学家或数学物理家自然不会有太大兴趣。于是,在一些数学家何数学物理学家心目中,数学上最难的物理问题就很自然成为物理中最重要的问题。
在mass-gap这一节,Devlin写了很多不相关的内容,从法拉第到广义相对论。虽然现代量子场论需要场的概念与狭义相对论融合,但是写这么多背景是不必要的,何况广义相对论与标准模型的直接关联是很小的。除非我们考虑引力量子化以及引力微子(gravitino)在MSSM(极小超对称标准模型)破缺中的作用。但是这个属于超引力的范畴。与mass-gap更是难以建立直接联系。
Mass-gap的证明或许真如Witten所说的那样“将阐明那些物理学家尚未完全理解的方向”,但是物理家已经基本认定了这个结果,只是未给出数学的严格证明。而且我们知道,一个物理理论的有效性并不是一定要在数学严格性上吹毛求疵。路径积分量子化在长时间内无法与严格数学的观念相容,但是并不影响其在量子场论中的重要作用。
Poincaré猜想的写作不仅落伍,而且可以说是全书最大的败笔。基础拓扑的介绍太冗长,很适合英美科普作家爱灌水的习惯,但在组合拓扑方向却远没有这么起劲,最核心的流形分类居然几页就过去了。至少得让读者直观了解一些三维流形方面的人物吧?由于作者是在2002年写下此书(序言可见),此时Perelman尚未贴出其三篇论文。那么,也总得提提Turston的几何化猜想吧?或者至少说说二维曲面的单值化定理?可惜,一无所有。在高维情形(维数大于等于4)和低维情形(维数小于3)都解决的情况下,Turston的几何化猜想就直接被视为解决3维Poincaré猜想的一个更宏伟的计划,而Hamilton的Ricci流计划一直被寄予厚望,作者居然只字未提,不能不让人惊讶。
在谈及Freedman的工作时,作者说:“Freedman的工作被证明对物理学家研究物质本性极其有用。”我不能确定作者此话的具体含义,因为Freedman的工作对空本质的研究极其有用,且是经过Donaldson紧接其后的工作而确立的。这个工作是如何对物质本性起到极其有用的作用的呢?从纤维丛观点看规范场论,时空是纤维丛的底流形,物质场是纤维丛截面,两者可不能混为一谈。
Poincaré猜想这一节最后的译者注绝对是特大败笔。虽然译者说明了Poincaré猜想已经被解决,并且提到Perelman在证明此猜想中作出了决定性的贡献,但却接着写道:“在佩雷尔曼的成果的基础上,来自美国、中国等国的多位数学家(如朱熹平、曹怀东)均对庞加莱猜想的最终完全证明作出了贡献。”
对Perelman进行解释的一共有三个小组,这个是国际数学界公认的,而且人家只承认是解释,不是完全证明。我说译者注是败笔,是因为这位译者把另外两个小组的四位数学家Kleiner,Lott,Tian,Morgen全部忽略了。如果这些被忽略的人没有贡献,那还用写什么“来自美国、中国等国的多位数学家”?直接写朱和曹不就OK了?故意省略这些专家的名字,让曹和朱独分这一杯羹,真是很令人不齿。可惜的是,就算是这杯残羹,也早就变馊了,抢去又有何用?所以这个专题是全书的败笔,而这个专题的最大的败笔是译者注。
今天才开始用饭否,twitter 速度太慢,注册页面没打开,遂放弃。
不知道什么原因发送了好几次验证码都没有立即收到回复(刚测试一次终于收到了),于是就注意到饭否的手机验证码都是由数字键盘的第一个字母组成的,分别是:a、d、g、j、m、p、t、w,如下图的admw(麻烦穿墙,不然也可自行测试):
这样可以让希望绑定手机的用户很快操作。不过仍然发现一个问题,比如输入awww(第一次尝试时就是这个验证码),在大部分手机上必须等待光标。如果技术上没问题的话,希望可以去掉重的字母。实际上用数字作验证也是不错的。
白天的时候看到刘韧一文《我的学习方式》,其中有说道采访余华的一句话:
比如,我问余华,怎样判断 A 作家比 B 作家写得好。余华说:“要看谁写细节的能力强。”
设计当然也是如此。
更新:英文重复据说是 Bug。另,考虑到在大部分手机上切换到英文比切换到数字更方便,只要英文不重复并且同键不相连,选择英文验证码要比数字验证码好。谢谢 PorkFat。
在西雅图扩展性的技术研讨会上,YouTube 的 Cuong Do 做了关于 YouTube Scalability 的报告。视频内容在 Google Video 上有(地址),可惜国内用户看不到。
Kyle Cordes 对这个视频中的内容做了介绍。里面有不少技术性的内容。值得分享一下。(Kyle Cordes 的介绍是本文的主要来源)
简单的说 YouTube 的数据流量, "一天的YouTube流量相当于发送750亿封电子邮件.", 2006 年中就有消息说每日 PV 超过 1 亿,现在? 更夸张了,"每天有10亿次下载以及6,5000次上传", 真假姑且不论, 的确是超乎寻常的海量. 国内的互联网应用,但从数据量来看,怕是只有 51.com 有这个规模. 但技术上和 YouTube 就没法子比了.
YouTube 出于开发速度的考虑,大部分代码都是 Python 开发的。Web 服务器有部分是 Apache, 用 FastCGI 模式。对于视频内容则用 Lighttpd 。据我所知,MySpace 也有部分服务器用 Lighttpd ,但量不大。YouTube 是 Lighttpd 最成功的案例。(国内用 Lighttpd 站点不多,豆瓣用的比较舒服。by Fenng)
视频的缩略图(Thumbnails)给服务器带来了很大的挑战。每个视频平均有4个缩略图,而每个 Web 页面上更是有多个,每秒钟因为这个带来的磁盘 IO 请求太大。YouTube 技术人员启用了单独的服务器群组来承担这个压力,并且针对 Cache 和 OS 做了部分优化。另一方面,缩略图请求的压力导致 Lighttpd 性能下降。通过 Hack Lighttpd 增加更多的 worker 线程很大程度解决了问题。而最新的解决方案是起用了 Google 的 BigTable, 这下子从性能、容错、缓存上都有更好表现。看人家这收购的,好钢用在了刀刃上。
出于冗余的考虑,每个视频文件放在一组迷你 Cluster 上,所谓 "迷你 Cluster" 就是一组具有相同内容的服务器。最火的视频放在 CDN 上,这样自己的服务器只需要承担一些"漏网"的随即访问即可。YouTube 使用简单、廉价、通用的硬件,这一点和 Google 风格倒是一致。至于维护手段,也都是常见的工具,如 rsync, SSH 等,只不过人家更手熟罢了。
YouTube 用 MySQL 存储元数据--用户信息、视频信息什么的。数据库服务器曾经一度遇到 SWAP 颠簸的问题,解决办法是删掉了 SWAP 分区! 管用。
最初的 DB 只有 10 块硬盘,RAID 10 ,后来追加了一组 RAID 1。够省的。这一波 Web 2.0 公司很少有用 Oracle 的(我知道的只有 Bebo,参见这里). 在扩展性方面,路线也是和其他站点类似,复制,分散 IO。最终的解决之道是"分区",这个不是数据库层面的表分区,而是业务层面的分区(在用户名字或者 ID 上做文章,应用程序控制查找机制)
YouTube 也用 Memcached.
很想了解一下国内 Web 2.0 网站的数据信息,有谁可以提供一点 ?
--EOF--原文作者:Josh Catone
原文链接:Top 10 Facebook Apps: Work
译者:woogle
相关文章:
an alarm clock that visualizes the actual status of the major Tokyo rail lines. the clock is updated wirelessly in real-time with the position of trains on each line, so one knows exactly when to catch the subway.
[link: hobidas.com|via ohgizmo.com & boingboing.net]
see also polar clock & coulheur clock & colhour clock & last clock
a heatmap overlaying a geographical map to depict the current rental market in San Francisco. CraigStats is based on the San Francisco craigslist rental listings since August of 2006, so the cost of renting on a per neighborhood basis is binned in 1/2 mile intervals & represented as a color.
[link: ucsf.edu|via boingboing.net]
see also trulia.
Check out the 3D Warehouse to see models from people all over the world, and turn on the 3D Warehouse layer in Google Earth to explore cities with realistic 3D buildings made in SketchUp (Denver is particularly impressive). If you like, you can download the free version and start building models yourself.
七月 2007 | ||||||
一 | 二 | 三 | 四 | 五 | 六 | 日 |
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |