Source favicon21:48 基于MovableType的chedong.com/tech 重构 » 车东[Blog^2]
拖了3年了一直没做的一件事情:将以前tech/目录下的内容进行结构化管理,今天终于完成了。 4年前觉得自己做的这几个网页就是blog,从现在看,缺少了很多特征:可留言反馈,可RSS发布等。所以这次重构的系统选择我提出了以下几个要求: 1 文章按照指定文件名在根目录下导出:保持原有的链接不变(permalink); 2 模板话管理:省却使用sed批量替换的麻烦,内容和表现分离; 3 在线可编辑,而不是使用SFTP/FTP上传; 4 更好的管理文章之间的关联; 5 有反馈机制:留言,这对内容的修正很有好处; 最后终于选择了熟悉的MovableType通过一番设置,用了2个周末下班时间完成了。对mt的设置如下: 1 只保留首页/归档页 使用 %f 模式自定义文件名; 2 取消按月归档,取消按分类归档; 3 使用RelatedEntry插件实现标签分类; 同时也发现MT的一个缺点: 不能管理过长的文档(超过20k的),比如: Hello Unicode这篇文章中的3个实验不得不分拆离成了3篇文章;
Source favicon19:34 ≈3.0 » We make art not money
Web 2.0 带动了各式各样的2.0思维,所以最近我要参加一些有趣的不同领域的小活动,显然大家都受到了2.0的冲击,于是郑重其事地标签为“XXX 2.0”。当然对于真正的理解还有一个阶段,毕竟有了标杆,是蛙跳(Leapfrog)的目标,算是一种进步吧。但是 Web 2.0的创业却没有那么容易,创业的残酷在于人们要用金钱来衡量,所以无论是投资人开始退烧,还是媒体转移注意,或者是创业着自己反思,都是合情合理的反映。

聪明的2.0公司开始思考如何让1.0和2.0做加法了。例如 Threadless.com 和 Jpgmag.com,他们也能够更加和1.0的人群做衔接,让人们在不知不觉中进入角色,升级了人们对2.0的理解,也让我们有机会进一步思考未来的版本。

所以眼下有四到一百种关于Web 3.0的说法,我暂时做一些简单罗列,之后会在英文Blog中作一些整理:
  1. 3D Virtual World: 类似Second Life,国内也有了拷版。虚拟3D帮助人们建构新的理解,获得更好的应用体验,当然是网络越来越追求的目标。Ajax是2.x维的思维方式,但是纯粹的3D和Podcasting一样难以驾驭,文字仍然是Web n.0的重要基石。
  2. Semantic Web: 语义网终于翻身,希望能够搭载Web 2.0的创造力推进一步。其实Web 2.0用各种通俗的方法(通俗分类Tag),通俗的格式化(Microformats),以及通俗的API(Atom等)渐渐地表达了语义。所以Semantic Web 确实能够对2.0促进一步,只是要考虑新的社会计算模式,这是W3C过去不足的地方,第一次被商业应用所左右。
  3. Robot+Human computing: 互联网上能够把人和机器的计算良好结合起来,这是Google成功的道理。你想好关键词,Google的计算体系帮你找候选结果,你再自己挑候选结果。很多人不屑于这种做法,以为有更好的算法可以只让机器代替人来计算,显然忽略了人性。伴随着Web和IM的社会化趋势,更多的机器计算会来到人们身边。从计算的角度看,机器的参与会让世界有大的改变。
  4. Web 2.0与传统商业模型的结合: 这一点更加自然,因为Web 2.0企业不会落入窠臼,他们会不断寻求与离线经济的结合点,这样的结合点会越来越多,让UGC变成UGM。
我们可以很高兴地看到,这些努力都在并行发展,所以没有可能说哪一个方向才是真正的Web 3.0,就是综合。未来几年,恐怕Web 3.0就不只是Web 3.0了,很可能是 Society 3.0 了。
Source favicon19:03 数学之美 系列二十 -自然语言处理的教父 马库斯 » Google 黑板报 -- Google 中国的博客网志


我们在前面的系列中介绍和提到了一些年轻有为的科学家,迈克尔·柯林斯,艾里克·布莱尔,大卫·雅让斯基,拉纳帕提等等,他们都出自宾夕法尼亚计算机系米奇·马库斯(Mitch Marcus)名下。就像许多武侠小说中描写的,弟子都成了各派的掌门,师傅一定了不得。的确,马库斯虽然作为第一作者发表的论文并不多,但是从很多角度上讲,他可以说是自然语言处理领域的教父。

马库斯教授长期当任宾夕法尼亚大学计算机系主任,直到他在几年前从 AT&T 找到皮耶尔替代他为止。作为一个管理者,马库斯显示出在自然处理和计算机科学方面的卓识的远见。在指导博士生时,马库斯发现语料库在自然语言处理中的重要性。马库斯呕心沥血,花了十几年工夫建立了一系列标准的语料库,提供给全世界的学者使用。这套被称为 LDC 的语料库,是当今全世界自然语言处理的所有学者都使用的工具。我们在以前的系列中讲到,当今的自然语言处理几乎都是使用给予统计的方法。要做统计,就需要大量有代表性的数据。利用这些数据开发一个自然语言处理系统的过程,可以统称为训练。比如,我们要训练一个汉语分词系统,我们需要一些已经分好词的中文句子。当然这些句子需要有代表性。如果想知道一个分词系统的准确性,我们也需要一些人工分好词的句子进行测试。这些人工处理好的文字数据库,成为语料库(corpus)。如果每个研究室都人工建立几个语料库,不仅浪费时间精力,而且发表文章时,数据没有可比性。因此,马库斯想到了建立一系列标准的语料库为全世界的学者用。他利用自己的影响力让美国自然科学基金会和 DARPA 出钱立项,联络的多所大学和研究机构,建立的数百个标准的语料库。其中最著名的是 PennTree
Bank 的语料库。PennTree Bank 覆盖多种语言(包括中文)。每一种语言,它有几十万到几百万字的有代表性的句子,每个句子都有的词性标注,语法分析树等等。LDC 语料库如今已成为全世界自然语言处理科学家共用的数据库。如今,在自然语言处理方面发表论文,几乎都要提供基于 LDC 语料库的测试结果。

马库斯给予他的博士生研究自己感兴趣的课题的自由,这是他之所以桃李满天下的原因。马库斯对几乎所有的自然语言处理领域有独到的见解。和许多教授让博士生去做他拿到基金的项目,马库斯让博士生提出自己有兴趣的课题,或者用他已有的经费支持学生,或者为他们的项目区申请经费。马库斯高屋建瓴,能够很快的判断一个研究方向是否正确,省去了博士生很多 try-and-error 的时间。因此他的学生有些很快地拿到的博士学位。

作为系主任,马库斯在专业设置方面显示出卓识的远见。我有幸和他在同一个校务顾问委员会任职,一起讨论计算机系的研究方向。马库斯在几年前互联网很热门、很多大学开始互联网研究时,看到 bioinformatics (生物信息学)的重要性,在宾夕法利亚大学设置这个专业,并且在其他大学还没有意识到时,开始招聘这方面的教授。马库斯还建议一些相关领域的教授,包括后来的系主任皮耶尔把一部分精力转到生物信息学方面。马库斯同时向他担任顾问的其他一些大学提出同样的建议。等到网络泡沫破裂以后,很多大学的计算机系开始向生物信息学转向,但是发现已经很难找到这些方面好的教授了。我觉得,当今中国的大学,最需要的就是马库斯这样卓有远见的管理者。

过几天我又要和马库斯一起开顾问委员会的会议了,不知道这次他对计算机科学的发展有什么见解。
Source favicon17:53 分析互联网的起点在电子商务 » 王建硕
分析中国和美国的互联网的起点应该是电子商务。因为电子商务的繁荣,导致在线广告的繁荣,从而滋养了各种内容服务的小网站雨后春笋一样诞生。美国的一系列Web 2.0模式的出现和成活的根源有二:一为截流,就是用户贡献内容降低成本,二为开源,就是Google AdSense等网络的网络广告带来的收入。第一点在中国到是成功的复制(尤其当用户贡献内容变成拷贝别人的用户贡献的内容的时候),而第二个要素还不存在。 在中国,电子商务从来一直没有真正大规模的开始,在线广告当然就总市场容量不足,而且仅有的广告,又因为流量不值钱而严重的向流量大的网站集中。小网站的生存空间严重压缩,靠一次又一次的“稻草产业”救命(比如疯狂烧钱时期的广告联盟,或者短信彩信等等大起大落的项目)。 现在的模式,更多的是互联网上的花费大头,疯狂投放网络广告,这些广告先被门户瓜分,再经过联盟一层层盘扣后,流入小网站的口袋里。当冤大头不投钱了,新一轮的互联网小网站的秋天就来了。而电子商务作为互联网的盈利模式的根源,能够养育大量的小网站,并且自底向上的推动互联网的大树的成长。没有成熟的电子商务作为互联网盈利的根,无论Web 1.0还是2.0都步履维艰,红颜薄命。 为什么一定是电子商务 为什么一定是电子商务呢?为什么传统商务不能成为这种源头呢? 如果我们简单的把世界划分为在线上的世界和线下的世界,就会发现四种不同组合方式:用线上广告对推广线上产品、服务;用线下推广线下,或者线上推线下,和线下推线上。 用线下的广告,来推广网站 用线下的广告,来推广网站,多数都折戟而归。我们见过太多的报业集团,做一个网站,把所有的报纸资源用来做网站的推广,用正版的广告来砸这个市场,以为用线下最有效的推广方式来推广网站,信心满满的宣称全市全国人民都在看的报纸如果推哪个网站,那个网站一定火。结果呢,网站的统计数据显示,在报纸上做广告和不做广告,几乎没有什么太大的区别。随便算一下,就算100万的发行量(这样的发行量的报纸实属少见),就算是整版广告,注意到这个广告的(看到并且思考一下的),也不会超过10%。这中间,会在上网的时候敲这个网址的,又是其中的10%不到(10%其实已经是多说了),那一天最多带来一万用户。如果换做在线广告来说,就算3毛钱一个点击(不低了),也只是价值3千元的广告效果。用可以卖上几万到十几万的整版广告,换来三千块钱的价值,还真不如还是卖整版广告,拿挣来的钱来投在线广告呢。 线上来推广线下的生意 同样,在线的方式推广线下的商业,也不见得会有多大的优势。就算是你花三万块钱买来10万的访问量,他们看到了你的广告,到了你的店面的(或者在线下使用你的服务的),到底能有几个?看到线下广告上网,不过是几次键盘操作之遥,依然因为不能立刻有所行动而效果大打折扣,何况看到线上广告到线下使用服务之间却可能是几小时车程之遥。门口一个海报,制作成本高也不过几百块钱,带来的用户不见得会比投一个在线的广告少太多。 两个世界 线上是线上的世界,人是网络世界的人。线下是线下的世界,人是现实的人。打通两个世界之路要么是电子商务,把线下的交易挪到线上,要么是本地社区,把线上的世界联系起线下。本篇不说本地社区,先说电子商务。 我们刚才说的那个线下的商家,如果有任何形式,把店铺也好,服务也好搬到网上去,把交易,或者交易的一小部分搬到网络上,这就是电子商务。它可以复杂到在线下订单,在线付款,货到付款,也可以简单到一张可打印的打折券,一个留言版,甚至一个下订单的电子邮件抑或电话,都可以说是某种形式的电子商务了。只要在用户访问了这个页面,可以执行特定和特定交易相关(无论多弱的相关性),就可以跟踪这个网站带来的效果,线上的流量才可以和商业的核心关联起来。如果能够证明在线广告带来哪怕10块钱的额外利润,广告主就有了花5块钱甚至9块钱来做在线广告的理由。如果没有了电子商务,在线广告还是停留在传统广告主的尝试或着包括VC或者互联网巨头的广告这种不稳定模式,没有触及主流商业。 毕竟,靠线上推广纯线下的业务,和线下推广纯线上的业务一样效率低下。 电子商务再大,现在也只是千亿不到的市场;而线下的商务,它的市场衡量标准却是国家的GDP。我期待更多的线下的商业搬到线上去,只有这样,互联网才真正切入了主流的商业,从吃面包屑变成啃起了奶油蛋糕。 注一:此主意最早在和Richard的聊天过程中他阐述的想法,我个人觉得非常有道理,就拿来用了。 注二:电子商务是什么?比如亚马逊模式当然是,卖自己的店里的东西当然是,包括eBay的listing fee也是,就是它提供的平台服务在互联网上卖,在线咨询算是,在线预订也算是(虽然最终的服务是在线下提供的)。总之,不仅仅是商品交易,服务交易也算,不仅仅是完成交易,在这个交易环节中的任何一个或几个环节都算的。根本在于 - 可以被跟踪的交易量。...
Source favicon11:54 途牛:一直都被模仿,从来未被超越 » 一个藏袍
昨天还在看谷歌输入法跟搜狗输入法较劲,你来我往,好不热门,没想到今年互联网的开局竟然是以这种方式。 昨天晚上,同事给我一个网址,发现途牛旅游网的度假频道又被人抄袭了,我们的心里很是高兴。 度假频道专门为大众提供全国各大城市出发的度假线路预定,不同于携程网的机票加酒店,途牛的度假线路是大家最熟悉的,就在大家身边的旅行社参团或者独立成团线路预定。 途牛 度假线路页 某网站 度假线路页 途牛 度假线路比较页 某网站 度假线路比较页 途牛 文案细节 某网站 文案细节 为什么高兴呢?这证明我们的眼光是正确的,证明又多了一个伙伴认同了我们的理念加入到我们的阵营里来。我们开创了一个新的时代,在线旅游在经历过了高端市场的订票,订房后又迎来了更为广大的大众旅游预订市场。 我们继承并发扬了大众旅游的光荣传统,我们不是一个人在战斗,不是一个人! 这个网站不是第一个模仿我们的,也绝不会是最后一个模仿我们的。我们相信,只有充分的竞争才能让我们进步的更快。 虽然不断的有网站在模仿,但我们的创新永不停歇,无论是表面上的创新,还是深层次理念上的进步,我们始终保持着大规模的领先。后来的竞争让我们更加清醒,帮助我们去逐步建立起壁垒。 不过我也很为他们担心,毕竟跟随者成功的机会很小,要超越我们取得成功将会是多么困难的一件事情。 在线旅游市场正在变得日益成熟,随着携程开创了在线机票,酒店预定模式,以及艺龙、遨游、芒果的加入,在线旅游预定逐渐深入人心,为这个市场进一步深入发展奠定了良好的基础。 同时,我们认识到随着人均收入的提高,城镇化进程的加速,生活节奏的加快,以及旅游基础设施的逐步完善,奥运会、世博会的召开,老百姓对旅游的需求正在前所未有的增长,在线旅游预定以其透明、高效、舒适的优点日益被老百姓所接受,这个市场将在最近几年呈现井喷式的增长。 我们对未来的发展充满信心,让抄袭和模仿来的更猛烈一些吧。 我们的口号是:要旅游,找途牛!...
Source favicon09:33 如果人类突然从地球上消失…… » 格志 - 一起格物致知

据英国媒体12日报道,现代科技在创造世界的同时,也使人类赖以生存的自然环境付出了沉重的代价:海洋污染、气候变暖、大量物种灭绝或濒临灭绝……那么,如果人类突然从地球上消失,地球将会变成什么样子?大自然需要多久才能将人类留下的痕迹全部抹去?科学家给出的答案是:20万年。

50年内伦敦将彻底消失
首先,人类消失后20年,大街和农作物将接着消失,乡村道路会被野生植物覆盖,田野中将杂草丛生。城市街道的消失将花费更长时间,但即使像伦敦这样的城市街道,最后消失也将用不了50年。

人类建筑也将快速腐朽,木制房子将在100年内消失。而由玻璃和钢筋建造的摩天大楼,将在200年内倒塌。砖、石和混凝土结构的房子将持续更久,但也将在1000年后坍塌。如果没有地震,桥梁也许能支撑200年,但即使是世界最大的拱桥最后也会在1000年后倒塌。250年内,人类建造的水坝也将坍塌。

即使像纽约这样的大都市也会被大自然瓦解。纽约植物园园长丹尼斯·史蒂文森称,如果人类消失,纽约将彻底被外来植物占领,纽约中央公园将有成群的野狼出没,酒吧的啤酒池内则蛙声四起。200年内所有纽约公园的排水沟会落满落叶,如果避雷针锈坏再遇上雷击,中央公园几十年未割过的齐膝杂草将在瞬间引燃,从而使整个纽约遗址付之一炬。

200年后臭氧层将消失

阅读更多

Source favicon08:36 Google Checkout arrives in the UK! » Official Google Blog


We're excited to tell you that as of this morning the speed, security, and convenience of Google Checkout is available to online shops and shoppers in the United Kingdom. Here's Google Checkout UK.

From now until 2008, merchants that offer Checkout in the UK will receive free credit and debit card processing for all of their Checkout sales. And just so buyers don't feel left out, we're giving them £10 off all orders over £30.
Source favicon00:20 Blogger: Now in more languages » Official Google Blog


Today Blogger is available in eight new languages! Check it out in Nederlands, Dansk, suomi, Norsk, Svenska, Русский, Türkçe and ภาษาไทย, which brings us to 19 total. Blogging is clearly a global phenomenon, and we're incredibly excited to help bring it to ever more people around the world. With Blogger, you can:
We have more languages in the works too -- stay tuned!

^==Back Home: www.chedong.com

^==Back Digest Home: www.chedong.com/digest/

<== 2007-04-12
  四月 2007  
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30            
==> 2007-04-14