《通用规范汉字表》发布了!阮一峰的网络日志 » 车东's shared items in Google Reader
Shared by 车东
统计显示,信息时代使用的汉字越发集中,600多字就可以覆盖当代汉语书面材料的80%以上,900多字覆盖90%,2400字覆盖99%以上,5200多字覆盖99.99%。同时,99%的中国人认得的汉字不超过3500个,99.99%的中国人认得汉字不超过7000个。

天上午,教育部正式发布了《通用规范汉字表(征求意见稿)》

这是一件很重要的事,对我们使用语言文字有深远的影响。比如,国家语委早就表态了,新生儿起名将只能用这张表里的汉字。

什么叫“规范汉字”?

《中华人民共和国国家通用语言文字法》第三条明确规定,“国家推广普通话,推行规范汉字。”

这就是说,“规范汉字”是一般情况下你能使用的汉字。换言之,不在《通用规范汉字表》里的字,就是一般情况下不能使用的字。

这张表公布以后,将来全国所有的公共场合、政府的各种文件、新闻媒体、计算机通用汉字集都会以此为标准,不使用这张表里没有的文字。所以说,它是很重要的。

“规范汉字”有多少?

现在的《通用规范汉字表》中,一共包含了8300个汉字。说实话,这个数量是绰绰有余的。

全部汉字的数量,大概是8万多个,但是常用汉字只有3500个,就连《二十四史》这样的书,也只用了7000个左右(参见我写的《汉字的数量:词涯七千》)。所以说,8300字实际上是一个很大的字集。

另一方面,统计显示,信息时代使用的汉字越发集中,600多字就可以覆盖当代汉语书面材料的80%以上,900多字覆盖90%,2400字覆盖99%以上,5200多字覆盖99.99%。同时,99%的中国人认得的汉字不超过3500个,99.99%的中国人认得汉字不超过7000个。这表明,8300字中的许多字其实很少有机会用到。

汉字的级别

《通用规范汉字表》把所有汉字分成四个级别。

第一级是常用字,共3500个,满足基础教育和文化普及层面的用字需要。

第二级是通用字,共6500个,满足现代汉语文本印刷出版用字需要。

第三级是规范字,共8300个,满足与大众生活和文化普及密切相关的专门领域的用字需要。

第四级就是全部汉字,包括规范字、未规范字、不规范字等等,共8万多字。

【下载】

* 《通用规范汉字表(征求意见稿)》(PDF文件,4.07MB)

(完)

20:32 Discuz!论坛 AdSense 广告展示问题解决办法 » Google AdSense 中文博客


这两天有些iscuz!论坛发布商反映广告无法展示,经过和Discuz!团队以及AdSense产品部门的沟通,AdSense 现提供以下解决方案:

请大家进入Discuz!安装目录,在include\js目录下的common.js文件内删除以下语句:

Array.prototype.push = function(value) {

this[this.length] = value;

return this.length;

}

如果调整以后,您的Discuz!论坛依然不能正常展示AdSense广告,请通过AdSense帮助中心和我们联系。
Gmail – 全球最环保的电子邮件供应商谷奥——探寻谷歌的奥秘 » 车东's shared items in Google Reader

感谢 L. Young 的投递。

20090823-gmail-green

信息产业及消费计算机的使用是全球二氧化碳排放量的主要罪魁之一,毫无疑问,这之中电子邮件业务应负主要责任。当你每次发送和接收电子邮件时,即使你很少把电子邮件存储于服务器上,也一样消耗着能源。现在有人表示说,如果您想要减少你的电子邮件消耗的能源,你最好选择Gmail作为您的邮件系统。

在OpenWeb Developer’s Journal这本杂志上,Bob Gourley 称Gmail是世界上最环保的电子邮件系统。他的论点很简单。Google在优化数据中心上做了很多工作,采用如水蒸冷却的技术,优化电力基础设施,用以减少能源消耗。他说:“他们(Google)甚至将图形处理器(GPU)移出了他们的服务器,用以减少能源消耗。”

这一切使得Google的数据中心非常节能、绿色、环保。对于数据中心功耗的测量,使用最多的是PUE测量法--数据中心使用的电力总量与除以它在数据处理上实际用到的能源。也就是说,PUE的值越低越好,PUE的最低值为1.0。当然,要真做到PUE=1,这是不可能的,因为数据中心有如供电、冷却等消耗。可想而知,PUE越接近1.0,说明数据中心越节能。

Gourley说,Google已经订下了一个目标——要让其数据中心整体PUE达到1.1,现在已经有部分数据中心的PUE降低到1.11了。“微软也是PUE方面的领导者之一”,Gourley说,“微软全球的数据中心的平均PUE达到了1.60,这是已经相当不错了。”

Google也采取其它措施来减少其数据中心的二氧化碳排放量,如利用可再生能源,冷却水回收等。

这也就是他认为Gmail是全球最环保的电子邮件的原因——因为Google采用最环保的数据中心。他同时也建议用户使用Hotmail,因为微软的数据中心也是相当环保的。

原文地址:http://www.greenercomputing.com/engage/blog/2009/08/21/gmail-worlds-greenest-email

twitter: https://twitter.com/lepture


© gkp 发表于 谷奥——探寻谷歌的奥秘 (http://google.org.cn), 2009. | 6 条评论 | 永久链接 | 关于谷奥 | 投稿/爆料
Post tags: , ,

09:34 豆瓣读书即将解决版本问题 » 豆瓣blog

下周,读书存在已久的版本问题将得到解决。

这个问题最明显的表现是:如果我读过《呐喊》,豆瓣猜会连续不断地推荐各种不同版本的《呐喊》给我,它们有不同的封面,出版社,出版时间,可我其实只需要一本《呐喊》。

这一年来,关于这个问题,我们收到了无数书虫们通过help邮箱或小组发言转达给我们的建议。正是这些建议帮助我们形成了最终方案。

豆瓣图书会将同一作品的不同版本归纳起来,展示在一个单独页面里。这个页面可以由书虫们来添加和编辑。如果你确切地知道06年上海译文出版社的《在路上》是01年漓江出版社的《在路上》的另一个版本,你可以添加;如果发现某个版本是指鹿为马,你可以报错。贡献者的信息会在版本页面被永久标记。

随着豆瓣数据库里的版本数据的完善,豆瓣猜的智商也将大大提高,再也不会推荐同一作品不同版本的书给你了;有些已经绝版不再出售的图书页面(比如86年版的《傲慢与偏见》),会有最近新版的价格帮助购买(比如06年的《傲慢与偏见》有售);对于多达十几种版本的图书,版本页面还会显示各自的收藏人数和评分,帮助大家比较版本的好坏。

另外还有一些额外的功能和应用,过几天大家就能看到。版本是所有豆瓣书虫关切许久的问题,现在我们相信正走在解决它的正确道路上,这是一个筚路蓝缕,苟日维新的过程。

不久之后,相信豆瓣图书除了丛书外,会出现另外一条丝线,穿起那些散落的珍珠。


^==Back Home: www.chedong.com

^==Back Digest Home: www.chedong.com/digest/

<== 2009-08-22
  八月 2009  
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
==> 2009-08-24