Source favicon23:51 中国互联网 也成幂次分布 » Che Dong's Photos

Che Dong posted a photo:

中国互联网 也成幂次分布

www2.ccw.com.cn/05/0507/b/0507b01_2.asp

问:国外针对互联网的调查结果肯定也与中国互联网应用情况相符。我们国家有没有做这方面的调查?

答:有呀。北京应用物理与应用数学研究所的几位年青人,在水鸿寿、陈谋松研究员的带领下,根据中国互联网中心CNNIC发表的实测数据,初步建立我国WWW网站连接数、网站数、分流比的数学模型,验证了无尺度现象符合国情,并推算出幂律常数大约为2.124。

依此模型推算,当99.5%以上的网站连接数均低于100次时,却有万分之四的网站大于1000次,十万分之三的网站超出10万次。可见,网站的社会作用与文化地位差异悬殊,只要把总数千分之五(约3000个)的、有大众文化意义的网站整合起来,就可以形成某种主流文化群体,满足99%以上的访向需求。如果整合1000个网站,大约能满足95%的访问要求。

Source favicon22:46 神经网络与社会书签 » Che Dong's Photos

Che Dong posted a photo:

神经网络与社会书签

人脑的映象:社会书签正是人的"脑图"反映
news.com.com/Images+Mapping+the+human+brain/2009-7337_3-5...

正常用户的标签集呈Power law分布,而垃圾制造者,他们的标签集不存在Power law分布,他们的标签的分布是线性,甚至可能是直线的。
关于Power Law: 幂次法则
en.wikipedia.org/wiki/Power_law

幂次法则(power law)
个体的规模和其名次之间存在着幂次方的反比关系,R(x)=ax-b。其中,x为规模(如:人口、成绩、营业额…),R(x)为其名次(第1名的规模最大),a为系数,b为幂次。
当二边均取对数(log)时,公式成为log(R(x)) = log(a) - b˙log(x)。若以log(R(x))为X轴,log(x)为Y轴,其分布图呈直线,斜率为负。斜率之绝对值越小,代表规模差异越小。

幂次法则的现象在100多年前即被发现。许多的经验研究发现,诸如都市人口、网站规模、(英文)字汇出现频率、国民生产毛额…,均呈现幂次法则现象( www.isoc.org/inet2000/cdproceedings/2a/2a_2.htm )。其中,最有名的是Zipf's Law,其幂次为-1 ( linkage.rockefeller.edu/wli/zipf/ )。
幂次法则也是复杂系统(complex systems)重要的「自组织」(self-organization)现象。
复杂系统的六个特性:不存在总体生长控制规则、分散的个体互动、呈现阶层式结构、动态演化过程、不断出现新奇现象、不均衡状态。
个体的非线性(方程式)互动关系所构成的复杂系统,却可能在总体面呈现简单的形式规则(自组织现象)。幂次法则便是其中一个很常见的现象。
「都市体系」之研究:(1)1933年,德国地理学家Walter Christaller提出「中地理论」(central place theory),(2)1949年,Zipf提出「等级大小法则」(rank-size rule)。
1996年,Krugman以美国城市进行实证分析,发现:美国于一百年(1890-1990)间所形成之130个城市,呈现斜率接近-1的幂次关系。
Krugman, Paul(1996) The self-organizing economy, Cambridge, Massachusetts: Blackwell Publishers Inc.

今天还看到另外一篇论文:利用WEB日志中进行了一些用户行为分析
net.pku.edu.cn/~wbia/slides/Week14-Web%20Minig.ppt

Source favicon17:08 支持民主、反对战争、反对台独——一个大陆民主派对台湾问题的基本观点 » Anti's Blog

台湾问题是一个复杂问题,近日我在报纸上发表了对连战交棒的看法(http://anti.blog-city.com/1335009.htm),被两位博客网友认为是字里行间鼓吹战争、是奉中共旨意写作,出卖人格、沾上先烈鲜血的宵小,而以往我的所有文章都是骗取读者信任。我简直是摸不到头脑,按照这个尺度,台湾《联合报》和《中国时报》,还不都成为了中共特务所办?台独支持者的这种“不是朋友,就是敌人”的思维,真的还不如中共(它尚且知道分化和统战)。连我这种同情台湾本土化、支持台湾民主的人,都给划入了万恶敌对阵营,那你们的所谓理想还想怎么成功?

大陆人讨论台湾问题,要明白一点,台湾不是刍狗,不是一个用来说事的材料。很多朋友在谈论台湾的时候,说的还是大陆。例如有民主派,支持台独,逻辑也很一贯(和支持伊战一样):民进党代表民主,我们必须支持。这就是拿台湾说事情,把台湾当作刍狗。这种民主的台湾对抗专制的中国的逻辑,的确简单,但不能反映复杂现实。

台湾首先是2300万人的台湾,他们生于斯、长于斯,经历了苦难,也收获了幸福。中华人民共和国的统治从来没有到达过美丽岛,而目前维系台湾关系的唯一法理依据是中华民国宪法第四条,虽然经历7次修宪,也没有改变两岸地理上属于一个国家的法理。中华人民共和国宪法源于两岸割裂之后的1954年,而中华民国虽然经过7次修宪、已经把合法性立于“自由地区”的2300万人民,但残留的宪法第四条,依然有着1946年的全国性立法印记。这小小的第四条:“中华民国领土,依其固有之疆域,非经……,不得变更更之”,就是我们的最后法理希望。虽然,中宣部反对媒体多提这个“中华民国”,但最珍惜“中华民国”的,恐怕既不是国民党,更不是民进党,而是中共了。

那么台湾2300万人民有否权利决定自己的命运?中华民国宪法通过第7次修宪宣布(http://anti.blog-city.com/1328311.htm),台湾人民有这个权利,只要通过达到绝大多数人的共识,和经过民主程序。虽然门槛超级高(3/4立委出席后的3/4立委通过,还要半数公民、而不是投票者通过),但至少承认了,台湾是否独立,是完全由2300台湾人民决定的。

对这样的立场,作为支持台湾民主的我,我不反对,因为我找不到任何一条有效法条去反对。民主自决,也是自由主义民主原则之一。同时支持这种权利的,还有两岸分治的时间和政治传统。

我要表明的是,台湾人当然有民主自决的权利,但也有保护反对这种自决的人的合法权利之义务。如果台湾的自决是在压迫认可中国人的民众的基础上的,如果台湾的自决是以惩罚和驱赶认可中国人的民众为代价,这样的自决是绝对非法的。保护少数人的权利,也是民主原则之一。从这个角度说,台独分子搞的“中国人/台湾人”族群对立,其实是在给自己的台独理想送葬。即便是美国,在一国发生内乱的时候,也会护侨,无论大陆是否是民主国家,都不应对自己同胞的受迫害置之不理。

我反对台海战争,因为中华民族已经自相残杀许久,不能因为一个没有法理支持的“统一”,就诉诸战争。台湾是中华民族的优秀种子,自由民主、文化繁荣、生活安康,战争不但会毁了台湾,也毁了整个中国的未来。想想一个香港,给中国的改革开放带来多少机会,台湾如果能真正从制度上影响大陆,这是中国之幸。大陆也只有在民主之后,才有资格和台湾谈什么统一,否则所谓的统一就是专制吞并民主政权。

我心中的“统一”,其实是一个远景,是一个在大陆民主之后、和台湾的鸳鸯蝴蝶梦。实现这个梦想需要两个必不可少的条件:第一就是大陆民主,第二就是台湾不能放弃第四条。后者就是美国人说的“保持现状”(status quo),国民党说的“不独不武”。在保持中华民国宪法第四条的情况下,台湾继续自己的民主生活,大陆也向未来的民主迈进。任何试图希望打破台海现状、急独急统,都是在挑起完全可以避免的战争。第七次修宪后的中华民国宪法,事实上把这种status quo的状态稳固了,除非大陆发生内乱,否则台湾无法有独立共识。

这就回到了我完全反对台独运动的理由。台独分子在台湾人不可能达到独立共识的现在,鼓吹台独,鼓吹制宪,打破现状,就是在战争边上玩火。如果民进党(和台联)和中共在这个问题上面,互相不克制,引起了战争,他们都是历史的罪人。而战争开始后,我们所有的人,都无法逃脱对历史的责任。

一个支持台湾民主的人,理应该珍惜台湾的前途,不能动辄把台湾引入战争。这是政治现实,也是作为热爱台湾的人的责任。而一个尚有统一远景的大陆人,必须理解台湾,支持大陆和台湾的和解,让台湾人不跨出第四条的最后底线。

回到那些指责我的网友话题上,我重复我的话,台湾是2300万人民,台湾不是刍狗。台独不是对大陆民主的支持。大陆要想民主,必须要学习台湾人民,在抗争中获得自己的未来,而不是幻想台湾和中共火并。

Source favicon16:46 WordPress快速留言插件Wordspew Ajax Shoutbox » 未完成 - Incomplete
窝子曾经写过一篇令人印象深刻的文章“互动性的尝试和想法:基于博客的个人门户续篇”,里面提到了多种能够提高blog互动性的小工具,包括投票箱、即时留言板、集成聊天工具等等。不过因为需要用到第三方服务商的服务,我总会有点担心因为服务中断造成blog页面下载困难等问题,所以我虽然觉得这种增加互动性的工具挺有用的,但也一直没有在blog上加上这些服务。 现在WordPress的用户只要通过一个插件就可以简单地实现即时留言板(shoutbox)功能了,而且这个插件使用了Ajax技术,可以实时显示留言内容,你也可以通过控制面板或者是修改CSS文件来自行定义颜色、外框等内容。安装后的效果可以参看我的blog主页的侧边栏(就是插件的默认效果,我没有作任何改动)。不过目前这个插件不支持Opera8,其余的浏览器都可以正常使用。 插件的安装也非常简单,将下载包中的install-live.php文件放到blog的根目录下,从浏览器打开这个文件,执行安装过程后,会在你的mysql数据库中添加相应的表,再将wordspew目录上传至WordPress插件目录,在控制界面激活插件,最后在你的WordPress模板相应的地方插入以下的php语句以及调整样式就可以了:< ?php jal_get_shoutbox(); ?> (via Blogging Pro China) PS. Blogging Pro China是海豚新建立的一个Blogging Pro的中文站点,主要提供有关WordPress的各类插件与主题信息,WordPress中文用户必读的网站:)。
Source favicon16:34 CNBlog目录集blog列表印象 » CNBlog: Blog on Blog

blog就像网上的人格和面孔,通过blog,我们可以了解一个人,知道他的日常所想,甚至知道他的喜怒哀乐。看一个blog时间长了,那个人在我们的印象中,已逐渐和他的blog所叙给人的印象重叠在一起,虽然,实际上,blog及blog所记载的东西,仅是一个人的部分。

今天(注:6月12日)身体有些不舒服,本来写些篇正经文章,就以身体不适为由偷懒了。但正经文章不做,轻松些的事情还是可以玩玩的——于是自己想搜索些blog目录、导航类的网站,想翻些做得不错的blog浏览参观一下,顺便说不定能学点东西。

在搜索中我打开了CNBlog的这个页面“中文blog目录集”,这个页面里列出了CNBlog自2002年开办来至今在其目录集上登记成功的blog。这个列表中的每个blog,就如同中文blog这三年来走过的一个个脚印,作为一个资历尚浅的blogger来说,正是了解中文blog史的一个直观机会。

所以自己抱着轻松赏玩的心态,挑选一些blog链接打开,想看看这些资深的中文blogger们这些年来都是怎么写作blog的。下面是自己的一些简单印象:

1、最前面的一百个blog,我全部看了blog地址,发现估计约有90%的blog都是使用Blogger提供的***.blogspot.com。Blogger果然不愧是BSP的开山鼻祖,对中文blog的起步同样拥有不可磨灭的巨大功劳。

2、众所周知,Blogger提供的blog,在中国正常情况下已经打不开了,被我们的GFW屏蔽掉了,所以这些blog都不能正常访问。但是,比这更大比例的是在最早的一百个blog中,不单是blogspot上的blog打不开,而是几乎全部链接都打不开。好像唯一能从登记的链接地址中打开的blog是“一个微软员工的Blog”,登记编号是36位。这位blogger就是现在国内blog圈子里大名鼎鼎的王建硕。由此可见,领先一步固然重要,但长久坚持恐怕更有价值。(前几天刚看到王的blog帖子已过千数了)

3、上面所说的有两个例外,就是编号第一的“CNBlog.org心得集”和编号第二的Isaac的“互联教育体系网志”,他们的网志地址仍在,只是链接改动了。当然,估计其它打不开的blog中,估计好多都只是换了新的blog地址,作者可能仍然在写着自己的blog,也可能有人中断了。因为这个原因,不禁生出“人面不知何处去,桃花依旧笑春风”的感慨。

4、中文blogger使用的服务中,Blogger的兴盛之后是Blogcn。因为Blogger在中国的之封,加上国内也开始有人提供blog服务了,所以看到目录集的中间(随机点击),发现域名为blogcn或blogone的blog多了起来。不过,接下来说的印象对blogcn并不是好事:打开一些原来在blogcn上写的blog,发现往往都已中断多时或告示迁往他处了。确实,我在这半年中,非常频繁都看到从blogcn往外搬迁的现象,blogcn作为推动国内blog发展的功臣,实在应该反思一下自己的服务了。

5、越到后来,blogger们使用的BSP越来越多元化,blogbus、blogchina、yculblog等,还有一些平时基本上没听说过的小BSP,所以感觉现在提供blog服务的网站真的很多了,(还有一些使用自己的独立域名),提供blog服务的网站多了,自然是件好事,这样可快速地让blog这件新生事物普及开来,但也可能会存在一个问题,就是现在那么多提供blog服务的创业者们都能想清楚其未来的盈利或维持模式吗?今后会不会有相当多的这类小BSP关门,而使BSP集中到少量大的服务商?我想是会的。(这和blog本身的去中心化有些矛盾,但商业服务本身却完全可能会这样。)新的blog链接基本上都能打开,且大多在最近一段时间里也都有写作,当然也有些blog是尝试性质的,注册了但没写上几篇帖子就放弃了。

6、最后要说的是,CNBlog约三年来,在这个目录集登记成功的blog数量是5668个,数量并不算多。另外最新审核通过的日期是2005年3月16日,已经是近三个月前的事情了,看来CNBlog方面目前没有人手来审核新的blog登记,这也解释了我之前一直的疑虑——为什么我的blog提交了好长时间都没有成功通过。:)

Source favicon11:07 » We get to be strong cause we are together
我喝酒,常喝,但从来不醉。

不是说我的酒量好,我量很浅,浅尝已有熏然之感,稍微多一点便有呕吐之危。所以我说的醉不是生理上的,而是心理上的。



comments(0)

Source favicon08:51 待售的陶瓷小便池艺术品 » BoingBoing中文版

Richard说, “陶瓷艺术家Clark Sorensen创作了一系列集美观和功能为一体的花型小便池. 不错,你可以购买他们,把它们装在家中并在里面尿尿.他在旧金山的展览刚刚结束.”

链接(感谢, Richard!)

Source favicon08:35 很棒的怪兽杂志封面图库 » BoingBoing中文版

这是非常好的怪兽杂志封面收藏.Eerie是一个优秀的黑白漫画杂志,它具有所有老娱乐漫画的特征. 我有一些很老的版本,但不是这张印有Frazetta的.

链接(感谢,David)

Source favicon02:55 用Email来订阅RSS Feed » WebLeOn's Blog
相对Email来说,RSS Feed是更新的信息传播方式,也曾经介绍过用RSS来接收Email的方法。不过又追新者也会有怀旧者,既然blog也可以手写,反过来用Email来接收RSS又有何不可? Randy Charles Morin就为我们提供了这样一个工具:R|Mail。只要在这个页面上输入要订阅的RSS地址和想要用来接收RSS文章的Email地址,你就会在Email中收到一封确认信,点击了信中的确认链接,你就可以用你的Email来接收最新的RSS文章了。 另外,作者还为RSS的发布者提供了快捷的R|Mail订阅脚本,代码如下:(Via InsideGoogle)

^==Back Home: www.chedong.com

<== 2005-06-13

==> 2005-06-15