Danwei's favorite Chinese blog, Massage Milk, had this to say about him:
Yao Wenyuan was the most cultured of the Gang of Four, but when cultured people do bad things, they are far worse than when uncultured people do them.
Xinhua had this to say about him:
He was sentenced to twenty years imprisonment by a special tribunal of the Supreme People's Court in 1976, with political rights deprived for five years. He was released from prison in October 1996 after serving full jail term......The youngest gang member, Wang Hongwen, died of liver cancer in a Beijing hospital in 1992 while serving a life sentence.
Zhang Chunqiao died of cancer on April 21, 2005, at age of 88. He was given death sentence with a two-year reprieval by a special tribunal of the Supreme People's Court in January 1981, and his sentence was commuted to life imprisonment with political rights deprived for life in January, 1983, and was commuted again to 18 years in prison with political rights deprived for 10 years.
Jiang Qing was sentenced in 1981 to death with two-year reprieval. But the verdict later commuted to life in prison. Ten years later she hanged herself while on medical parole.
随着政府打击非法运营黑‘摩的’力度的加大,某些老百姓觉得,自己的生活越来越不方便了。以前,每天早上我都是黑‘摩的’运营者的上帝,我踏着清晨的春风骄傲的走在路上,沿途很多黑‘摩的’向我挥手拉我上车去地铁,我会选择一辆最干净的上去。而现在,黑‘摩的’是我的上帝,每天我都要在路上等很久也不一定来一辆,来了之后还会拒载。哦,天哪天哪天哪,本来受到的尊敬就不多,现在还少了黑‘摩的’这个大群体。
很拿波的是,京广桥最近漏了一个大窟窿,道路封闭,不坐地铁基本在上午时段到不了公司。哦,说到那个大窟窿,我很感兴趣,有没有三八消息可以分享阿?我就听说是一下子道路塌陷了,直径30米22米深的一个大洞赫然出现在了路中央。照常理,这应该只是故事的一个中段儿,全篇是这样的:
一个漆黑的夜里,天空中突然出现了奇异的橘黄色闪光,闪光飞速的从银河系冲进了太阳系,并且冲破了大气层,‘嗖’的一下子以迅雷不及掩耳盗铃之势降落到了京广桥附近。随着一声巨响,京广桥下的大窟窿出现了,浓烟散去之后,窟窿里面应该有一个闪着金光的高科技蛋。于是政府迅速赶到封锁了现场。之后的故事请参阅‘星球大战’。
這週不但是我的生日週,好像也是我的媒體露出週。週一(1月2日)以「電子相簿達人」之姿上了中國時報,今天(1月6日)則看到工商時報刊登了之前我接受中時部落格「部落格人物」的專訪內容。感謝媒體朋友們的青睞,在此一併謝過了!欣喜之餘,更讓我感到戒慎恐懼。2006年的第一週,料想不到以這樣的方式揭開序幕,前瞻這嶄新的一年,我明瞭自己的路正遠。嗯,無論是部落格圈或者網路界的變化都太快了,可得要更加專注在努力學習這回事上!我想我會永遠記得所謂的「葛洛夫法則」,也就是「唯偏執者倖存」(Only the Paranoid Survive)這句話依舊適合現今的社會吧! 註:點選照片後,可以看到我在flickr上加上的一些註解,謹供參考。
搜索引擎 | 搜索力指数 | 排名升降 | 份额 |
1. Baidu |
158006402 |
![]() |
62.03% |
2. Google |
30164966 |
![]() |
11.84% |
3. 3721 |
26065082 |
![]() |
10.23% |
4. Yahoo |
22046942 |
![]() |
8.65% |
5. 163 |
6113042 |
![]() |
2.40% |
6. Sogou |
5754518 |
![]() |
2.26% |
7. QQ |
2755034 |
![]() |
1.08% |
8. China |
1346414 |
![]() |
0.53% |
9. iAsk |
1245698 |
![]() |
0.49% |
10. Zhongsou |
585350 |
![]() |
0.23% |
11. Tom |
340010 |
![]() |
0.13% |
12. Yisou |
302174 |
![]() |
0.12% |
13. Sohu |
6530 |
![]() |
0.00% |
14. Sina |
134 |
![]() |
0.00% |
所谓关联RSS, 就是和某个RSS内容相关的一个或多个RSS。在RSS订阅时,获得与之相关联的RSS,既节省了用户寻找RSS的时间,也扩展了阅读器订阅RSS的范围。
这种方法类似于我们在搜索引擎上做基于关键词的搜索。通常,我们输入某个关键词后,搜索引擎在输出搜索结果的同时,还推荐了相关的关键词。在Delicious上查找TAG时,也会给我们相关的TAG。上述的关联关键词或者关联TAG通常是比较准确的。我们同样可以利用上述关联的方法来做RSS的推荐。
一般来说,我们需要一个强大的RSS数据库,它最好是一个封闭的系统,比如一个RSS阅读系统,有着可以用于统计的用户数据。
我们做关联RSS的立足点是,一个用户订阅的RSS一般来说是兴趣集中的。以某一个RSS为出发点,我们获得所有订阅了该RSS的用户,并统计所有用户针对该RSS的相关订阅(更准确地,是该RSS所属分类的所有RSS,以用户所设置的分类为标准),通俗的描述就是“订阅了该RSS的用户,还在此分类中订阅了…”。
如上述方法统计的RSS/RSS数量分布结果为高斯分布,获得的统计数量较多的RSS即为相关RSS。在用户订阅RSS时,可以列举一定数量的RSS推荐给用户。
另外一种获得关联RSS的方法是RSS搜索引擎处理自己的数据,获得某RSS的关联RSS。这需要RSS搜索引擎(而不是Blog Search)采集海量的RSS数据。
搜索引擎所做的第一步是获得RSS数据,分析RSS数据。一般来说,带有RSS条目DESCRIPTION的RSS足以反映RSS的特点,甚至仅仅含有RSS条目TITLE的RSS也是可用的。通过分析(中文RSS需要分词),获得RSS的带有权重的关键词。上述处理过程中,如果有足够的资源,可以进一步获得RSS所指的文章的内容做进一步分析。
第二步是RSS数据的预处理过程,即通过RSS关键词的相似性分析,获得一个正则化(Normalized)的RSS-RSS相似性数值,最后获得某RSS的最相近的RSS列表。这个处理过程同样需要耗费相当大的资源,所以以采用某些RSS作为种子(Seed)RSS处理,可以节省计算时间。所幸的是,RSS相似性分析对实时性要求不太强烈。分析一次关联RSS后,“有效期”可以持续很长时间。
对于Blog用户,OKRSS则采用了分析Blog用户页面的方法获得关联RSS,此方法假定的前提是Blog用户和他所提及的RSS是关系比较密切的。这种方法对于那些Blog上链接了RSS的用户比较容易获得关联RSS,但是对于只链接了其他用户Blog网址的用户,则需要借助于OKRSS采集的海量RSS数据库。此方法首先是利用RSS做RSS - Blog用户主页对照表,然后采集分析用户日志,获得可能的URL,把URL映射回RSS,以获得RSS的关联RSS。
Tags: Web2.0
博客邮箱终于开发完毕,到现在为止,博客网的两个产品我最满意,一个是图片博客,另外一个就是这个博客邮箱,这两个产品都是2005岁末开发完毕的。
博客邮箱现在尚处于测试阶段,我的博客邮件地址是 luliang@bokee.com ,已经开始使用了 :)
当然,有搜索引擎就有spam,同样,有邮箱就有垃圾邮件。如何防止垃圾邮件呢?
1.Blocking 阻断
阻止包括多种做法,主要的阻止是smtp的IP进行阻断。国际上常常定期公布spam IP list,这些要么是恶意的spam IP或者是被人利用作relay。
另外阻止email address也是常用的一种做法,就是简单的将发信人的email address进行阻止。
2.IP 反查 和用户反查
对发信的IP进行域名的合理性反查
对发送用户的email 地址的有效性进行反查
对邮件对话进行有效性的检测
3.名单
白名单:安全名单
黑名单:spam 邮件名单
灰名单:进行一次的阻止,并等待对方的email server的第二次尝试。因为通常的spam很少进行第二次的发送尝试,而健全的email server则会在第一次投递失败后会再次重新发送。
4.贝叶斯统计算法
这个是根据相关性的原理,对非垃圾邮件和垃圾邮件进行分词词频的相关性统计,得到相应的共同出现时成为垃圾邮件和非垃圾邮件的概率。
5.联结目标源
联结垃圾目标源的邮件有可能是垃圾邮件。
6.邮件运营商根据内容进行数据挖掘
大量的邮件几乎完全一模一样,可能是群发的垃圾邮件
根据用户自己定义的垃圾邮件的规则应用在全部的邮件上
根据大量的用户自己挑选的垃圾邮件进行训练,得到词频序列,并对新进的邮件进行比较测试最大似然。
7.基于分类模型的检测
跟贝叶斯异曲同工,各种的分类算法这里就可以用得上了。
参考文章基于内容的垃圾邮件过滤技术综述
这里的7条,挂一漏万,如有补充,请回复。
Tag=brandvista, nextfuzhou,xiaorong
小容昨天晚上统计了一下2005年在网络上写的文字和发布的东西,放在这里供回顾。今天先回顾发表在网站的正式文章。
•发表在品牌几何BrandVista.com里的文章4篇:
1、法定名称、商标、商号、和品牌名称
2005年5月13日 (看起来算是最完整的一篇文章)
2、Interbrand鲜为人知的故事
2005年5月22日 (简短的CI行业背景介绍文章,“未完成”的系列之一)
3、Lippincott Mercer,当品牌识别遇上战略管理
2005年6月25日(另一篇CI行业背景介绍文章。最新可以Update的消息是Lippincott Mercer推出了他们的中文网站。)
4、即将到来的百度品牌保卫战
2005年8月11日 (其实是以电子邮件形式写的,在小容的电脑本地里只是一篇规划好的文章的第一部分,列入“未完成”事项。)
•发表在摩登福州NextFuzhou.com里的文章0篇:
摩登福州NextFuzhou.com在上半年编辑了一期电子杂志以后,在2005年6月17日的时候暂停更新,不过继续将内容保留在网络上。因为好象是卸掉了一幅担子,没有责任的驱使,发现自己在2005年没有写出像走出美丽的数位次元世界、个人在网络空间的职业生涯转变、软件外包的福州竞争优势这样自己喜欢也满意的文章。
最想写而没有写的1篇文章题目是:
-1、此间的涂鸦少年(列入“未完成”的事项)
小容在年初的时候看到每天经过的洪山桥头有一片的涂鸦,于是找了一个周末跑过去将它们全部拍了下来。看到那些图片以后联想起“80年代”的一些话题,包括社会主流舆论对80年代的看法,以及80年代对社会的看法……起这个题目实际只是引子,更想就此写几个自己在现实生活和网络世界中认识的80年代,以及和其中一个家伙交流的80年代营销话题的几个方面。
估计要全部写成一个图文并茂的自己满意的东西,可能要花上10天半个月也不一定。因此,找个时间将照片发布上来倒是可以先做的准备步骤:)
明天开始发布关于写在blog上的文字的统计资料。