Source favicon21:01 Metro Line #4 Opens » Wangjianshuo's blog
Metro Line #4 in Shanghai (partly) opened to public on Dec 31 - the last day in 2005. The new #4 is a circle line. Due to the huge accident of the tunnel near the Nanpu Bridge (water flooded into the construction site of the tunnel), the part from Lancun Road (in Pudong) and the Damuqiao Road (in Puxi near Xujiahui) didn't open. I have no idea about when the tunnel will be repaired. To me, there is not too...
Source favicon12:20 chedong.com 2005 年度分析 » Che Dong's Photos

Che Dong posted a photo:

chedong.com 2005 年度分析

2005 年终盘点
0 整体流量: 808090 人次 (2.39 网页数/参观者) 浏览器流量共 137.29 G字节 非浏览器流量 33.62 G字节

1 月度流量: 访客数量是按照独立IP统计的, 访问人次是按照session统计的, 和年初相比, 月度访问人次从43839增加到97742,
2 访问主机: 虽然有很多referer spam
3 搜索引擎网站的机器人 (前 10) - 全部列出 - 最近参观日期
130 个机器人* 文件数 字节 最近参观日期
Yahoo Slurp 938933+36039 8.04 G字节 2005年 十二月 31日 23:59
Googlebot 212575+3310 2.90 G字节 2005年 十二月 31日 23:59
MSNBot 208535+4166 4.05 G字节 2005年 十二月 31日 23:56
Unknown robot (identified by 'spider') 112633+1510 1.41 G字节 2005年 十二月 31日 22:17
MagpieRSS 69317 1.28 G字节 2005年 十二月 31日 23:48
SohuSpider 67973+2 1.04 G字节 2005年 十二月 31日 23:57
Sina Iask 60052 670.20 M字节 2005年 十二月 31日 23:57
Unknown robot (identified by 'crawl') 47912+1046 730.26 M字节 2005年 十二月 31日 23:47
BaiDuSpider 28997+716 359.25 M字节 2005年 十二月 31日 23:04
Alexa (IA Archiver) 24709+1652 383.09 M字节 2005年 十二月 31日 20:37

spider的访问也可以看到搜索引擎激烈的竞争: 区别较大的是对robots.txt的处理: Yahoo! Slurp抓取了3万次 而有些spider却几乎没有任何反应, 百度明显对于英文的内容抓取深度有所限制.


4 主要内容分布:
首页 / 203706
CVS /tech/cvs_card.html 80951
免费杀毒软件AVG /blog/archives/000741.html 76120
BLOG首页 /blog/ 41447
Lucene /tech/lucene.html 38907
AWStats /tech/awstats.html 35033
技术 /tech/ 33262
Apache安装 /tech/apache_install.html 31514

5 操作系统: Linux略有起色 但是作为桌面,还远不够成熟
Windows 10475623 82.8 %
无法得知 1845748 14.5 %
Linux 168841 1.3 %

6 浏览器: 在高端用户中FireFox增长很快 年底已经上升到了14%(我也常用)
浏览器 离线浏览器(网页抓取) 文件数 百分比
MS Internet Explorer 否 8925136 70.5 %
无法得知 ? 1750830 13.8 %
Firefox 否 1413536 11.1 %
Mozilla 否 168948 1.3 %
Opera 否 99397 0.7 %

7 来源:
来自搜索引擎 - 仍然凸现了搜索引擎作为互联网内容路由器的力量
- Google 253588 254948
- Baidu 208678 245177
- QQ 9100 11276
- 3721 8848 8848
- Yahoo 8600 9325
- YiSou 3599 5320
- NetEase 2227 2240
- MSN 1690 14115
- SoGou 1268 1275

Google在高端用户中的黏度仍然很高;
百度已经是更多人的主流搜索引擎;
QQ上升很快;
雅虎: 3721+yahoo.com.cn+YiSou合并起来份额还是非常大的;

8 非搜索引擎的来源中 还是要花点时间将referer spam 过滤掉
- www.bloglines.com/myblogs_display 3599 19686
- www.blogchina.com 3170 3174
- www.blueidea.com 1628 1628
- www.zdnet.com.cn/developer/tech/story/0,2000081602,391033... 1179 1179
- blog.blueidea.com 1051 1051
BlogLines的RSS阅读已经成为很重要的来源;

9 搜索关键词
用以搜索的短语 (前 10)
139129 个不同的关键字句 搜索 百分比
免费杀毒软件 24214 4.9 %
cvs 21050 4.2 %
免费杀毒软件下载 20089 4 %
ant 10903 2.2 %
apache 10106 2 %
google earth 8902 1.8 %
lucene 8082 1.6 %
resin 5643 1.1 %
cms 4733 0.9 %
保护环境 4030 0.8 %
其他短语 375551 76.1 %

虽然热门词数量很大, 但是尾巴更长 76.1%

10 在RSS阅读方面:
各种软件和服务显得纷繁复杂^_^

Source favicon08:14 Vista Digesting 2006-01-01 » Vista 2.0

我正在關注:

Google Maps Mania An unofficial Google Maps blog tracking the websites, ideas and tools being influenced by Google Maps. (tags: google maps)

Wired News: Best Tech Moments of 2005 In the tech world, 2005 was a period of bold ideas and exciting breakthroughs — shadowed, at times, by devastating reversals. (tags: tech 2005 wired moments)

Wired News: Blogs Wired Blogs. (tags: blog wired)

Business [...]

07:00 2006/01/01 07:00:00TraCQ洽谈通搜索力指数排行榜 » TraCQ洽谈通搜索力指数
 搜索引擎  搜索力指数  排名升降  份额

1. Baidu

 
 115109666

  
  

 59.32%

2. Google

 
 22160342

  
  

 11.42%

3. 3721

 
 20965514

  
  

 10.80%

4. Yahoo

 
 18588542

  
  

 9.58%

5. Sogou

 
 6534338

  
  

 3.37%

6. 163

 
 4924502

  
  

 2.54%

7. QQ

 
 2490938

  
  

 1.28%

8. China

 
 1082318

  
  

 0.56%

9. iAsk

 
 1031906

  
  

 0.53%

10. Zhongsou

 
 440726

  
  

 0.23%

11. Tom

 
 358874

  
  

 0.18%

12. Yisou

 
 346190

  
  

 0.18%

13. Sohu

 
 6530

  
  

 0.00%

14. Sina

 
 134

  
  

 0.00%
Source favicon02:40 Re: SNS » Xerdoc Together
很久没有Re了,就Re一篇。之所以是Re而不是原创只是因为最近思路不集中,可是看到大家的文章总想说说,呵呵。 最近只说和老冒较上劲了,从microcontent/format到SNS,确实是精彩不断,不亚于2005CCTV年度经济人物评选,呵呵,从中收益很多。我也想说说SNS。其实我也不是很了解SNS的全貌究竟是什么样子,不过看了只说和老冒的blog,觉得困惑多多,不知道是不是因为自己想象力已经贫乏还是因为什么。其实我想说的,不是SNS的全貌,只想说说SNS与Blog,估计可能是老冒所说的开放式的SNS。 我粗浅的理解SNS就是联系网络众人的一个规范化系统,个人信息在网络上公开,开放式SNS是说,现在已经没有办法要求SNS做成中心化系统,去中心化的趋势也就是开放式的趋势,这也是因为blog带来的巨大革命。为啥是Blog呢,blog带来了个人知识管理的新天地,延伸开来,包括你的Flickr、你的Delicious,从一个人的Blog、Flickr、Delicious就能知道这个人每天在想点啥。说知识管理可能不好理解,说一个字肯定好理解,那就是“通”。 能把很多不同的SNS, 或者不是SNS但需要社会性特性的服务可以“串起来”,可惜聊下来一圈…想法很好, 愿意支持的并不多。这就如同IM互通、电信-网通互联互通一样, 技术上其实没有问题,主要是商业上难谈得拢。 我理解SNS重要的一点是社会性,而谈到社会性就离不开Social Software,类似于blog、flickr之类的服务,去中心化是个趋势,无法要求人们都上你的网站完全使用你的服务。我理解SNS另外重要的一点就是互通性,在上面前提之下谈互通性,那就得在各种服务之间达到互通。这时,我想到的最好的SNS系统就是豆瓣,因为他够专一,所以,他的社区专一,不必理会其他那些东西,又想到Craglists,好像也是个很好的SNS,也是因为他专一。专一,就是中心化呗,数据服务都在那里,那我们怎么搞定这个开放式的SNS啊? 可以推行标准,或者坚持使用通用标准,提供blog结构化和标准化的工具,并且促进从sns内部到外部的联系。也就是说,可以视一个结构化良好的 blogger为社区内部的用户,只是并不附属于sns,但是可以参与sns内部的圈子和团体,甚至可以拥有某些用户行为。如果现在不存在结构化良好的 blog,那么坚持以社区服务为吸引力,引导blogger或者其他BSP形成结构化。 其实,老实说,当初没看懂只说这段话,或者想象不出来究竟这会是什么样子的一个趋势?只说推荐我老冒的文章,结果还是糊里糊涂的(可能是因为喝了酒的原因),不过大致了解了一些。现在觉得SNS就是一个字——通。通能带来什么,带来link啊,带来rss啊,带来FOAF啊,带来Search Results啊。像只说文中提到的一样, 可以提供聚合服务,收集现有这些结构化和标准化内容。如果现在没有这些内容,那么以聚合服务,吸引blogger或者BSP提供或者产生结构化内容。 ok,看看孟岩最近集成的Lilina服务,http://www.mengyan.org/70s/,这是什么呢,是现在收集到的北航3706大班的blogger的rss,我觉得这也是个SNS,因为他通了,我能看到我没有订阅的人的blog,我能了解他的信息,呵呵,引用吉子很长时间一直跟我说的一个概念,“Blog群”。这就是了。对于RSS Reader也有帮助,我可能不愿意订阅他的rss,不过他可能是这个Blog群的一员,我还是能看到,或者很关心的看到。 嗯,有点意思,呵呵。 BTW:写在2006年凌晨,有点醉,Xerdoc祝大家新年快乐,关于Blog群,希望吉子能撰文一篇,好好给大家yy一个,呵呵 Tags: Tech, SNS © Winters Mi for Xerdoc Together, 2006. ¦ Permalink ¦ No comment Add to del.icio.us [...] Tags: ,
Source favicon01:09 Web 2.0 的用户 » blog中文翻译
原文: The Web 2.0 Customer(s) 作者: Nivi on Community 你可以把Web2.0的消用户们模糊的按照下述的层次来分类: 创作者:原始内容的创作者们。就像纽约时报的记者、一个制作内容的播客和博客、或者是哈里波特的作者。 链接者:原始内容的引用者们。例如那些经常引用其它内容的博客们,或者是使用del.icio.us的RSS来公布自己收藏内容的用户们。 评论者:原始内容和引用内容的评论者们。包括了任何给Blog写评论的人。 浏览者:浏览那些原始的、引用的和评论内容的人们。在任何时候,你只要阅读某人的Blog,你就是一个浏览者。 引用者比创作者多多少?评论者又比引用这多多少呢?可能你觉得每一级的差别大概是10倍吧?我猜在这个层次中,每下降一级用户的数量会成指数级别的增长。 每个层次的用户价值是什么呢?如果你帮助创作者或者是浏览者,你可以赚到钱吗?我猜最多的钱可以从浏览者那里获得。举个例子,你可以看看Yahoo和Google的资本市场是什么样的。 所有的用户都会留下他们参与过的痕迹。如何利用这些痕迹来创造商业模式呢?Google的PageRank算法利用引用者的参与来评级搜索结果:网站被链接的越多在搜索结果中就越靠前。Google的AdWords算法使用浏览者的参与来评级广告:广告被点击的越多在Google里面就会评级越高。那么利用Web2.0中不同类型用户的参与来创造的其它机遇又是什么呢? (indigo 翻译整理)
Source favicon00:53 Happy New Year » Wangjianshuo's blog
This is the first post in the first several minutes of the year 2006. Happy New Year...

^==Back Home: www.chedong.com

<== 2005-12-31

==> 2006-01-02