赶在AWStats 6.6正式发布前的更新
目前我一共提交了5个主要的补丁:如果大家感觉有需要,请到sf.net的相关主题中反映并推进一下,争取在6.6版本正式发布时以下补丁已经直接在下载版本中可以使用,让国外的开发人员接受面向中文和本地去求的补丁还是需要非常主动的沟通的。
1 过滤HEAD请求:这是我目前找到的避免referer spam最简单的方法;
diff -r1.885 awstats.pl
6322d6321
< || $field[$pos_method] eq 'HEAD'
而且很多HEAD请求是来自浏览器或者机器人的缓存请求,的确不应该作为浏览量加入统计;
2 针对主要中文搜索引擎的定义:主要有8个;
> '\.baidu\.com', # baidu search portal
> '\.vnet\.cn', # powered by MSN
> '\.soso\.com', # powered by Google
> '\.sogou\.com', # powered by Sohu
> '\.3721\.com', # powered by Yahoo!
> '\.iask\.com', # powered by Sina
> '\.163\.com', # powered by Google
> '\.zhongsou\.com', # zhongsou search portal
近期vnet等引擎的加入让搜索市场的格局有较大的变化;
3 增加了国内主要spider的定义:
国外的开发者不会中文,于是找到了sohu的这个说明页作为sogou spider的说明页:
http://corp.sohu.com/20051130/n240842344.shtml
此外:还将TT当成了蜘蛛,其实是腾讯的浏览器;
4 修正浏览器中的在线RSS阅读器定义:
lilina加入到robots.pm中去了,加入了potu的定义。awstats中最近增加最快的就是各种rss蜘蛛和rss浏览器的定义,天知道怎么会有那么多小公司在做RSS的相关产品开发。而国内一些真正流量大的缺很少被发现并添加到robots.pm和browsers.pm中去。
5 中文的界面的语言包: 少量说明文字更新。