目前我一共提交了5个主要的补丁:如果大家感觉有需要,请到sf.net的相关主题中反映并推进一下,争取在6.6版本正式发布时,以下补丁已经直接在下载版本中可以使用,让国外的开发人员接受面向中文和本地去求的补丁还是需要非常主动的沟通的。
1 过滤HEAD请求:这是我目前找到的避免referer spam最简单的方法;
diff -r1.885 awstats.pl
6322d6321
< || $field[$pos_method] eq 'HEAD'
而且很多HEAD请求是来自浏览器或者机器人的缓存请求,的确不应该作为浏览量加入统计;
2 针对主要中文搜索引擎的定义:主要有8个;
> '\.baidu\.com', # baidu search portal
> '\.vnet\.cn', # powered by MSN
> '\.soso\.com', # powered by Google
> '\.sogou\.com', # powered by Sohu
> '\.3721\.com', # powered by Yahoo!
> '\.iask\.com', # powered by Sina
> '\.163\.com', # powered by Google
> '\.zhongsou\.com', # zhongsou search portal
近期vnet等引擎的加入让搜索市场的格局有较大的变化;
3 增加了国内主要spider的定义:
国外的开发者不会中文,于是找到了sohu的这个说明页作为sogou spider的说明页:
http://corp.sohu.com/20051130/n240842344.shtml
此外:还将TT当成了蜘蛛,其实是腾讯的浏览器;
4 修正浏览器中的在线RSS阅读器定义:
lilina加入到robots.pm中去了,加入了potu的定义。awstats中最近增加最快的就是各种rss蜘蛛和rss浏览器的定义,天知道怎么会有那么多小公司在做RSS的相关产品开发。而国内一些真正流量大的缺很少被发现并添加到robots.pm和browsers.pm中去。
5 中文的界面的语言包: 少量说明文字更新。
在Yahoo! Web Search里输入地名相关的搜索,shortcut的变化有:
1. 输入一个地名:
若输入美国城市名,如“chicago”,在十个正常搜索结果之上,有旅游、本地商业、地图、气象、新闻等快捷链接(见下图);若输入美国州名,如“california”,有旅游和新闻链接;若输入其他国家的城市名称,如“beijing”,一般只有旅游链接;若输入其他国家名称,如“canada”,则有旅游、World Factbook(世界概况)、新闻等链接。
2. 输入两个关键词,都是地名:
2.1 如果两个都是美国城市名称,如“chicago boston”和“boston chicago”,在搜索结果之上会有本地商业、地图搜索链接,默认前一地名为商业关键词,后一地名为地点关键词。
2.2 如果两个都是美国地名,一个城市名称、一个州名,那么:
若城市名称在前、州名在后,如“chicago illinois”和“chicago il”(两者的shortcut相同),搜索结果的上面会有旅游、本地商业(“Find a Chicago Business”,默认城市为地点关键词,商业关键词空缺;但此种情况下,Google不提供本地搜索的链接)、地图、气象链接;
若州名在前、城市名在后,如“illinois chicago”,那就没有旅游链接,但有本地商业(默认前面的州名为商业关键词,后面的城市名为地点关键词)、地图链接。
2.3 如果一个美国城市、一个其他国家的城市,那么:
若美国城市名在后,其他国家的城市名在前,如“paris chicago”和“beijing chicago”,搜索结果之上会有本地商业、地图的链接,默认后面的美国城市为地点关键词,前面其他国家城市名为商业关键词;
若美国城市名称在前,其他国家城市名在后,如“chicago london”,则没有本地、地图快捷链接,只有新闻链接。
3. 输入两个关键词,一个地名、一个非地名:
3.1 如果地名是美国城市名,并且是后一个关键词,如“food chicago”,那在搜索结果前面,会提供本地商业、地图链接,默认前一词为商业关键词,后面的城市名为地点关键词;若城市名在前,如“chicago food”,就没有本地商业和地图链接(此时搜索意图应该还比较明显,但Yahoo!没有像Google那样予以识别)。
3.2 如果地名是州名,则无论两个关键词的词序,都不提供本地商业和地图链接,如“food california”和“california food”。如果地名是其他国家地名,如“food beijing”,也不提供本地和地图链接。这两种情况下,若有相关新闻,则显示新闻链接,如“food london”(你点击的时候也可能没有)。
4. 输入三个或更多关键词:
4.1 如果最后一个是美国城市名,无论前面的关键词数量和是否为地名,如“boston seattle los angeles”或“food seattle los angeles”,在搜索结果之上会有本地商业、地图链接(当然,关键词数量过多,也可能导致搜索不到相关的快捷链接),默认最后的美国城市名为地点关键词,前面的所有词都作为商业关键词。
4.2 若最后一个是美国州名,那要看州名前的那个关键词,如果是该州内的城市名,如“food los angeles california”,会有本地商业(默认城市为地点关键词,前面的其他搜索词为商业关键词)、地图的链接;如果最后一个州名之前的那个城市不是该州的城市,如“food los angeles boston california”,就没有本地、地图链接。
以上,与美国地名搜索有关的Yahoo! Shortcut,基本规则如下(发现错漏,请补充。谢谢):
相关:
这次 Yahoo! Hack Day 最引人瞩目的成果当属:BBAuth(Browser-Based Authentication)。在日常上网使用各个站点的服务的时候,身份验证就让我们很烦,在一个站点输入用户名、密码; 到了另一个站点,还是要输入用户名、密码;个人管理这些安全信息就是一个麻烦事情,而这些身分认证的管理对于一些中小站点来说,也是一个不小的负担。BBAuth(基于浏览器的身份验证) 就是雅虎试图解决这个问题的推出的一个方案。
BBAuth 的示意图如下:
(图是借用官方站点上的)
第三方需要用户身份确认,请求页面重新定向到 Yahoo! 登陆页面,Yahoo! 验证后返回凭证给改第三方站点。
这个服务和 OpenID 都在尝试解决同样地问题。不过,差别还是不小。
Yahoo! BBAuth 的优点是第三方站点可以直接与雅虎的所有用户进行交互。身份验证的成本大大降低。缺点是,不够开放。Yahoo! 相当于一个大磁铁,把使用 BBAuth 服务的 Web 站点集中在自己周围。
OpenID 的优点是开放性好,不存在集中化的弊端。但是没有大商业团体的推动,如果构建的话,总体的成本偏高。
其实我更关心 Yahoo! 认证时候的网络响应速度 :)
对于一些特定的 Web 应用,BBAuth 优势很明显,比如解决 Blog 牛皮癣(Comment Spam) 的问题。
Updated: 已经有人在使用 BBAuth 进行 Blog Commenter 的身份验证
--EOF--
看了《夜宴》,感觉的确是一部烂片。网上的评论都是一片恶评,真不知道高票房都怎么出来的。
《夜宴》为什么烂?
编剧烂。编剧烂直接导致台词烂。那些半口语,半文言的台词,有的让人肉麻,有的让人捧腹。如"寂寞歌手"、“一舞剑器动四方,表演确是我所长”之类的台词,实在是让我怀疑这位国家一级编剧看多了琼瑶与余秋雨。编剧烂,情节自然也烂。太子被胁迫出使,羽林卫停下来要杀他的地方居然也是殷隼(这名字叫的)埋伏的地方,而且刚好进入了包围圈,强,构思"巧妙"无比。
演员烂。或许是导演看重章子怡的在欧美的影响力吧,硬生生的加了很多不该有的戏份儿,把整个故事的结构变得很不协调。这个始作俑者应该是张艺谋,在英雄里就把章子怡那个无足紧要的角色一遍一遍的弄来弄去,观众看着也烦。另一个烂角色是葛优,看他演的厉帝,我总想起《卡拉是条狗》中那个吃黄瓜的葛优。
武打烂。一部《卧虎藏龙》之后,国内的电影只要沾上点武打动作的,全都飘逸得一塌糊涂,都以为是天外飞仙呢。太子与婉儿第一次打斗的那个"双飞燕"的动作能把人笑死。袁和平的武术指导是不错,但看多了也腻。
也或许外国人与中国观众审美观点不同,反正这片子摆明了就是给外国人看的,要不怎么连情节都是演绎《哈姆雷特》的呢。
--EOF--