用户对Web资源的再次访问具有集簇性


今天仔细看了北大王伊敏写的Web Mining,其中提到F. Douglis 等研究发现 (1997)用户对Web资源的再次访问具有集簇性。 估计F. Douglis当时是为了研究缓存做的研究:因为其中的一些结论对于缓存周期的设计非常有帮助:
f-douglis.png
最显著的是一分钟和一天。
用户访问的平均时间间隔为25.4个小时,而中间值为1.9小时,49.6小时后的平均方差下降很小。

很巧合,从我以前经验值来看:将页面设置为网页在客户端2个小时后过期的确是最高效而又不影响页面更新的:因为用户在2个小时内再次访问当前页面,主要的目的是回来看刚才看过的内容,这个时候浏览器能够帮助用户快速从本地缓存中看到。

下一步我打算做一个试验:将首页Lilina显示的RSS信息控制在50个小时以内(目前是7天168小时),对于大部分人来说:回顾50个小时以内的内容就足够了。

作者:车东 发表于:2005-06-17 00:06 最后更新于:2007-04-15 19:04
版权声明:可以转载,转载时请务必以超链接形式标明文章 的原始出处和作者信息及本版权声明

Comments

在管制严格的今天,如果有一条东西在两小时内存在,要执行宫刑了。

但是squid有mrtg的功能,这个可以制定更新缓存的一条内容,要好好利用才能避险。

发表一个评论

(如果你此前从未在此 Blog 上发表过评论,则你的评论必须在 Blog 主人验证后才能显示,请你耐心等候。)