同样一篇文章:每当有新一篇文章发布后,FTChinese的FEED就会显示有大量更新,除了第一篇外,其他主要是以前的旧文章;
我观察了一下同一篇文章的URL:发现主要是由一些服务的跟踪参数变化造成的
http://www.ftchinese.com/sc/story.jsp?id=001014956&pos=RSS_DAILY_NEWS&pa1=0&pa2=4&loc=RSS_EMAIL
http://www.ftchinese.com/sc/story.jsp?id=001014956&pos=RSS_DAILY_NEWS&pa1=0&pa2=3&loc=RSS_EMAIL
而目前的大部分RSS应用(主要是:RSS阅读器)都是以URL为内容的唯一标示的。但由于跟踪参数的问题:导致所有的链接地址都不稳定(每次更新后)旧文地址会变。
做数据跟踪是必要的: 但是以破坏链接地址的稳定性就有些得不偿失了。
解决这个问题有2个办法:
1 阅读器改用文章内容的签名(MD5)作为文章唯一标示,有内容更新则显示未读;
2 RSS的输出者: 保证地址的稳定性,文章的来源跟踪,尽量通过浏览器名称,Referer 头信息等特征组合跟踪;
版权声明:可以转载,转载时请务必以超链接形式标明文章 FT中文网的FEED为什么总是旧文翻新? 的原始出处和作者信息及本版权声明。
http://www.chedong.com/blog/archives/001400.html
Comments
呵呵。多谢兄台。都有些愧对你的热情帮助了。
目前有一些特殊情况没有办法处理,但我保证一定会在可能的时候尽快弄好的。(因为现在负责数据分析的同事病休了一个多月了。我现在没有办法直接改动这个,不经过他的认可)
非常感谢你!
有机会电话联系!
由: 浅草妖怪 发表于 2007年11月29日 下午05时32分
而且,这个URL的问题,应该不仅仅影响RSS的feed,还影响一些搜索引擎的收录和ranking吧?
我个人的猜测。
所以,我会在马上开始的平台改造中,不再用大量的这样东西来做tracking。
由: 浅草妖怪 发表于 2007年11月29日 下午05时36分
google reader不好用,不如bloglines, 它似乎没这个问题
由: roger 发表于 2007年11月29日 晚上10时39分
FT中文网的评论部分太不流畅了,非常糟糕。应该向WSJ中文网的评论代码学习啊。
由: fisher 发表于 2007年11月30日 上午11时36分
就是因为翻旧文毛病,我早已经退订这个feed.
由: guardy 发表于 2007年12月03日 晚上10时49分
我对此持不同观点。从seo的校对来看,就是要尽可能的利用现有资源。从用户的角度来看,不可能所有的用户都读过所有的文章。
那么只要精确的定位受众,即便是老文章、旧文章,通过一定形式的重新组织,一样是很受欢迎的。
那么如其让压箱底的文章“腐臭”。何不把它们翻出来晒晒?
活动目录seo
http://gnaw0725.blogbus.com
由: gnaw0725 发表于 2007年12月05日 上午11时40分
按照url区分feed是否重复是不错的办法,但是在GreatNews(离线版的阅读器 我用bloglines同步)下,是按照新闻的一个标识,忘了具体叫什么了,之前在GN的论坛里面提出过,作者说是因为哪个标识变了,所以重复出现,一般的解释是作者发布之后又修改了一些内容
由: netwjx 发表于 2007年12月09日 夜间04时35分
绝对不是 Google Reader 的问题,是这个 RSS 不标准。其实很容易解决这个问题。
RSS的标准,判断一个 item 是否是“新的”,是看 item/guid 这个节点,guid 有一个属性是 isPermaLink,默认为 true,设为 false 时可以灵活设置 guid 的值,比如:
<guid isPermaLink="false">001016151@article</guid>
然后再加一个 item/link 节点,是这个 item 的 URL
<link>http://www.ftchinese.com/sc/story.jsp?id=001016151&pos=RSS_DAILY_NEWS&pa1=0&pa2=1&loc=RSS_EMAIL</link>
其中的值随便怎么换,RSS 阅读器都不会认为是“新文章”的
现在 FTChina 的 RSS 是只有 link 而没有 guid,加一个 guid 就解决了。
由: xdanger 发表于 2007年12月14日 上午09时29分
您的feed同样有问题
由: 刀河 发表于 2007年12月14日 下午12时35分
本来以为这个网站不错,可惜自从前几天我在评论中发表对西藏问题看法后,我的看法改变了!原来西方媒体也搞审查,说白了还不如中国的论坛,它的评论不光不能实时看到,而且估计很多人的言论像我一样被屏蔽了。我还要申明我没有使用脏话或者非常过激的语言。
由: maomao 发表于 2008年04月15日 早上08时26分
FT中文网现在似乎不提供全部新文章的种子了,所以我聚合了一个 FT中文网 All-in-One 的种子,包括(几乎)所有的新闻和专栏的全文输出,并加 [板块名] 为标题前缀,经 Google Reader 测试没有你说的这个问题。
RSS地址:http://feedproxy.google.com/ft_cn
九点地址:http://9.douban.com/subject/9292812
希望对大家有用。
由: code46 发表于 2009年03月16日 夜间12时51分
FT中文网站,经济方面的还常看看,但现在看来,也不是什么好东西,从西藏问题发文来看,也是胡言乱语,而且你发了反搏的评论他也不让你显示出来,看来西方国家的喉舌都一个样,唯恐中国不乱,支持藏独和疆独杀人,就不许中国政府出面制止.
由: phoenix1000 发表于 2009年07月08日 夜间01时10分