(回到Blog入口)

Feed | RSS 归档

2005年05月15日

利用META帮助FireFox浏览器发现RSS

有些人还在使用meta中添加keywords/description这种上个世纪的SEO方法:我感觉除了浪费用户的带宽外已经没有任何意义。虽然现在html代码中很多的meta信息仍然是给机器看的,对于用户仍然不可见,但目的已经有了一些改变:参考Blog发布系统MovableType的模板,我在自己网站的首页的meta中增加了以下3行:便于FireFox浏览器发现网站的RSS视图。

<link rel="alternate" type="application/rss+xml" title="CheDong's Blog + del.icio.us RSS 2.0" href="http://feeds.feedburner.com/blog2">

<link rel="alternate" type="application/rss+xml" title="CheDong's Blog RSS 1.0" href="http://www.chedong.com/blog/index.rdf">

<link rel="alternate" type="application/rss+xml" title="CheDong's del.icio.us RSS 1.0" href="http://del.icio.us/rss/chedong">

这3种RSS分别提供了:我在feedburner烧制的blog+del.icio.usblog onlydel.icio.us only,这样的首页对于蜘蛛更好的遍历网站和发现新页面也很有帮助。

FireFox浏览器遇到这样的页面后:在右下角会有一个橙色的小图标,点击就可以进行RSS订阅了
meta_rss.png

按此阅读全文 "利用META帮助FireFox浏览器发现RSS" »

2005年08月05日

NewGator: 带反相连接统计的RSS订阅服务和Bloglines的成本分析

前2天BlogLines闹水管工的时候,尝试将BlogLines上的RSS书签通过OPML迁移到了NewsGator上:NewsGator的确有很多独到之处,通过汇总后的RSS,每篇BLOG都有反相连接(incoming link)的统计:
newsgator-incoming.png

而每天被反相连接最多的文章就成了热点:
newsgator_buzz.png

按此阅读全文 "NewGator: 带反相连接统计的RSS订阅服务和Bloglines的成本分析" »

2005年12月24日

FeedIcons.com - Launch Day Stats

feediconsMatt Brett 发起的一个项目: 推广使用firefox上那个RSS图标作为标准, 图上是这个域名发布后首日的来源统计分析.


按此阅读全文 "FeedIcons.com - Launch Day Stats" »

2006年04月19日

基于RSS/FEED的内容发现更节省带宽

Jen的文章AdSense mediapartners蜘蛛已经被抓取到了Google的主搜索索引中,我目前还没有发现类似样例,大部分内容还是通过Googlebot发现,但是提交到Sitemaps中的内容已经是通过Google的Feedfetcher进行同步了。
车东Che, Dong - My Window, Your Bridge
联系方式|Contact]. Google Talk · 雅虎招聘 [My Bloginality is INTJ]. Alexa流量统计:, 2006-04-18 03:50 @72.14.199.83 
CrawledBy Feedfetcher-Google; (+http://www.google.com/feedfetcher.html) show this page source · Send me a book.
www.chedong.com/ - 46k - 2006年4月17日 - 网页快照 - 类似网页
从日志统计中也可以看出来,虽然FEED的访问频度要比以前的蜘蛛高很多,但是由于有文件是否更新的检查,占用的带宽却不一定升高。因此基于FEED的新内容发现比蜘蛛遍历网站效率还是要高很多。以下是一些日志统计的结果:

按此阅读全文 "基于RSS/FEED的内容发现更节省带宽" »

2006年05月21日

抓虾:中文的bloglines + digg

今天从日志统计中发现了:
Zhuaxia/spider:1.0 920 41.39 M字节 2006年 五月 20日 23:54

下午试用了一下:感觉很好 订阅比BlogLines好用,而基于订阅的推荐的digg机制也让你能发现更多
1 中文界面;
2 有个基于session的访客试用:可以在完全不影响其他访客的情况下模拟大部分注册用户的功能;
3 支持OPML导入:很方便;
4 邮件注册;
5 基于推荐和收藏的好文推荐:今天看到的第一篇文章的分析《抓虾四定理及其推论 》就很不错,非常赞同其中的观点。

按此阅读全文 "抓虾:中文的bloglines + digg" »

2006年10月04日

find me: bloglines

很久没有使用bloglines了,最近Google新发布了RSS Reader。我才想起BlogLines,去上面转了一圈,Google学BlogLines学得很到家啊。但是在大规模数据得存取上,Google明显高出BlogLines一筹。BlogLines后台应该还是延续数据库思维:一定要精确告诉你,你订阅的FEED上有873条新内容,而Google就只告诉你(100+):因为能翻10页以后的用户不会超过2%。而结合了ajax设计,类似于GMail界面的浏览模式(尤其是列表方式),也是我非常习惯的快速浏览方式。相比之下:Bloglines在速度方面就要差多了。

再仔细看看:BlogLines的新功能,看来,社群化是BlogLines努力的方向之一。另外就是发现了一个claim功能:认领你自己发布的Feed。

认领流程如下:
0 输入你的blog地址:bloglines会分别生成2个key,一个ckey(用于证明你能发表内容),一个ukey(用于证明你能拥有网站);
1 发一篇blog:里面包含feedkey:<!-- ckey="#######" -->

2 修改首页模板:包含一个:<!-- ukey="#######" -->

结果:如果bloglines在首页上同时发现了ckey+ukey,并且在feed中只发现了ckey就成功了。

按此阅读全文 "find me: bloglines" »

2006年12月09日

FAN: FeedBurner Ads Network 先批准后发布的feed广告发布

最近使用FeedBurner地址订阅我的rss的用户可能看到内容后面广告了吧?(只在blog上的有,flickr和del.icio.us后面的没有)

FeedBurner的feed广告是需要经过先批复再显示的,给blog作者一个控制发布内容的机会。目前FAN以国外广告为主,按千次展现收费,收益 1-5$ 左右。
approve_ads_fb.png

之前2轮广告投放我都拒绝了,英文的广告实在没有什么相关性可言。本期广告好像是关于一部电视剧/游戏?
* 50 impressions
* 1 clicks for 2.000% CTR
一个是关于网络硬盘的。
* 249 impressions
* 1 clicks for 0.402% CTR

按此阅读全文 "FAN: FeedBurner Ads Network 先批准后发布的feed广告发布" »

2007年01月28日

喜欢 links for yyyy-mm-dd 和昨日收藏 这样的标题吗?

在我订阅的feed中,经常可以看到 links for yyyy-mm-dd 和昨日收藏这样的标题, 都是FeedBurner中合并的作者的del.icio.us和365key收藏. 尤其是在Bloglines和Google Reader/抓虾中订阅了大量的blog以后,浏览都会设置成只看标题, 这时候links for yyyy-mm-dd 和昨日收藏这样的标题对于快速浏览就没有什么信息了。以下是在GReader中每天链接汇总模式和条目列表模式订阅效果对比:
link_list.png

detail_list.png

按此阅读全文 "喜欢 links for yyyy-mm-dd 和昨日收藏 这样的标题吗?" »

2007年04月06日

在MT的FEED中增加了相关文章输出(欢迎加入MT中文用户组论坛)

测试一下,如果从FEED中看到这篇后面有MT的文章列表说明就成了。具体配置方法请参考大辉的文章:如何在 MT 的 RSS 中输出相关文章

此外:1月份我还创建了一个MT中文用户组,邀请了很多很有经验MT的中文用户,包括: ThinkJam:(MT界面的中文翻译者), 王建硕DBANotes等,欢迎感兴趣的朋友加入。

按此阅读全文 "在MT的FEED中增加了相关文章输出(欢迎加入MT中文用户组论坛)" »

2007年05月16日

MagpieRSS的parse_w3cdtf()函数对blogger atom格式的bug修正

很奇怪从Lilina上订阅的blogger.com发布的内容发布时间总是显示为未来8小时(格林威治)时间,一开始怀疑是atom输出的时区设置问题,但是看了atom.xml的输出,发现是有时区设置的,和其他引用的atom输出的主要区别在于发布时间有毫秒设置:

<published>2007-05-15T14:49:00.000+08:00</published>

Lilina是一个基于MagpieRSS的聚合工具,MagpieRSS中对于atom格式时间的解析是通过rss_utils.inc中的parse_w3cdtf()函数,当时可能没有考虑到秒后面还有毫秒,导致对后面的时区设置解析失败,变成了格林威治时间。修正后的正则表达式和代码如下:可以兼容解析其他标准的ISO 8601时间格式解析。

diff -r1.7 rss_utils.inc
28c28
<     $pat = "/(\d{4})-(\d{2})-(\d{2})T(\d{2}):(\d{2})(:(\d{2}))?(?:([-+])(\d{2}):?(\d{2})|(Z))?/";
---
>     $pat = "/(\d{4})-(\d{2})-(\d{2})T(\d{2}):(\d{2})(:(\d{2}))?(\.\d{3})?(?:([-+])(\d{2}):?(\d{2})|(Z))?/";
43c43
<                 array( $match[8], $match[9], $match[10]);
---
>                 array( $match[9], $match[10], $match[11]);

 

给Blogger的问题:这个修改有些nerdly吧?文章发表时间有必要精确到毫秒吗?我找到的atom的相关规范是按照ISO 8601格式,也就是:2007-05-15T14:49:00+08:00

按此阅读全文 "MagpieRSS的parse_w3cdtf()函数对blogger atom格式的bug修正" »

2007年07月26日

在线RSS阅读器的订阅统计数字反馈:Google Feedfetcher vs. Zhuaxia

来自在线RSS阅读器的订阅数量统计,就在日志的User Agent字段中可以找到:

72.14.199.16 - - [13/Mar/2007:01:21:21 +0800] "GET /index.rdf HTTP/1.1" 301 322 "-" "Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; 4 subscribers; feed-id=11532101896026039461)" -
72.14.199.8 - - [13/Mar/2007:01:22:47 +0800] "GET /blog/index.xml HTTP/1.1" 304 - "-" "Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; 349 subscribers; feed-id=9065234676578188017)" 72.14.199.8.299921173720167467

抓虾的:

60.28.204.10 - - [13/Mar/2007:17:57:37 +0800] "HEAD /blog/index.rdf HTTP/1.1" 200 0 "-" "Zhuaxia.com 1321 Subscribers" 60.28.204.10.8526117377985731
60.28.204.8 - - [13/Mar/2007:18:12:34 +0800] "HEAD /blog/atom.xml HTTP/1.1" 200 0 "-" "Zhuaxia.com 1319 Subscribers" 60.28.204.8.317331173780754240

显然Google Reader对于Feedburner的数字有影响的,抓虾蜘蛛的订阅数字反馈对FeedSky的订数有影响的,可以通过 http://www.feedsky.com/reader_statistic.php?burl=feedname 看到相应的统计输出变化,以下是FeedSky的订阅量分布统计:

2007-07-28更新:ZhuaXia后台会不定期会合并feed来源,也可以通过给zhuaxia@zhuaxia.com 发邮件,申请将转向前后的feed进行合并订户统计:抓虾会将旧地址统一更新成新地址,并重新计算订阅总数。

按此阅读全文 "在线RSS阅读器的订阅统计数字反馈:Google Feedfetcher vs. Zhuaxia" »

2007年07月29日

部分RSS流量转用FeedSky RSS烧制服务

上周末可能一些blog订阅用户发现订阅的内容有些突然的变化:很多忽然都变成未读了,增加了美味书签和FlickR烧制了,一些RSS解析器解析出错之类的。原因是我将所有的atom.xml / index.rdf流量都转向到feedsky了。我使用MT发布的blog早先有3个FEED地址:

index.rdf(rss 1.0格式)
index.xml(rss 2.0格式)
atom.xml(atom格式),
MT 3.2以后,MT缺省简化成了index.xml和atom.xml 2种格式,太多的地址对于订阅用户的统计非常不方便。虽然通过awstats可以做一些简单的FEED统计,但是毕竟FEED的统计服务还是烧制服务商做的更专业。

为了节省带宽,减少统计,将FEED转向到了 feedsky上的地址: apache的配置如下

RewriteEngine on
RewriteRule ^\/blog\/index\.rdf$ http://feed.feedsky.com/chedong [R=301,L]
RewriteRule ^\/blog\/atom\.xml$ http://feed.feedsky.com/chedong [R=301,L]
#RewriteRule ^\/blog\/index\.xml$ http://feed.feedsky.com/chedong [R=301,L]

注意:千万不要将feedsky/feedburner中的数据源index.xml也进行转向,否则feed数据源就会产生循环抓取 feed.feedsky.com/chedong ==> chedong.com/blog/index.xml =301=> feed.feedsky.com/chedong ==> feed.feedsky.com/chedong ....

这里也提醒一些MT的老用户(比如王建硕),即使用了新版的MovableType系统,也要记得做一个index.rdf的转向或者到index.xml的链接,这样应给也能挽回一些旧订户。

FeedSky在稳定性和FeedBurner不相上下了:主要的优势还是在内容的本地化方面
1 设置项目相比比较简单: 缺省很多高级功能就都有了;
2 中文界面的确比FeedBurner的“汉语界面翻译”的更好;
3 对国内的书签服务,图片收藏服务支持较好;
4 本地广告支持;

以下是我对统计数据做的一些分析:

日期 总订阅数 在线订阅数
2007.7.28 3754 3560
2007.7.27 5571 3562
2007.7.26 241 231
2007.7.25 245 231
2007.7.24 245 231
老用户(27日以后数据):最早的时候index.rdf是blog的缺省订阅入口,可能选用客户端浏览器的较多(POTU占最大比例),占20%多。幸亏离线浏览器没有发展的越来越多,否则RSS发布商大量带宽浪费是无法避免的。毕竟很少用户会复制RSS地址,再添加到RSS离线阅读器里。

新用户(27日以前数据),越来越多的使用在线阅读器(90%以上),而抓虾/Google Reader/鲜果是其中最主要的订阅用户。有了OPML导入导出,迁移一个在线阅读器服务还是非常容易的,早期的Bloglines用户已经逐步迁移到了其他RSS阅读器上。


从feedsky的点击统计来看:标题是非常重要的,对于通过美味书签收藏的英文页面最好能充分利用标题/摘要做一些中文说明,这样对于其他读者的参考作用会更高。

对于FEEDSKY还有一些意见和建议:主要是关于点击统计的转向和RSS格式的兼容性问题等;

按此阅读全文 "部分RSS流量转用FeedSky RSS烧制服务" »

2007年07月31日

推荐:鲜果RSS阅读器

已经将GREADER上所有的FEED都导入鲜果了,我最喜欢鲜果的几点是:
1 中文界面和适合中文浏览的字体;
2 有FEED对应网站的FAVICON (类似bloglines);
3 缺省标题列表模式的浏览和点击展开(类似GReader);
4 右键管理频道:删除/移动频道都很方便;
5 自动识别Flickr的图片FEED:展示大图;
6 可以在FireFox中方便的设置鲜果为缺省订阅器(目前大部分feed我都是通过FireFox地址栏中的RSS图表来订阅的);

另外:鲜果也有类似于Google Reader的收藏RSS输出,如果能像豆瓣那样提供“脚印系统”方便用户和订户之间的交流就更好了。

我的FEED上:鲜果在目前的订户仅次于ZhuaXia和Google Reader,发展还是比较快的。同一个领域还是有些竞争比较好,用户有更多的选择。

按此阅读全文 "推荐:鲜果RSS阅读器" »

2007年08月20日

MagpieRSS在PHP5下解析atom时间戳出错问题的解决: gmmktime() expects parameter 3 to be long

迟迟没有将服务器的PHP升级到php 5,就是很久以前发现有lilina有个bug:个别频道的内容全部都排到最前了,而发表时间全部变为抓取时间。今天升级到php 5.2.3以后,在线debug了一下这个RSS解析问题终于把这个问题暂时解决了。为什么PHP4下不会出错,PHP5就出错了呢?

按此阅读全文 "MagpieRSS在PHP5下解析atom时间戳出错问题的解决: gmmktime() expects parameter 3 to be long" »

2007年08月30日

首页聚合的网站: 通过feedburner发布的blog列表

在发布Feed烧制地址的同时,请务必保留一个原始rss的发布地址。
* 5 -- http://feeds.feedburner.com/ysearchblog -- remove
* 6 -- http://feeds.feedburner.com/gblog -- remove
* 8 -- http://feeds.feedburner.com/SixApartProfessionalNetwork -- remove
* 10 -- http://feeds.feedburner.com/BurnThisRSS2 -- remove
* 14 -- http://feeds.feedburner.com/runliu -- remove
* 23 -- http://feeds.feedburner.com/infosthetics -- remove
* 25 -- http://feeds.feedburner.com/MovableTypeNews -- remove
* 31 -- http://feeds.feedburner.com/TaobaoUiTeam -- remove
* 33 -- http://feeds.feedburner.com/JunChen -- remove
* 36 -- http://feeds.feedburner.com/CheDongsSharedItemsInGoogleReader -- remove
* 45 -- http://feeds.feedburner.com/dreamwords -- remove

还需要花点时间找到内容的RSS源地址,知情者请帮忙提供。

按此阅读全文 "首页聚合的网站: 通过feedburner发布的blog列表" »

2007年09月02日

MagpieRSS/Lilina中: Fatal error: Only variables can be passed by reference 问题的解决

系统升级到php 5以后,我也遇到了Fatal error: Only variables can be passed by reference: 就在前两天订阅blogsearch的搜索结果时候发现的,估计还是和atom格式的输出导致的。解决方法是照着gregarius项目上的patch修改的。由于目前我用的是cvs版本的MagpieRss,修改位置略有不同,具体diff附后,直接获得修改后的文件:源代码可以参考这里

按此阅读全文 "MagpieRSS/Lilina中: Fatal error: Only variables can be passed by reference 问题的解决" »

2007年09月27日

Lilina设置:Atom格式的RSS全文输出

之前我一直以为WordPress的atom输出是不包含全文的,因为用Lilina订阅总是只显示几十个字的摘要。后来看了一下atom的源代码,发现是包含的全文内容的,为什么Lilina没有输出呢。
原因在于atom的输出有summary和content这2个字段。而Lilina缺省只输出了summary。MagpieRSS也是支持输出content的:用atom_content代替summary即可。
if ( isset($item['atom_content']) ) $summary = $item['atom_content'];

有了全文输出,现在首页上输出的内容就比较丰富了。

按此阅读全文 "Lilina设置:Atom格式的RSS全文输出" »

2007年11月29日

FT中文网的FEED为什么总是旧文翻新?

同样一篇文章:每当有新一篇文章发布后,FTChinese的FEED就会显示有大量更新,除了第一篇外,其他主要是以前的旧文章;
ftchinese_rss.png

我观察了一下同一篇文章的URL:发现主要是由一些服务的跟踪参数变化造成的
http://www.ftchinese.com/sc/story.jsp?id=001014956&pos=RSS_DAILY_NEWS&pa1=0&pa2=4&loc=RSS_EMAIL
http://www.ftchinese.com/sc/story.jsp?id=001014956&pos=RSS_DAILY_NEWS&pa1=0&pa2=3&loc=RSS_EMAIL
而目前的大部分RSS应用(主要是:RSS阅读器)都是以URL为内容的唯一标示的。但由于跟踪参数的问题:导致所有的链接地址都不稳定(每次更新后)旧文地址会变。

做数据跟踪是必要的: 但是以破坏链接地址的稳定性就有些得不偿失了。

按此阅读全文 "FT中文网的FEED为什么总是旧文翻新?" »

2008年07月29日

Google Reader的好友推荐分享: Blog内容缓释

前几天我给几个做开发的朋友发了个消息,请他们帮我再次在Google Reader中共享了一篇旧招聘启事,可能他们的Gtalk好友都在Google Reader中看到了。
一篇文章在Google Reader中的确有过时很快的现象,超过1天后可能就被一片被淹没到数百篇未读文章列表后面了。而被好友较多的Blogger分享的时候还会带来一些新的阅读和传播机会;所以Google Reader的好友推荐是这个新的传播渠道已经被很多人运用的很好了,因为大部分人还不知道如何退订Gtalk好友的分享(难道要删除好友?) 也有很多朋友( 比如Fenng)采取在发表文章几天后自我推荐的方法再次“提醒”自己的好友

Google Reader的LifeStream机制:
其实Google真的没有必要收购digg的: Google Reader中的共享(收藏可以看作是匿名digg)已经是一个很好的内容推荐来源;
和DIGG相比: 缺少的是一个加注释/评论功能和一个频道聚合首页;
Google Reader更容易和GTalk组合起来的,如果有个给”XXX分享“:在线回复的接口可以增加更多交互和反馈;

按此阅读全文 "Google Reader的好友推荐分享: Blog内容缓释" »

关于 Feed | RSS

此页面包含了发表于 车东[Blog^2] 的 Feed | RSS 所有日记的归档,它们从老到新列出。

前一个分类 虚拟主机|Web Hosting

后一个分类 MovableType|MT

更多信息可在 主索引 页和 归档 页看到。

Creative Commons License
此 Blog 中的日记遵循以下授权 Creative Commons(创作共用)授权.
Powered by
Movable Type 3.36