Source favicon18:03 gRaSSland升级:RSS种子提升到4406个 » gRaSSland开发日记
截至2005年6月17日:gRaSSland中的RSS条目共230111篇 种子1035个 今天利用Cyril的抓取:RSS种子增加到4406个。 方法:在crawler表中将校验过的RSS种子: select url from crawler_link where rss =1 into outfile '/tmp/rss.list'; 将能正常访问的RSS汇总:根据日志找出24小时内能正常访问的RSS awk '{print $1}' fetch_rss.*.log |grep http > rss_old 合并新旧RSS: cat /tmp/rss.list ./rss_list |sort |uniq > rss_new 利用一个脚本:生成fetch_rss.sh ./gen_list.sh 但是我从FEED种子中也看到几个问题: 1 丢失了很多blog hosting服务的种子:比如由于服务器路径改变,大部分blogchina的种子都没了, 2 重复: blogdriver的连接比较稳定:但是这次抓取得到的更多是同一个站点不同格式的FEED:RSS1...
Source favicon16:43 Another Delicious » We get to be strong cause we are together
Are you the user of del.icio.us? Yes, I am the fan of it. Besides it's powerful features, I was really impressed by it's domain name. It's the first time I saw such domain.

Last week , I found de.lirio.us, a website like del.icio.us. It's also for Social Bookmarking, Tagging... Interesting, right? Delirious : A state of uncontrolled excitement or emotion. :-)

I don't think I will switch to it. Same reason as that I don't want to switch to furl, although furl's user interface is better than delicious. For a social bookmarking website, the tagged bookmarks and registered user is the most important, I can share so many good information from them, so, it's the users registered that prevent me switching.

However, de.lirio.us is open-source, based on Rubric.

"Rubric is a note-keeping system that also serves as a bookmark manager. Users store entries, which are small (or large) notes with a set of categorizing "tags." Entries may also refer to URIs."

So, if you plan to set up the internal bookmark website (if the internal links are confidential for example) or develop some new feature of yourself, you can take a look at it.



comments(0)

Source favicon16:09 旅游Wiki百科Ulog.org » 未完成 - Incomplete
詹膑写过一篇让我一直念念不忘的文章“中国人文地理”的出路……”,说的是他做过的一个中国人文地理Wiki项目(现在这个网址好像已经进不去了)。当时,我也曾留言与詹老师作过一些简单的探讨。 昨天在Wangwenyou的软件生活品网中获知了Ulog.org这个基于Wiki的旅游百科全书,可以说是在继续实践着詹老师未完成的人文地理项目。 詹膑在文章中认为Wiki项目对于人文地理项目存在着限制,我在留言中也认同这样的观点,“我一直以来觉得wiki的应用是有一定的限制的,尤其是它不适用于那些比较注重个人感受的感性的内容,而对于标准明确的知识性内容则比较适用。人文地理这个项目因为重在游记这种个人感受的内容,wiki的确不太适合。但是如果只是简单地让用户贴自己的游记的话,似乎又不能很好地实现知识的聚合,而可能会沦为与新浪驴坛的攻略或者是ctrip社区的游记一样的作用”。Ulog.org目前采用了感受性的游记、相对个性化的攻略与知识性的住行食游内容相互分开的办法,在一定程度上有助于解决詹膑的问题,也能够解决我对于Wiki应用的疑问,不过如何更有效地聚合游记仍然会是以后在发展中可能会遇到的问题。 Ulog.org才刚刚起步,有许多方面还有待完善,粗略提点建议: 1、虽然现在已经有城市地图(发现地图是Mapbar提供的),但景区地图(既然Mapbar提供城市地图,应该对于市内景区的地点已经可以实现地图显示了吧),尤其对于自助游用户,景点地图信息非常重要; 2、游记与攻略很可能不仅仅对应一个地点,可以通过tag或者其他的方式将其更有效地集中起来,尤其是对于一些非地理的人文内容,可能更需要通过tag来聚合; 3、攻略是背包族最关心的内容,现在贴攻略的方式似乎过于自由,可以限定某些条目,比如常用电话,交通线路,住宿地点等等。 总体的感觉是旅游百科比较容易做得“散”(现在已经有点这样的端倪),需要更有效的内容聚合方式,否则就会像我在留言中提到的那样成为另一个“新浪驴坛”。
Source favicon14:50 Yahoo! Duckling Rescue » Jeremy Zawodny's blog
I saw some commotion on campus earlier today and noticed later in the day that a pipe had been dug up. Thanks to my aggregator, I now know the rest of the story. There was a Duckling Rescue today!...
Source favicon13:55 邪恶的事情 » CNBlog: Blog on Blog

最近常说“别做邪恶的事情”,可是照旧有人做而且还振振有词。相对于从前批评BKZG(改名了?),MSN Spaces的邪恶更上一层,至少我今天还可以在前者看到一些好文章。Robert Scoble 试图用“中国人”自己的话来维护自己的公司,却被中国的Blogger们(12)用事实反证其结论的脆弱。关于这家公司的行为以及后续的调整、变化、PR辩解,已经演化为了国际争论。其间也不免发生吊诡和异化,但总是网志空间的必然性而已。

说的容易,我们能做的也就是给微软一点建议:即使从商业上考虑,也要权衡得失,用户有权选择不用MSN Spaces.

Source favicon12:47 del.icio.us in Newsmap format » Jan's Tech Blog
del.icio.us most popular treemap,以Newsmap般的格式来显示del.icio.us内各书签的受欢迎程度。让我们以宏观角度来看del.icio.us。...
Source favicon09:07 办公室恶作剧 » BoingBoing中文版

Pocket-lint有一些歇斯底里的办公室恶作剧的图片.我看到这篇文章的地方是Gizmodo,它正在筛选读者提供的其它办公室恶作剧并且会公布其中少部分最好的.

链接(来自Gizmodo)

Source favicon09:05 Odeo初体验 » WebLeOn's Blog
Odeo是第一个全功能的Podcast服务网站,为用户提供包括收听、聚合、分享、发布等各项Podcast有关的服务。它的创办人就是大名鼎鼎的Evan Williams,目前最大的blog服务商之一Blogger.com的创始人。



虽然Odeo邀请制的内部测试已经进行了很久,但有机会得到邀请的人还是寥寥无几。直到最近两天,才陆续有Blogger得到了邀请,我也有幸收到了Invitation,成为了Odeo的测试者之一。





打开Odeo的首页,就可以很容易的看到网站的三个主要用途:Podcast的收听、同步和创建。从侧栏我们还可以看到它对Tag的支持和搜索功能。另外,Odeo的页面到处都显示出Ruby on Rails构架的风格,莫非用的就是它?





在Odeo同步Podcast,需要下载一个客户端软件,这个客户端的功能并不是很多,好像只能用来同步Odeo账号中的Podcast,不过软件个头倒是不小。





Odeo创建Podcast的功能虽然还没有开放,但是在介绍里我们可以看到,这个部分才是Odeo的精华所在:用Microphone直接在线录制Podcast、上传MP3制作Podcast甚至是用电话语音信箱来录制Podcast!





我们现在可以做的,是通过添加RSS 2.0 Feed来把外部的Podcast添加到Odeo的数据库里。看看我加了什么?至少可以证明,Odeo对中文显示的支持没什么大问题,不过用中文关键字搜索似乎还不行。



Odeo提供了Podcast的一站式服务。可能是因为之前的介绍太多,试用的时候倒是没什么惊喜,不过也没有让我失望,除了没有开放的创建功能还不断挑逗着我的好奇心。等待着Odeo也像Blogger.com推动Blog那样,让Podcast能真正的飞入寻常百姓家。
Source favicon08:57 神秘传说1923-1942的封面 » BoingBoing中文版

神秘传说是一本原创杂志,Howard的Conan和Lovecraft的Cthulhu等故事在这里找到了他们的家.它可怕的封面甚至比里面的小说好.这里是它1923-1943的封面图集.

链接(来自 We Make Money Not Art)

Source favicon08:53 Popular Image Searches » Yahoo! Search blog
So you're an avid image searcher. On Yahoo! Image Search, you caught a glimpse of Michael Jackson's trial, dreamt of your summer Yosemite camping trip, and scoped out the latest playstation psp to see what the craze is all about....
Source favicon06:46 Quakes! » Jeremy Zawodny's blog
If I didn't know any better, I'd think the shit is about to hit the fan. It's like that line in Ghostbusters... "That's a big Twinkie."...
Source favicon05:33 The world in your pocket » Google Blog




Since millions of people across the globe already use mobile phones like there's no tomorrow, we're launching Mobile Web Search in many languages. Try it the next time you visit Google on your mobile phone - you'll see a new option to search the Mobile Web. How different is it than standard web search? There are sites out there that have already been designed for your mobile phone, which makes them more navigable on the small screen. So we've created an index specifically for these sites. And so your phone can now be that much more useful.
Source favicon01:47 Odeo更多细节 » WebLeOn's Blog
Podcast服务网站Odeo内部测试已经有好几月,可对绝大部分人来说,Odeo的功能还是一个谜。最近,不少Blogger都收到了Odeo的测试邀请,于是我们有机会看到更多Odeo的细节:



Hoovernj的截图 | Philipp Lenssen的截图



越看越酷!我今年2月的时候就加入了邮件列表,不过到现在还没有收到邀请,不知道到什么时候才能够亲身体验Odeo的乐趣。



Update:功夫不负有心人啊,求爷爷告奶奶了一天,终于在邮箱里发现了邀请,哈哈!稍后附上详细介绍……
Source favicon00:02 用户对Web资源的再次访问具有集簇性 » 车东[Blog^2]

今天仔细看了北大王伊敏写的Web Mining,其中提到F. Douglis 等研究发现 (1997)用户对Web资源的再次访问具有集簇性。 估计F. Douglis当时是为了研究缓存做的研究:因为其中的一些结论对于缓存周期的设计非常有帮助:
f-douglis.png
最显著的是一分钟和一天。
用户访问的平均时间间隔为25.4个小时,而中间值为1.9小时,49.6小时后的平均方差下降很小。

很巧合,从我以前经验值来看:将页面设置为网页在客户端2个小时后过期的确是最高效而又不影响页面更新的:因为用户在2个小时内再次访问当前页面,主要的目的是回来看刚才看过的内容,这个时候浏览器能够帮助用户快速从本地缓存中看到。


^==Back Home: www.chedong.com

<== 2005-06-16

==> 2005-06-18