Source favicon22:43 浅述RDF,畅想一下FOAF应用 » Xerdoc Together
最近一直都在看一些RDF和Semantic Web方面的东西,本来有一个同事是来自Tsinghua AI实验室的,本想跟他好好讨论讨论,不过估计也没有机会了。国内好像做这方面的不是很多,而且到现在为止,我也没有一个很clear的关于RDF的想法。所以,只敢在这里浅述一下了,呵呵。有趣的是,按照WikiPedia的记载,Web2.0当初是被称作Semantic Web的,后来演化成了Web2.0。 FOAF(Friend of a friend)是目前正在制定中的RDF词汇表,目前还没有完成定义,一个家伙用了64种方法写一个相同语义的FOAF,所以最近有篇文章在写“RDF/XML Sucks x 64”。究竟FOAF干什么用的,简单说,如果RSS是用来描述Blog等发布内容的Metadata的话,FOAF就是描述人的Metadata,包括爱好、Blog、RSS Feeds、最近在读的书……(留到后面再说,呵呵) 浅述RDF 其实,前面的文章中曾经提到过RDF。简单来说,使用计算机来处理问题,总先要建立一个计算机可以读懂的模型,所以,离散数学里面教我们如何形式化或者逻辑化,就是会有一堆逻辑变量,为了让等式为真应该如何取值的SAT问题。RDF和Semantic Web就是为了把网络信息形式化为计算机可以读懂的模型的。 当然RDF和Semantic Web远比这么想想要复杂的多,这里有一个很好的Guide,可以从上面找到相关学习的链接。 我也没有全部研读过,所以只能浅述一下了,呵呵。 我们通常看到的RSS,无论哪种版本都是属于RDF的词汇表。而更多的命名空间给他赋予了更多的语义,比如我们常用的dc,例如dc:creator用来描述一篇blog的作者。而且需要说明的一点,我们常见的RSS多为xml,其实这个不是必须的,RDF并没有说只有用XML才能描述……不过通常习惯XML的开发者可能并不一定习惯RDF,因为有那么多的词汇,反正我刚开始看的时候是很容易就晕了。 RDF描述的模型实际上是一系列逻辑语句组成的无序集合,用来描述一个加注标签的有向图: 加注标签:图中的每条弧都有标签 有向:每条弧都有方向 另外,节点之间允许多条弧(违背图的定义,呵呵) 再看RSS的例子,例如这个Blog包括了这片文章,这片文章是由Winters Mi发表的,时间是20050929,正文是,利用RDF来描述这个话,就可以是 this blog -- {Contains} --> this essay this essay --{has title}--> \"浅述RDF,畅想一下FOAF应用\" this essay --{created by}--> \"Winters Mi\" this essay --{has content}--> \"blahblah......\" 不妨找出一份RSS的原始XML文件出来看看,就能发现,RSS其实是使用XML的方式列出了这样的逻辑语句,而这样的逻辑语句也都是由三部分组成:主体、谓词和对象。例子中,this blog就是主体,Contains就是谓词,this essay就是对象。有点AI lab的影子了哈,呵呵。 显然,如果我们这么来描述RSS的话,或者是Internet信息资源的话,肯定是没有任何意义的,于是就有了规范,也就有了词汇表和描述方式。所以,dc:creator就是对应着created by的谓词了。 看到这里大家可能会觉得RDF跟XML之间并没有太大的区别,这可能是RSS带给大家的一种错觉,因为RSS之中已经淡化了这种逻辑语句的概念了,看到的跟描述Data的XML并没有什么不同。首先说,RDF是完全可以用XML描述的,但是俩者之间又有着本质的不同。XML是更加倾向于描述数据的,XML的设计目标就是轻便的可应用于各种类型的数据之上的,尤其是用来描述层次的自包含的文档数据等等,XML不仅仅是一种文件格式,更多的是一个平台无关的数据描述方法,是统一数据描述的“普通话”;RDF则描述了一个通用的方法来将互联网中的信息组织起来,要是说得更专业一点就是描述了“知识”的组织方法,并且通过规则将这些知识组织成为语义,提供给应用程序/计算机使用。这也是我想说的关于RDF的第一点:RDF是为了描述知识而设计的,不是为了描述数据。 RDF并没有绑定在XML之上,象前面提到的RDF/XML Sucks的问题也很让人头疼,而习惯了XML的开发人员可能并不习惯RDF这种组织方式。其实如果你要我说究竟RDF和XML之间的关系如何,我也不能说得很清楚,可能要放到整个Semantic Web还有一系列技术的范围之内,RDF这种基于AI的逻辑性才能够得以体现。 从另外的角度来说,RDF是整个Internet的Metadata,类似于曾经在众多Blog中提出的Meta Content等等的概念。从RDF本身的特性可以看出,RDF的语句其实构成了Internet中各种信息资源之间的逻辑关系,构成了互联网的元知识。 这样的浅谈肯定是不能满足要求的,官方的资料比较多,RDF Primer是一个比较好的入口。 畅谈FOAF的应用 现在我们已经看到了RSS在Web2.0中的重要地位,RSS提供了一个简单却非常意义深远的方式,互联网中的各种信息可以通过RSS简单的集成、序列化以及搜索,RSS的应用更是很快的被应用到互联网的每个角落,人们可以通过你的RSS来定位到你提供的Blog或者是网络服务……RSS描述了互联网中的内容实体,而FOAF则描述了互联网的个人实体,尤其是为基于社区服务的应用提供了方便的管理和联系手段。 FOAF是现在RDF社区中讨论比较多的一个词汇表,他描述了互联网的个人(包括Group)实体,以及各实体之间的伙伴关系,所以叫做Friend of a Friend(此外还有一个词汇表也是被讨论的很多,就是DOAP,Discription of a project)。具体请参考FOAF的Spec。这里先简单介绍FOAF能够描述的基本概念。 FOAF可以描述个人实体的基本属性: <foaf:Person> <foaf:name >Winters Mi</foaf:name> <foaf:mbox rdf:resource=\"mailto:winters@xerdoc.com\" /> [...] Tags: , ,
Source favicon22:15 谁会是RSS在线阅读市场的赢家 » 未完成 - Incomplete
大洋彼岸Web2.0会议开得火热,就连Google也着急地赶集似的推出有史以来最糟糕的Google产品Google的在线RSS阅读器。使用一分钟后,其无处不见的bug以及令人失望的搜索结果就让我放弃继续尝试的欲望。 在线RSS阅读器市场的领先者Bloglines在被收购之后就几乎不再有任何让人激动的动作,似乎越来越显出成为这一市场先驱的势头。但RSS阅读市场的巨大潜力仍在吸引着众多的竞争者投身其中,而Google、MSN等巨头都纷纷进军这一市场之后,竞争无疑会更加激烈,那么谁会是其中的赢家呢?我想赢家可能会是两类公司:包装RSS阅读器方便为普通公众提供服务的公司等;另一类是提供智能化RSS阅读服务的公司。 RSS显然是个过于技术化而难于推广的术语,已经有很多次的RSS调查数据(1、2)显示有不少实际在使用RSS进行阅读的用户并不知道RSS为何物,估计很大比例的这类用户来自于使用My Yahoo这种并非将自己定位为RSS阅读器的用户。多份RSS调查报告都显示公众对于RSS的认知程度还很低,如果他们连什么是RSS都不知道,怎么还会产生使用RSS阅读器的需求呢,通过重新定位和包装RSS阅读工具,让普通公众根本不需要去了解什么是RSS就可以享受RSS阅读的便利和好处,无疑会是吸引大量不了解RSS的普通用户的竞争关键。其实在这个领域,传统的门户网站似乎占据着竞争优势,比如Yahoo和MSN,国内的门户呢? 对于那些已经对RSS有比较深入了解的用户,他们往往订阅和阅读着大量的Feed,RSS的方便与Blog的普及带来的一个副作用就是订阅量的日渐增加以及信息过载,能够智能化地根据每个用户的阅读习惯调整Feed的呈现方式的RSS阅读器相信会获得这部分人的青睐。而现在已经有不少RSS阅读器以智能化的定位进入这一市场,比如Findory和SearchFox等,Google的RSS阅读器中的按照相关性排列的方式,很可能也是一种根据阅读习惯进行智能化调整的功能。 当然,除了这两类公司外,能够为用户提供独特的价值与创造着用户粘性的RSS在线阅读器都有望在市场上找到自己的位置。比如Newsgators会凭借其独特的跨平台同步功能,Rojo以其社会性网络的特性,都可能会继续在RSS在线阅读市场中占据一席之地。倒是Bloglines好像没有提供任何让用户形成依赖的功能,比如阅读习惯记录、Blog或Post的tag、社交网络等等,而它的反向链接搜索、订阅人数等特色功能并不会让用户因使用频繁而提高迁移成本,也容易为竞争者所效仿,所以越来越多的用户方便地导出opml转向其他的在线RSS阅读器。
Source favicon18:38 社会化搜索引擎:Wink » WebLeOn's Blog
Wink是一个通过Tag来实现强大社会化功能的搜索引擎。



在Wink里,搜索结果页面的排列和普通搜索引擎有很大的不同。排在最上方的,是由其他Wink用户所推荐的搜索结果,之后才使普通的网页搜索结果。你可以为所有的搜索结果设置Tag、评分,也可以阻止某个网址。



而你在Wink里的所有搜索活动,都会被记录在你的个人页面。在这里,你可以看到和你搜索相同关键词的用户,可以管理搜索历史的Tags。另外,你还可以创建Search Set,同时跟踪多个关键词的被搜索情况,甚至还可以手动输入网址使之成为搜索结果的一部分。



Wink用户的各种搜索行为都可以与其他用户进行分享,使我们可以通过用户之间的信任关系来更快速准确的找到信息。Wink的原始搜索结果来自Google,整个系统对中文有非常良好的支持。Wink还准备了Firefox搜索插件以及Bookmarklet,方便随时随地使用其服务。



在我看来,Wink把关键词和Tag的概念合二为一,同时结合了个性化搜索及社会化书签的功能,的确可以创造很多有用的信息。不过也正因为引入了不同的概念,让整个系统稍显复杂,开始的时候会比较难上手,没有Yahoo的MyWeb来得明了。不过,这毕竟还只是很早期的测试版,等用户体验有所改进以后,相信Wink还是会成为一个非常有价值的服务。否则,它也不会在The Colors of Web 2.0 Party上和Del.icio.usFlickrTechnorati齐名了。
Source favicon16:32 “就是你最闹”,方枪枪来了! » Andy's blog

影片:看上去很美
导演:张元
原著:王朔
主演:董博文(方枪枪)、宁元元(南燕)
新浪专题:http://ent.sina.com.cn/m/c/f/ksqhm/
官方网站:http://ent.sina.com.cn/redflowers

方枪枪

“就是你最闹”

Source favicon16:25 Mashup,web as a platform out of control » Easy Librarian
Mashups are a key element in Web 2.0. A mashup is a the combining of two or more services into a single application utilizing their API’s as the glue. By combining disparate services, whole new opportunities bloom. Suddenly, hordes of volunteer programmers are taking it upon themselves to combine and remix the data and services of unrelated, even competing sites. The result: entirely new offerings they call "mash-ups." Mash-ups have been around for a while, but they're exploding now(Web 2.0 Mashup Matrix), partly because of Google maps. Mash-ups often use the data without asking first, then present it in unintended ways. Some mash-up software presents a potential danger to users as well. Ex.Greasemonkey. mash-up business models don't extend beyond running a few Google ads and collecting fees for sending buyers to e-commerce sites. Or Web sites may do their own mash-ups. http://dailymashup.com/, Dave Winner claim that “it's a bubble, and we're not just in it, we are it!” Ning is a free online service (or, as we like to call it, a Playground) for building and using social applications.Social apps are web applications that enable anyone to match, transact, and communicate with other people. The objective is simple. Shoot as many ducks as you can with Doom weapons such as The Super Shotgun, The Chaingun, The Rocket Launcher and The BFG-900! These purveyors of the musical mash-up (or in some circles bastard pop) are finding their way into ipods around the globe. Although these artists are testing the boundaries of copyright law, they are certainly cultural WorldChangers. I aslo find it’s funny to change the world,so I mesh up an article from many mash-ups. (First see)
Source favicon16:06 Blogger Backlinks » WebLeOn's Blog
Google刚刚为Blogger.com增加了一个新功能:Backlinks



Google的Blogger不支持Trackback,被人们诟病已久。我在使用Blogger服务的时候,也因此而毅然放弃了Blogger的回复系统,而选择了Haloscan的Comment和Trackback服务。但是,这几年来,Trackback的技术和应用方式都没有丝毫的改进,使它越来越被人所淡忘。



早前的文章中说过,Blog搜索引擎中的反向链接搜索,可以在很大程度上代替Trackback。看来Blogger和我的想法类似, 其Backlinks功能便可以自动在每篇Post后显示链接到本文的Blog文章。其链接的来源当然是Google刚刚推出的Blog搜索引擎。而且,文章的作者还可以像管理Comment那样单独关闭某篇文章的Backlinks或者是删除某条单独的链接。



这次功能的增加可以说是Blogger近几个月来最大的改进。稍后我也会在这个Blog中加入此项功能。
Source favicon13:26 Oracle buys Innobase. MySQL between rock and hard place? » Jeremy Zawodny's blog
As reported in several sources (Slashdot, InfoWorld, AP on Yahoo, Reuters), Oracle has acquired Innobase Oy for an undisclosed sum of money. This appears to be a strategic move by Oracle to put MySQL between a rock and hard place. Innobase is the company that provides the underlying code for the InnoDB storage engine in MySQL. It's the de-facto choice for developers who need high concurrency, row-level locking, and transactions in MySQL. For many years now, MySQL AB and Innobase...
Source favicon13:16 iWay Puts Yahoo! Maps on Your iPod » Jeremy Zawodny's blog
. Yahoo Maps and the popular iPod Photo portable MP3 player are used together to bring you an exci ting online service called iPod-iWay. What is iPod-iWay? iPod-iWay is a powerful step-by-step directions saving tool that will export online driving directions from results by Yahoo Maps and import them into your iPod Photo. It’s an easy solution for getting Yahoo Map directions saved and displayed onto any iPod Photo or Nano, and without the need of additional software! Cool. Check...
Source favicon13:05 Niall Kennedy Suggests Buying Blog Readers » Jeremy Zawodny's blog
After reading through the recently released Yahoo/Ipsos RSS research, Niall concludes by saying this: The biggest surprise to me was the value of the browsable feed in each tool's built-in listing. Blog authors should be aware of their placement within such listings and perhaps consider a paid listing for increased subscriptions. Uhm, yeah. Let's all go get "paid listings" to get in directories so people can find our cat pictures. That seems so 1999 that it's not even funny. Except...
Source favicon09:32 Google的启示 » 搜索引擎研究

最近在对现有的搜索引擎进行分布式的改进, 回顾以前阅读过的 google file system 的文章时发现google的思维和我们平时固守的思维很不一样, 可以说很多在我们看来是有一些"偏激"的,可是正是由于这些偏激, 才导致google与其跟随者的不同.

以下为几个例子:

1. google认为, 所有的硬件都是容易产生故障的, 因此google认为故障是必然的, 不产生故障才是偶然现象. 这个想法和我们通常的意识是相反的.

2. Google认为, 一旦写入, 再也不删除和修改. 这点上google认为修改和删除会对系统造成潜在的伤害, 例如文件的不连续性, 文件定位的困难..

3. Google将Linux的 file system的block更改为 64M , 也就是说, 写文件的最小单元是64M, 而不是我们通常的512字节, 两者整整相差了128000倍.

4. Google认为修复是没有必要的, 当一个服务器出现问题的时候, 撤下来, 换上另外一个 google unit(google 单元)即可, 因为维修的成本远远大于直接上线一个全新的服务单元的成本. 说来容易, 其实只有当google结构真正实现高冗余和分布式这样的操作才可行, 而这些正是google的核心.

当我们设计一个系统的时候, 我们最简单的做法通常是会根据需求对已有的一些经验进行匹配, 这个过程中我们通常走的是近路,而且我们的经验常常会束缚我们的想法, 没有抛开经验进行全新的分析和设计, 也自然就难以有所创新.

Source favicon03:40 MSN AdCenter Pilot » MSN Search's WebLog

Oilman beat me to the punch posting this one. Yesterday, Yusuf Medhi, MSN SVP, asked us to invite people to join the US MSN adCenter Pilot. I am going to extend the invitation to apply to all of our loyal blog readers. We want all of you to have a shot. See below for the invite and information on how to apply. 

     Brady Forrest, MSN Search PM

----
From: Yusuf Mehdi

As you know, we launched MSN adCenter --our next generation advertising platform -- in France and Singapore last month. This was an important first step to delivering our global vision to connect advertisers to consumers in a more meaningful way.

Now, as we prepare to launch the US pilot of MSN adCenter, we need your help in getting your friends and family to apply to participate in the self-service offering for small-to-medium businesses. This pilot represents a unique opportunity for small and medium businesses to be among the first to experience the more powerful tools and wide-ranging benefits of MSN adCenter. Our paid search offering will help advertisers:

  • Learn by accessing comprehensive data to plan more strategic campaigns,
  • Connect by using advanced demographics to target the right audience at the right place and time, and
  • Refine by making meaningful changes on the fly with features for greater flexibility and control.

If you know a business-owner who would be interested in advertising their business on MSN Search, please forward this email to them and encourage them to apply to participate in the US Pilot by completing our online registration form at http://advertising.msn.com/adCenterPilot/89620.asp.

 Please note that entry in the US pilot is by invitation only. We will select participants on a rolling basis from those you refer and who express interest. During the US pilot, MSN adCenter will be delivering text-based advertisements on up to 25 percent of MSN Search traffic; the remaining traffic will continue to be served through our partnership with Yahoo.

I hope that you will support this important initiative by sharing this information with your friends and family. We look forward to serving their advertising needs and gathering their valuable feedback on our products and services.

 thanks,

 Yusuf

Source favicon03:40 Google Reader » WebLeOn's Blog


Google的RSS Reader,来得那么突然。



Google Reader和其它在线RSS阅读器最大的不同在于它使用了和Gmail类似的方式来管理Feed与Post。在Google Reader里所订阅的Feed就像是Gmail里的联系人,而Post就像是一封封邮件。所有的Feed和Post都能用星星来标注,并可以添加一个或多个label。所有已读的内容也会被存档以便日后查询。此外,Gmail中方便的快捷键功能,Google Reader也有支持。



Google Reader中的Feed和文章列表都可以以更新时间或是相关性来排列。其相关性不知道是以何为依据,Google Search History?还是Google Reader本身?不过肯定是Google所记录下的用户数据。



还内置了Gmail和Blogger的支持,用Gmail This和Blog This就可以直接书写邮件或者发布Blog。不过,暂时Google Reader和Google Blog Search好像还没有整合,GBS里面没有订阅的按钮;Google Reader里的搜索似乎也没有使用GBS数据库。



Google Reader使用了非常多的Ajax效果,但是整个程序的代码显然没有很好的优化过,执行速度非常慢,和Gmail比起来简直是天壤之别。另外,OPML的导入兼容性也很差,只有非常简单的OPML能够顺利倒入。总之,Google Reader很酷,但至少目前为止它还远不够实用。
Source favicon01:42 Feed the world » Official Google Blog




So we've added a new experiment to Google Labs: Google Reader, a service we hope helps you spend more time reading what's important to you (or is, if you'd prefer, nicely diverting). The Reader team is excited to begin iterating in public, and now that Jason Shellen's announced it at Web 2.0 we're excited to get your feedback on this early-stage effort.



We often get asked how anyone's supposed to keep up with the firehose of stuff launched from the web's spigot, so we're offering Reader as a way to help. Like the Personalized Homepage, it's a part of Google's ongoing effort to bring together personalized web content to make information more relevant to users.



And, because I rarely get a forum like this, I'd personally like to thank Google for being able to participate in building Reader with the sorts of accomplished engineers who help keep these web bits pretty interesting. (Waves to Search, Gmail, Maps, Print, News, Suggest, etc.) Thankfully, we're not alone -- everyone involved from corporate entities to thousands of independent developers seem to be focused on lowering the barrier to entry for actually making feeds useful.



For a quick intro to Reader, take the tour, or just get started. I'd make recommendations from my starred items, but a quick scan reveals "still waters running deep" isn't me - I keep my item pool filled with snark (Gawker) or techno-fetishism (Engadget, I'm looking at you).



So go to Google Labs and give it a try. If you're interested in making Reader better, please let us know, as we plan on keeping the experiment alive and kicking as long as there is stuff being syndicated.

^==Back Home: www.chedong.com

<== 2005-10-07

==> 2005-10-09