原文作者:Alex Iskold
原文链接:The Art, Science and Business of Recommendation Engines
译者:小白
去年(2006)10月,Netflix发起了一场不寻常的竞赛。这个在线电影租赁公司悬赏1百万美元寻找能将他们的推荐引擎性能提高10%的人。Netflix以勇于创新和大胆行动著称,在这样的大背景下,1百万美元对于这样的生意来说并不是一个大数字。
这项赛事仍在继续中(它“将至少持续到2011年10月2号”),那么,这是一次商业炒作还是一次用较少钱做研究的尝试?一个更好的推荐是Netflix真的需要呢,还是可有可无?现在Netflix正面临苏醒的巨头BlockBuster的挑战,它当然需要寻找竞争优势。一个好的推荐系统能够为这项服务留住并且吸引用户。比如,当一个用户归还一部电影的时候,推荐一部他们可能喜欢的另一部电影——这可以增加更多的回头客。
浏览和推荐
一个好的推荐引擎不光对Netflix起着重要作用,对任何电子商务网站都是如此。这是因为两个基本的在线行为——搜索和浏览。当一个客户清楚地知道她要找的东西的时候,她会去搜索。但是当她并不是在找一个特定东西时,即在浏览。浏览过程对推荐系统来说是一个黄金机会,因为用户并不是专注于某一件东西——她需要建议。
在浏览过程中,用户的注意力(和他们的钱)谁都可以去争取。通过展示一些具有吸引力的东西,网站可以将交易的可能性最大化。所以,如果一个网站能提高推荐的成功几率,它就能赚更多的钱。显然,这是一个很困难的问题,但是解决它的激励也很大。主要的方法可以分为以下几类:
我们现在来通过一些网站看看这几种不同的方法:老的网站如亚马逊(Amazon),新兴网站如Pandora(译者注:音乐推荐网站)和del.icio.us(译者注:书签网站,有翻译为美味书签)。
亚马逊 —— 推荐之王
亚马逊被誉为在线商城,尤其是个性化推荐的领袖。过去十年,该公司已投入了大量的金钱和智力建成一套智能推荐系统,它会考虑你的历史浏览记录,过去的购买记录和其他购物者的记录——所有这些都是为了确保你能买东西。让我们看看亚马逊推荐系统的各个模块,来了解他们到底是怎么工作的。下面几块是我登陆Amazon之后看到的主要部分:
这一块是社会化推荐。可以看到,它的分析性很强,从统计学上帮我分析了购买一件物品的理由。同时,它也是一项个性化推荐,因为推荐基于我最近点击的一个物品。
上面这块是基于新版本的物品推荐(Item recommendation)。点击"Why is this recommended for you?"(为什么推荐这个给你)链接,可以查看我的购买历史记录。所以,这也是一个个性化推荐,因为它是基于我过去的行为的。
在这个页面还有四个其他的模块,每一块都组合运用了上述的几种个性化推荐机制。我们用表格总结如下:
亚马逊个性化推荐系统
你的浏览历史 你的购买历史
实际的物品 新的版本(物品推荐)
相关物品(物品推荐) 相关物品(物品推荐)
其他人购买(社会化推荐) 其他人购买(社会化推荐)
系统是对称和全面的,这不足为奇。所有的推荐都是基于个人行为的,再加上物品本身的信息或者是亚马逊其他用户的行为。不管你想购买的原因是什么:这件物品跟你以前的买的东西相关,或者是其他人里面很流行,这个系统都会促使你把这件物品放到你的购物篮里面去。
除了亚马逊
亚马逊的系统相当棒。它是一个协作购物和自动化的天才,几乎没法复制。这个系统花了亚马逊十年的时间来建造和完善。它基于一个超大的物品和集体行为数据库,该数据库“记住”了你在几年以前和几分钟以前的行为。新公司要怎么样才能跟它竞争呢?
令人惊讶的是,确实是有方法的。答案在一个与在线购物没什么关系的领域找到——遗传学。如你所知,这门科学是研究DNA片段,即基因,是怎么对人类的特征和行为进行编码的。比如说,一个家庭的成员相貌和行为是相像的,因为他们有相同的基因片段。遗传学作为一门科学已经存在150多年了,它为医学和历史学提供了强大的工具。但是在2006年1月6日,事情发生了意想不到的转变——Tim Westergren和他的朋友们决定将遗传学的概念应用到音乐上。
潘多拉(Pandora)——基于基因的推荐系统
音乐基因组计划旨在将音乐分解成基本的基因片段。其背后的想法是,我们喜欢一段音乐是因为它的属性——为什么不利用音乐片段之间的相似性做一个音乐推荐系统呢?这种类型的推荐引擎属于物品推荐(Item recommendation)。但是新奇而深刻的是,像一段音乐这样的物品,它的相似度需要通过它的“基因”构成来衡量。
这个项目经过多年的奋斗和处理大量的音乐,积累了足够的数据,并推出了这个服务:潘多拉(Pandora)。潘多拉的成功在于它的精确性和输入的简洁。用户只要选出一个艺人,或者一首歌,就可以建立一个始终播放类似音乐的电台。
这种快感是难以抗拒的。潘多拉理解是什么导致音乐相似,所以他可以在不知道用户喜欢什么的情况下抓住他们。潘多拉不需要知道用户的口味和记忆,因为它有自己的——基于音乐DNA。当然,有时它可能并不完美,因为用户的口味并不是完全固定不变。但是它很少出错。
一个自然的问题是,这种基于基因的方法可以用在其他领域吗——比如书籍,电影,红酒,旅馆或旅游地点?每一种分别由什么构成基因?比如,我们是否能够说,红酒的基因就是那些形容口味的东西:黑莓味、泥土味、水果味、复杂、混合等等。而对于书,基因是否就是描述情节的词?如果我们认为基因就是那些使得物体独一无二的东西,那么各种东西都可以毫不费力地用基因来描述。在过去的几年里,我们在网上就大量地做了这样一件事:标注。
美味书签(Del.icio.us)——标签是否能成为基因?
潘多拉启动成本很大,因为有成千上万个音乐片段需要人工注释。而del.icio.us的社会化书签现象则用到了另一个方法——让人们自己去注释。这种自组织的方法很好用,而且del.icio.us在早期的使用者中迅速地流行了起来。现在,del.icio.us已经不单单是一个书签网站了——它还是一个新闻站点和一个搜索引擎。但是del.icio.us是一个推荐系统吗?
答案是肯定的。这里有一个基本的推荐系统,它基于一个基因——标签。比如在上面的图中,我们看到了使用linux标签的一些流行的链接,同时,我们也看到了相关的标签比如open source和ubuntu.但是一个更让人兴奋的推荐系统是基于多标签匹配的。不幸的是,现在这种启发式的方法并不总是管用。这也是其推荐特征并不明显的原因。但是幸运的是,它对读写网(Read/Write Web)的页面很有效,产生了大量相似博客的列表。(见下面的"related items"):
所以,del.icio.us的方法极有可能被用于构造一个自组织分类和推荐系统。通过足够的用户量和更多打磨,社会化标签可以产生一个对书籍、红酒和音乐都很管用的推荐系统。当然,前提是标签要好到足以成为基因!
结论
推荐引擎是在线交易系统和用户体验很重要一块。零售商们有很大的激励向那些“只是浏览”的用户推荐产品,来诱导他们购买。Amazon.com,这个领域的领袖,提供令人瞩目的个性化服务。其他零售商面临的问题是缺少用户信息和基础架构。
最近被应用到推荐系统的一些方法,比如潘多拉的基因灵感和del.icio.us的社会化标签,都是值得思考的。这些方法能即时地产生推荐,而不需要用户暴露他们的喜好和过去的历史记录。不管将来怎样,亚马逊,潘多拉,美味书签都是拥有非凡推荐系统技术的典范。我们赞赏他们,并期待着接下来会出现什么。
相关文章:
读过《Don’t Make Me Think》的人肯定记得,作者在其中提到了简单的可用性测试。不过用个摄像机什么的,似乎不太适合我们这边的情况,在国内的中小型企业,实际的尝试和运用中,还是需要不少变通的。今天就来谈谈我在实践中得出的一些经验。
如果:
你所在的公司刚开始推行UCD,一切都刚起步;
没有固定的人手,没有很多的资源,测试研究的时间和经济成本非常局限;
你看了不少有关的书和文章,但实际开始做的时候还是觉得有不少困惑
测试的时机
理想地说,可用性测试尽早开始越好,也应该是产品开发的一环,可以有一个迭代的过程。但是对于初次的尝试来说,不一定能够做到:也许你的Boss不希望把“半成品”拿出来给人看,也许你们的开发进度紧迫插不进这样的时间,但是也不必放弃,晚测试总比不测试好,实在不行就把发现的问题放到下个版本去修改。亡羊补牢,为时未晚。
当你的同事和上司看到了可用性测试的价值后,你做测试也慢慢上手了,就能争取到加入开发环节的机会、迭代测试和开发的机会。或者你的产品频繁有少量改动的更新,这样子测试问题也不大。
你需要的,只是抽出下面提到的一些时间。
准备时间
测试前,你可能需要在一两周的工作时间穿插可用性测试的准备工作。若是刚开始在公司尝试可用性测试,你应该写一份简单的测试计划——告诉你的Boss你要做什么事情、也帮助自己规划做测试的一系列工作。
然后也许你需要申请一些资源,空间、硬件、人员协助等等~
Check一下这次要测试的功能,设计一下测试的任务。如果是第一次测试,心里过一下整个测试的过程,开始-测试时的引导-结束,有机会做次导测的话会让你更有信心。
还有就是招募受测。这个根据你招募的方法需要的时间不同,具体的招募请见下面的部分。
测试时间
准备好了,和受测也约好时间,就可以开始测试了。
你的受测很可能是上班族,这也就意味着测试会安排在非工作时间,比如晚上、周末。就算你很经济,用的是同事,也可能因为他们工作繁忙需要一起占用午休时间或者下班后多留一会儿。>_<真是辛苦,测试难免会需要你加班。而唯一的好处就是,如果你是在本职工作之余做这件事,对原先工作的进度影响就没那么大了。
分析&结果分享时间
测试结束之后,整理下你的记录(如果有条件录像的话,还要回看录像),分析归纳写一份测试报告,写下发现的问题,附上些截图或者关键录像片段。报告不必弄得很详细,目的是为了把测试发现的问题让同事了解。个人觉得比较好的是PPT,不必很多文字,可以现场讲解问题的具体情况和背后的原因、还可以大家一起讨论修改的方案。如果没时间做presentation,给同事看文档,写简单一些,挑重要的写。
如果你有录像而且有时间编辑,绝对推荐做一些这样的片段:一个受测反反复复就是找不到某个功能在哪里、或者多个受测都在同一个地方犯同样错误的重复片段——等他们坐立不安地看完,然后开发和设计就会主动说,这个,该改!嘿嘿,这时候我总是开心得窃笑~
根据公司的需要或者你的职能,可以针对发现的问题提一些大致的修改方案,或者组织相关人员讨论等等~记得要把测试的效果落到实处,哪怕只能在下个版本中去弥补那些问题。
谁来做可用性测试?
也许就是正在读本文的你。是关注用户体验的开发人员?设计师?或者PM?介于公司规模、产品特性,可能没有专职的可用性测试人员,最初尝试可用性测试,可能只是团队中的一员抽空来做这件事情。这是最经济的做法,不过记得,这个人要:
客观,不要因为是自己的产品在测试和分析的时候不自觉去袒护它;
有观察力和分析力,这样才能让测试起到成效;
与人沟通的能力,引导你的受测、在公司里争取尽可能的资源和协助。
关于人数,一人虽然辛苦些,但是就能完成。若两人搭档更好,尤其是测试时,可以一人引导、一人负责记录。
受测的招募
保密协议?测试费用?如果这些问题让你打退堂鼓了,不妨先请公司同事作为你的受测。不过记得不要请产品的开发或者测试人员啊,我不死心地试过一次,真的不合适>_<。你可以请和产品的设计开发无关的,比如行政部门的美眉、新来的同事、另外一个产品项目的成员等等,不单解决了费用和保密的问题,而且受测招募也很快捷,不过记得要和同事还有上司沟通好哦。
测试招募真正的用户当然最好了。这里有一些很经济的方法:
去问问客服,有没有一些可以来参加测试的用户?或者请他们在最近接触用户时邀请他们来参加测试;
你可以靠平时累积一些受测用户的资料,比如抽奖等推广活动等等,去问问相关的同事吧;
还有,就是发动同事们,大家把可以作为受测的亲朋好友们推荐给你~
关于受测的人数,根据测试的产品变化:只是增加几个功能的小版本,3~5人;全新的版本,可能5~8人,简单的可用性测试,控制在10人以下。关于这个,经典的理论:5个受测发现80%的可用性问题
简单的房间即可
既然是说简单经济的、初次尝试的可用性测试,当然不会有单向玻璃之类高级的东西~你需要的只是一间不受打扰的房间,可以用产品的电脑。可以临时占用间会议室,有条件的话就找个固定的地方,建一个简易的Lab。我们公司的Lab,小小一间里摆着电脑桌和沙发茶几,平时不做测试的时候做小会议室、中午时候是休息室、有人面试时是接待室,超级多用哦~够经济实惠吧~
移动的lab
若你的产品可以单机运行,或者是个没什么带宽要求的互联网产品,那么还可以带上你的笔记本电脑,把受测请到一茶一坐之类可以上网的安静茶坊里,一样可以坐下来测试。请你的用户喝一杯茶/咖啡,就可以了解他使用产品的情况。这个方法,同样使用于做访谈。
可用性测试并不是件难事,用Angela的话说,可用性测试早就跳楼大减价啦~ 成本可以降低,门槛也可以降低,尝试一两次简单经济的可用性测试,会是在公司中推行UCD很好的起步。关键是去尝试、根据自己所在企业的情况灵活应变。同样的,你也可以尝试其他的一些方法,或是访谈、或只是在平时注意观察他人的使用、询问他们的意见。
合适的才是最好的,当你找到了适合的产品的方法和方式,一定能帮助你改善产品的用户体验。
转载请注明出自UCDChina.com,谢谢。
有时候看关键词的统计并不知道具体的关键词是从那个搜索引擎过来的,具体落到了自己网站的那个页面上。给AWStats的关键词列表增加了几个链接,直接指向相应关键词的在百度,谷歌,雅虎3个引擎上的站内搜索结果。效果如图:
修改代码附后:
各位虾友,大家好哦~
我们升级了每周推荐博客。
没有想到抓虾每周博客推荐推出以后,报名申请的博客和站长这么多,一下子我们有点应接不暇,审核工作的任务量实在太大了。因为既要查看博客内容,又要查看rss输出内容,要比较上次提到的那些项,选出推荐来,实在是一件不容易的事情。
为此,我们改善了每周推荐博客的申请系统,通过机器的方式帮我们判别,现在大家在热文中既可以看到每周抓虾推荐的博客,又可以点击下边直接去申请了。
据小虾观察,第一周推荐的图片〃日記,在上推荐之前只有3个订阅,现在已经有26个订阅者了;而每日英语博客,上榜前只有300多的订阅,目前已达到900多,可以说效果还是比较明显滴~
在申请系统试运行的几天里,由于程序的小问题,好多博客和站长申请的时候并没有成功上传logo图片,这是一个严重的问题喔。因为如果不上传图片,那么推荐位就会很难看的。为了保证热文页面的美观,我们只能让有图片的博客得到推荐哦
不过前面申请过的朋友也不必担心,在热文那里再点击申请或者只要去“设置”里边上传一下就可以了。
同时上线的一个小进步还包括热文右上角的“抓虾小贴士”,这个小贴士基本是跟抓虾日记是同步的,大家可以更方便的查看抓虾的动态咯
刚过完中秋,十一就要到了,小虾真开心 (*^__^*) 嘻嘻……
抓虾的中秋logo很多朋友贴到自己的博客上,跟其他网站的logo做了比较,我们都看到了,请大家关注俺们十一的logo吧
小虾在这里先祝大家长假快乐啦!!
本文发表于本周三的21世纪经济报道:
很多互联网创业者都声称自己在专注于某项事业中,对此,我一点也不想表示怀疑。但是,在专注之前,总得先看看自己究竟专注在什么事业中,才有意义。
以UGC(用户贡献内容)为核心的Web2.0大潮席卷了当今的整个互联网络。Web2.0的本质其实就是向用户提供各种应用, blog是一种写的应用,sns是一种建立关系的应用,包括tag、dig、网摘、图片、视频等等,都是应用。每一种应用,都极大地解放了单个用户的内容生产能力,于是,形成了一种著名的说法:去中心化。
如果应用能够直接收费的话,那是绝对没有任何问题的。但麻烦在于,大多数的网络用户(特别在中国),使用免费服务是一种习惯。加上市场本来就有跟风传统,一个应用推出,百种模仿现身是很正常的事情。于是,为某项互联网应用直接掏钱的人,恐怕百分之一都不到。
既然不能直接收费,转向间接收费就变得理所当然。从当年的简单banner投放,到今天的所谓整合营销传播,一言以蔽之,就是广告。从所谓的营销1.0到营销2.0,其实无非是说法换了,手法变了,核心不会变化:将受众的注意力(甚至直接是受众)打包卖给第三方以帮助第三方推广它想推广的东西并从中获得利益。
于是,问题来了:广告主,是讲受众结构的!
我们用豆瓣做例子。豆瓣是一个很不错的以书评起家的Web2.0网站,基本上也是靠广告活着的。在豆瓣上,当你点击一本书前往当当或者卓越进行购买行为的话,豆瓣可以获得一定数量的提成,这是很典型的按销售额付费(Cost-Per-Sale,CPS)的广告模式。这里,书评是很关键很核心的部分。正是因为书评,才使得上豆瓣的人会成为当当或者卓越的目标受众,才会形成有效的广告模式。结论就是:豆瓣,是一个很典型的垂直网站,聚焦于读书。
垂直性网站,这是Web1.0中的概念,相对于大而全的门户式水平网站而言,某些网站聚焦于某个行业,且在这个行业中做得风生水起,丝毫不输于甚至更强于门户的对应频道。最突出的例子莫过于中国化工网,一家号称每周都在盈利的聚焦于化工行业的1.0式网站。
Web2.0网站,在不断地发明出让用户更好地生产内容的同时,越来越忽略这样一个事实:你的用户是谁?所谓的三高人群(较大年龄、较多收入、较高社会地位)是没有任何意义的,因为你的广告主不是只需要互联网用户做它的客户。而基本上,互联网本身就是三高人群扎堆的地方。太多的 Web2.0网站的用户特征,基本上就是互联网全体用户的特征。于是,在排除了直接收费的生存模式之后,只留下了两条出路:
其一,搞大,要搞到连门户都敬畏的地步。中国博客网一度搞得很大了,但没有大到让门户都觉得比它还要大的地步,非常轻易地,新浪以名人博客为卖点,迅速成为了博客中的领头羊。对于规模很大实力很强的门户而言,开发几个功能,不是什么难事。毕竟,大部分的Web2.0应用并不需要什么高深的技术。
其二,被收购。很多人都认为某某网站被巨头收购是成功的象征,但我从来不这么看。辛辛苦苦打下的一份基业,被人全盘收购,有什么好值得骄傲的。
Google的首席执行官Eric Schmidt博士在一次讲演中,当被问及“何为Web3.0”时,很平静地回答到:“Applications that are pieced together。”翻译过来就是:碎片式的应用被组合在一起。而用商业的话语来说,就是巨头出手整合并购那些碎片式的应用。
Web2.0网站,如果没有行业上的专注,大抵,就是这样一个结局了。
九月 2007 | ||||||
一 | 二 | 三 | 四 | 五 | 六 | 日 |
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |