??xml version="1.0" encoding="utf-8" standalone="yes"?> 搜烦是你明确地知道自p找什么东西时所做的事情Q而发现是你ƈ不明地知道一些好东西存于世上的时候,q些东西d扑ֈ了你?nbsp; ?#8220;发现”Z要功能的|站正如雨后春笋般在互联|上崭露头角。许多公司推Z能够帮助消费者找到新|站、新q或者新朋友的推荐功能——不想要什么,M联网上都可以发现那些你闻所未闻却又注定会一见钟情的东西? 走进M一条商业街上的某间服饰专卖店,露Z点购物的們Q导购h员就会走到跟前,指着不远处说Q?#8220;那款是最q刚上架的新品,看v来与你的气质比较搭配”。这时你很可能会l箋和导购h员交谈,多透露一些自己关于衣着打扮的看法,让他或她l箋l出Q帮助选中最心满意的款式?
q种功能q不是互联网时代的专利。早在互联网出现之前Q在那些用钢{凝土搭徏h的小店面或者大卖场里,个体业主们就已经在靠自己敏锐的目光和三寸不烂之舌Q根据你的个性特Ҏ货架上的商品源源不断地放q你的购物篮?nbsp;
q就是我们所说的“?#8221;街。在走出安的时候,你的脑中或许有买衣服的计划,却ƈ不知道应该买哪种品牌、款式、颜艌Ӏ布料、h位的商品。走q商店之后,֮面对未知的货架开始了自己?#8220;发现”之旅Q而商店向֮提供?#8220;推荐”机制随即开始运作——虽然在多数情况下,你ƈ不会意识到它的存在?
我们不仅仅是在买商品Q我们还和商品紧紧地捆绑在一赗我们和它们之间存在着千丝万缕的联pR看看架上收藏的无数q、iTunes播放器里的曲目列表、h在橱柜里那些用过的手机,从每一样东西n上都可以看出来——你是怎样的一个hQ或者说Q你x为怎样的一个h?
每个人都通过所购买的东西把内在的自己呈现出来。从另外一个角度说Qh们每天都把个性穿在、戴在、挂在n上,L或无意、直白或含蓄地告诉外界:“喏,q就是我?#8221;
在真实的世界中,我们通过外表所蕴含的信息以及所处的环境和既有的l验对他人做出判断。这U直觉通常情况下十分管用而且立竿见媄Q但是有时候它却会qQ毕竟感觉在很多时候是说不准的。但是如果换C联网上,qg事情׃变得Ҏ和清晰得多?
“发现”在网上的兴v
日复一日,消费者都会在互联|上以数字化的Ş态留下自q心得体验。比如豆瓣网上有一半观众觉得《满城尽带黄金甲》看着“q行”Q两成观众打?#8220;力荐”Q比如大众点评网的用户对北京川办厅的打分是Q口?6、环?3、服?2Q又比如Z在网上对各张专辑做出的评论、脓上的标签。每当用L下这L标记Q除了能够让其他人知道这些东西看h如何、听h怎样Q还在不知不觉地向外界描q自q口味?
对于那些可以获得、储存ƈ且分析这些信息的公司而言Q商机大得惊人。这些公司比传统商店里的D人员更了解你Q更q一步说Q指不定比你的闺中密友更清楚你的兴趣所在。这些公司可以精准地描绘你的口味——在专家的帮助下Q他们可能比你还更容易说清你自己属于哪类人群——以此判定你最可能会在现有的品选项中买下什么。这些在q去听v来像“W六?#8221;的东西,现在正以1?体被保存在网l服务器上?
对于那些以推荐功能ؓ核心的网站来_他们再清楚不q地知道Q互联网正在从搜索的时代q入发现的时代。两者的区别在哪里呢Q搜索是你明地知道自己要找什么东西时所做的事情Q而发现是你ƈ不明地知道一些好东西存于世上的时候,q些东西d扑ֈ了你?
在搜索领域,胜负已经非常明显——在国外QGoogle遥遥领先Q在国内Q百度一枝独U。但是,L到目前ؓ止,q没有哪个推荐引擎是当之无愧的市场领D?
建造个性化的发现机刉要对目前|上所有的表述、分cd评h方式q行深入研究Q这l非易事。但是如果有公司可以把这L东西做到手机上,那么Q这L发现工具不仅仅可以改变营销Q甚x个商业社会?#8220;推荐pȝ会成ؓ接下来十q中最重要的革C一?#8221;曄?0q代中期开发出W一Ҏ荐引擎的c_苏达大学计算机科学系教授U翰·里d(John Riedl) 说过Q?#8220;C会化网l将会被q些pȝ所驱动?#8221;
亚马逊网l商?Amazon.com) 很早意识到了一个优U的推荐系l可以带来什么,直到现在依然是同cȝ站效仿的对象。亚马逊通过数据挖掘法和比较机制将用户的消费偏好与其他用户q行ҎQ借以预测用户可能感兴的商品?
q样的推荐系l徏立在对商品深入了解的基础之上。看看亚马逊网l书店上的书c和影音制品Q即便是再偏门的品种Q他们也被管理员赋予了多U类?Genre)和关键词(Keyword)Q而且用户q可以ؓ它脓上自׃意的标签(Tag)?
但是亚马?#8220;相关图书”?#8220;相关q”的推荐机制依然没有做到够的个性化Q它看v来更像是一个固执己见的推销员,而非熟识q且值得信赖的小店老板。亚马逊的pȝ們于向用户推荐那些显而易见的的相关品,却对用户~Z更深入的了解Qƈ因h而异地推荐商品。新一代的发现型网站正在I补这斚w的缺失,搞清楚用户ؓ什么选择了某些商品,为用户也贴上复杂的属性标{?
Z建造更好的推荐pȝQ美国最大的DVDU赁|站Netflix讄?00万美元的奖金Q准备奖q可以让推荐机制性能提高10%的h。在q个竞赛公布之前QNetflix负责推荐pȝ的副总裁吉姆·贝内?(Jim Bennett) 曄怀疑是否能够有人在十年之内完成q个目标Q但他也坚持Q这个目标确实值得公司付出100万美元。但是在五周之后Q已l有37人提交了改进ҎQ其中有两名选手成W获奖标准ƈ不遥q?
两种“发现”
而电影推荐网?#8220;What to Rent” (意ؓ“U点什?#8221;) 已经在发现机制的完善之\上迈Z更大的步伐。该|站的两位创始h马修·库尔?(Matthew Kuhlke) 和亚?#183;盖特?(Adam Geitgey) 对电影极为痴qP他们俩用自己在电影方面的知识和分cLv量电ql验来武装自q电媄数据库?
而同Ӟ他们让初ơ光临的用户回答一pd随机的问题,有的甚至和电qh关系不大Q比如说Q?#8220;你最喜好哪一cM验——精、智力还是n体上的?”或?#8220;l你多少钱才能让你在下半辈子里每天都I一些滑E古怪的装束Q?#8221;他们通过心理试来了解用P以推荐合适的电媄?#8220;看一部电q时候,你就与这部电׃生了互动。这U互动和你与人打交道q没有多区别?#8221; 库尔克说Q?#8220;你都是在建立一U关pR?#8221;
“工欲善其事,必先利其?#8221;。换到发现型|站上,那就是想要推荐给用户最有效的结果,那么必d了解自己的用戗如何了解自q用户Q成为此cȝ站首要解决的问题?
昄Q?#8220;What to Rent”|站两位创始人的敏锐目光l他们帮上了大忙。在|站上,他们用许多问题来了解用户的特质,q且推荐DVD。在现实生活中,他们会去公司附近的饭店里 挑战一些更有难度的推荐方式。他们随机地挑选一些hQ不和他们进行交谈,只是Ҏ对行ZD止的观察来推他们最喜欢的某部电影?
他们会在人群中选中端水送饭兼收盘子的伙计,然后开始描q这个观察对象:“破烂的牛仔裤、金属手镯、各部位有若q纹w?#8221;Q?#8220;20岁以上接q?0?#8221;Q?#8220;在一个年d的餐馆里工作”Q?#8220;在这里的q轻人很多没有念完高中,因ؓ他们很难集中注意力,但是却花了大部分旉用来阅读一些由Zhg家——比如尼?#183;凯夫 (Nick Cave) ——撰写的哲理书籍”。由此,库尔克认为《星x队?Starship Troopers) q样有点d反政府情节又有点刺激动作场面的电影最适合他的口味。果Ӟ他们从对方嘴里得到这个答案?
q种了解内容和用L特质Q送上合适品的做法Q被UCؓ“Z内容的过?#8221; (Content Based Filtering) 。正?#8220;What to Rent”需要在事前对用户做一个问卯查,他们同样要对内容产品贴上各种门类的标{ƈ且写入数据库??
在这cd现型|站中,国内用户最熟悉的是音乐推送网?#8220;潘多?#8221; (Pandora) 。只要在“潘多?#8221;|站首页的播攑֙中输入用h喜欢的歌手名字或者歌曲标题,|站׃自动建立一个网l电収ͼ源源不断地播放最W合用户口味的曲目。用户喜Ƣ或者不喜欢一首歌Q可以点ȝ应的反馈按钮Q让pȝ更明白自q喜好?
q种有趣的体验徏立在惊h?#8220;音乐基因工程”(Music Genome Project)基础之上?5位音乐分析师——其中大部分拥有音乐斚w的学位——以每月15000首歌的速度完善“潘多?#8221;的曲目数据库Q每首歌都拥?00字左右的详细介绍。在播放每一首歌的时候,点击“Z么选择q首?#8221;的选项Q就可以得知目前播放的曲目与用户输入曲目的所有相g处?
而随着C会化网l?Social Network) 的大规模兴vQ另一U被UCؓ“协同qo”(Collaborative Filtering) 的推荐方式也得到了越来越q泛的应用。如果说“Z内容的过?#8221;可以被视作由机器完成的推荐,那么“协同qo”可以被看成׃h完成的推荐?
?#8220;协同qo”推荐机制为核心,|站q不需要做出如?#8220;What to Rent”?#8220;性格—?#8221;匚wQ而只需要了?#8220;用户都在同哪些hq行交往”?#8220;用户加入了哪些组?#8221;?#8220;用户都在看谁的页?#8221;q样的问题,然后Ҏ“物以c聚、h以群?#8221;的思\为用h荐他的伙伴都感兴的事物?
国内以图书推荐v家的“豆瓣”是q方面的代表。从建站以来Q豆瓣就只是提供l用户关于图书、电影和音乐的基本信息,而不需要由|站员工对用h者品做?#8220;贴标{?#8221;式的逐一了解。用户在“豆瓣”上发现新的品,完全以他们参与的组和关注的对象作ؓ切入点,在网站上的参与度高Q发现的效果也就好?
无论从用戯是服务提供者的角度出发Q这两种推荐方式都有各自明显的优劣。如果采?#8220;Z内容的过?#8221;Q那么在完成内容和用户互相匹配的q程中,可能出?#8220;读窄”?#8220;听窄”?#8220;看窄”的问题,提供的内容完全与用户兴趣点相dQ而没有发散?
“协同qo”在很大程度上避免了这个问题,但是他需要用戯C定数量之后才能发挥出网站创预想的效果Q这U?#8220;|络效应”使得同一市场上的后来者很难找到切入的Z。而用户一旦不能得?#8220;好处”Q可能迅速离去,而来不及?#8220;利他”的后话。■
转蝲Q?font face="Comic Sans MS">http://blog.csdn.net/java060515/archive/2007/04/18/1568658.aspx
]]>
1、基于用戯为:案例amazonQ亚马逊)
亚马逊的推荐pȝ是程序自动化和用L兌物信息天才集合的l典之作。亚马逊花了十几年的时间徏立和完善了这个系l。这个系l基于品和相关用户的巨大数据库Q记录的信息包括你在q去几年或几分钟内做q什么?
所有推荐都Z用户个h行ؓQ加上商品本w,或者是其他用户在亚马逊的zd。不是因ؓ你以前购买过相关产品Q还是因为其他很多用户都喜欢Q亚马逊每推荐l你一件商品,都增大你把它放进你的购物{的可能?
2、基于品基因:案例pandoraQ潘多拉Q?
音乐染色体组目?推出Q目的在于把音乐解析成ؓ最基本的基因组成。它的基本想法是Q我们因为音乐的某些Ҏ喜Ƣ音乐-Q那么ؓ什么不能根据音乐的某些怼之处设计Z套推 荐系l呢Q这cL荐系l应该属于基于品的推荐。但h深刻创新意义的是Q品(音乐产品Q的怼性,通过“基因”l成来衡量?
q种“卛_满?#8221;是很难抗拒的。因为pandora 了解音乐怼性背后的因素Q它不需要了解用L好恶Q就可以把用户黏住。确实,pandora 需要把握用L口味或记忆-Q但q正是蕴藏在音乐本n的dna中了。当然pandora有时q不完美Q会播放不对用户口味的音乐。但q很发生?
拓宽联想Q音乐品的基因l适用于其他品吗Q也是_标签QtagQ是否就能代表品的基因呢?案例del.icio.us
C会化书{站中首屈一指的 del.icio.us Q见译言有关del.icio.us的译文)则采用不同的办法Q-让用戯己来鉴定、标识。这U自l织的方式相当成功,del.icio.us 很快在最初的使用者中行h。今天,del.icio.us 已经不仅仅是一个书{站-Q它q是一个新ȝ站和搜烦引擎。但del.icio.us是否也是一个推荐系l呢Q?{案是肯定的。这是一个非常简明的推荐pȝQ它指基于一个基因-Q那是一个标{?
思考:每一个网站都有自q一套ؓ用户创造体验与价值的方式Q而真正的“卛_满?#8221;又有几家能做到。尤其现在的web2.0cd|站都首先标?#8220;用户体验”Q在copy一个成功模式之后,以ؓ同样完整的copy了相同的“用户体验”的自我感觉其实是错误的。比如说Q我们很多的diggcR书{新网站,q没有发挥自q创造力Q甚x本都没有l合国情。或许未来下一个更好的pȝ是完地用戯Z产品基因相结合的推荐模式,不管是商务网站的产品推销Q还是社会化|站的服务,因ؓQ?
一个出色的推荐机制不光对netflixQ对其他|络企业也非帔R要。这是因为用L|上zd分ؓ两类Q搜索和览。当消费者明知道她惌什么的时候,Ҏ索。但当她不太清楚惌什么的时候,Ҏ览。浏览活动ؓ推荐pȝ带来了绝好的Z。因为当用户没有集中注意力在扑֥惌的东西时Q她对外来的是敞开的?
在浏览过E中Q用L注意力(和他们的钱)Q都{着你去抓住。通过向用户展C有吸引力的东西Q网站可以交易成功的可能最大化。所以如果网站能增加l用h供好推荐的几率,p赚更多钱。显然这不是一个容易解决的问题Q但解决q个问题带来的好处是巨大的?/span>
2006q?0月,Netflix搞了一ơ不d的有奖竞赛。这家网上DVDU赁公司开出奖金一百万元Q奖q能把他们|站的品推荐机制提?0%的h。Netflix 以富有创新精和闯劲著称。而一百万元的奖金对于这样一家公司来_其实q不象听h那么多?br />
有奖竞赛q在q行当中Q?#8220;臛_要进行到2011q?0??#8221;Q。所以这是一场炒作活动还是希望花钱q行研究Q我们还不得而知。而对Netflix来说Q更好的推荐机制是必不可还是锦上添花?今天QNetflix正面对从沉睡中醒来的巨hBlockBuster的挑战,因此它必然要L制胜的先机。出色的推荐机制会留住老用P吸引新用戗比如当一个用戯DVDӞpȝ会推荐给?她可能会喜欢的另一部电影。这增加了q个用户回来再租DVD的可能?br />
一个出色的推荐机制不光对NetflixQ对其他|络企业也非帔R要。这是因为用L|上zd分ؓ两类Q?span>搜烦?span>览。当消费者明知道她惌什么的时候,Ҏ索。但当她不太清楚惌什么的时候,Ҏ览。浏览活动ؓ推荐pȝ带来了绝好的Z。因为当用户没有集中注意力在扑֥惌的东西时Q她对外来的是敞开的?br />
在浏览过E中Q用L注意力(和他们的钱)Q都{着你去抓住。通过向用户展C有吸引力的东西Q网站可以交易成功的可能最大化。所以如果网站能增加l用h供好推荐的几率,p赚更多钱。显然这不是一个容易解决的问题Q但解决q个问题带来的好处是巨大的。推荐的几种方式如下Q?br />
我们现在通过实例详述上述方式。包括老牌|站如亚马?AmazonQ以及新U如PandoraQ译者:一个收听网上音乐的站点Q和del.icio.usQ译者:著名的社会化书签|站Q?br />
亚马逊被q泛认ؓ是网上购物行业的领袖Q特别是推荐机制的用。过d几年_该公司投入了大量金钱和脑力开发推荐机Ӟ来促使用h多地购物Q-包括对你览历史、购买历Ԍ以及其他用户购买数据的分析。让我们看看亚马逊推荐机制的几个斚w。下面是登陆到我的亚马逊帐户后|页昄的主要部分:
Q译者:上图抬头?#8220;消费者浏览了qg商品后买了什么?”下面是三件商品:52%的消费者买了你正在看的q套衬衣Q?9%C另一U款式;5%C灰色的那U)
q部分是C会化推荐。注意,非常量化的分析,l我一个基于数据统计的理由Z么我应该买这套衬衣。而同时这又是个性化的推荐,因ؓ它基于我刚刚点击查看的品?br />
Q译者:上图抬头?#8220;Z准备的新?#8221;。下面是几本书以及链?#8220;Z么我们推荐这本书l你Q?#8221;Q?br />
q一部分?#8220;Z产品的推?#8221;Q具体说是新书推荐。点?#8220;Z么我们推荐这本书l你Q?#8221;的链接会昄我的购买历史。因此这同时也是个性化推荐Q-Z我过去行为的推荐?br />
q一上有其他四个部分采用上q推荐机制的l合。我们用下表概括Q?br />
亚马逊个性化推荐pȝ
你的览历史 | 你的购买历史 |
实际览商品 | C品(Z产品的推荐) |
相关商品Q基于品的推荐Q?/td> | 相关商品Q基于品的推荐Q?/td> |
别h购买的(C会化推荐) | 别h购买的(C会化推荐) |
很自Ӟq个pȝ是对U和覆盖全面的。所有推荐都Z用户个h行ؓQ加上商品本w,或者是其他用户在亚马逊的zd。不是因ؓ你以前购买过相关产品Q还是因为其他很多用户都喜欢Q亚马逊每推荐l你一件商品,都增大你把它放进你的购物{的可能?/p>
亚马逊的推荐pȝ是程序自动化和用L兌物信息天才集合的l典之作。亚马逊花了十几年的时间徏立和完善了这个系l。这个系l基于品和相关用户的巨大数据库Q记录的信息包括你在q去几年或几分钟内做q什么。其他新公司如何与之竞争呢?
Z意料的是Q有办法竞争。答案来自与|络购物没什么关pȝ学科Q-遗传学。如你所知,遗传学研IDNA片段Q-基因Q如何承载媄响hcȝ性和行ؓ的密码。比如一家h因ؓ他们有某些基因是相同的,因此长相和行为有cM之处。遗传学是一门有150q历史的学科Q在d和历史学的研I中都是一个重要工兗但遗传学一个出乎意料的应用?000q??日出玎ͼQTime Westergren和他的朋友们军_把遗传学的概念引入到音乐中?/p>
音乐染色体组目的推出,目的在于把音乐解析成为最基本的基因组成。它的基本想法是Q我们因为音乐的某些Ҏ喜Ƣ音乐-Q那么ؓ什么不能根据音乐的某些怼之处设计Z套推荐系l呢Q这cL荐系l应该属于基于品的推荐。但h深刻创新意义的是Q品(音乐产品Q的怼性,通过“基因”l成来衡量?br />
Q译者:上图是Pandora音乐播放器向用户解释Z么播放一首歌Ԍ“Z你告诉我们的信息Q我们播放这D音乐。因D音乐微妙地使用人声合声Q合了声学和电子乐器,有以人声为核心的审美特点Q音调以大调ZQ以及其他音乐基因组目中发现的怼性?#8221;Q?br />
在奋斗了几年Q分析了量的音乐后Q这个项目积累了_的数据,q推Z名ؓPandora的在|上收听音乐的服务。Pandora ׃准确的推荐和用户低成本进入(译者:指用户可以很Ҏ地就试用Pandora的服务)取得巨大成功。用户只需选一名歌手,或一首歌Q就可以建立一个用戯q电台Q播攄似的音乐?br />
q种“卛_满?#8221;是很难抗拒的。因为Pandora 了解音乐怼性背后的因素Q它不需要了解用L好恶Q就可以把用户黏住。确实,Pandora 需要把握用L口味或记忆-Q但q正是蕴藏在音乐本n的DNA中了。当然Pandora有时q不完美Q会播放不对用户口味的音乐。但q很发生?br />
很自然地我们会问Q这个基于基因的推荐方式能不能应用于其他产品Q-如书c、电影、酒、餐馆、或旅游点呢Q对于每一cM品,它的基因又由什么因素组成呢Q比如说Q对葡萄酒来_它的基因是否包括寚w的口味的描述呢:黑莓口味、土呟뀁果香型、复合型、合型Q等{。而书c的基因是否是描q故事情节的用语呢?如果基因真的是让某一个物体在我们头脑中生独特Ş象的因素Q对于不同的事物我们应该可以把他们的基因定义出来。其实在q去的几q间Q我们已l在互联|上做这L事了。这是“标签QtaggingQ?#8221;?/p>
Pandora 的初始投入是巨大的。因为成千上万的音乐需要h工来鉴定。社会化书签|站中首屈一指的 del.icio.us 则采用不同的办法Q-让用戯己来鉴定、标识。这U自l织的方式相当成功,del.icio.us 很快在最初的使用者中行h。今天,del.icio.us 已经不仅仅是一个书{站-Q它q是一个新ȝ站和搜烦引擎。但del.icio.us是否也是一个推荐系l呢Q?/p>
Q译者:上图昄加了“Linux”标签的最受欢q的|页链接Q右侧是相关标签。)
{案是肯定的。这是一个非常简明的推荐pȝQ它指基于一个基因-Q那是一个标{。例如在上图中,我们看到最受欢q的加了“Linux”标签的网链接,同时q看到相关链接如“Open source Q开源YӞ”?#8220;ubuntu QLinux 操作pȝ的一个版本)”。而一个更令h兴奋的推荐系l是Z多个标签的吻合。然而由于算法还不完善,q一点的作用q不明显。但臛_Q这一功能对于Read/WriteWeb 的网(译者:原文的站点)是有效的Q在下图中,可以看到右侧昄的与 Read/WriteWeb cM的其他博客?/p>
因此Qdel.icio.us 的机制有可能发展成ؓ一个有的自助分类、组l的推荐pȝ。如果有_的用户ƈ逐步调整pȝQ用体的力量加标签的方式可以徏立v一个对书、葡萄酒、音乐同h效的推荐pȝ。前题是Q标{要准确到能够成标签对象的基因!
推荐引擎是网上电子商务系l和用户体验的一个重要组成部分。网上零售商们有强烈的意愿向那些正在览的用h供推荐,以驱使他们购买。亚马逊有一套非常出色的个性化推荐pȝQ是q个领域的领先者。其他网上零售商面的问题是~Z用户信息和Y件构架不完善?/p>
最新的推荐引擎Q如受遗传学启发的Pandora和基于群体社会化标签的del.icio.us都是非常有趣的新发展。这些系l的长处在于“卛_满意?#8221;Q-不需要用h供他们的偏好和过ȝ览或消费历双Ӏ不未来如何发展,亚马逊、Pandora和del.icio.us目前展示了极其出色的推荐技术。我们向您推荐这几个pȝQƈҎ来拭目以待?br />
转蝲Q?a >http://blog.csdn.net/java060515/archive/2007/04/18/1568824.aspx
|
电媄A
|
电媄B
|
电媄C
|
电媄D
|
张三
|
喜欢
|
|
|
|
李四
|
喜欢
|
喜欢
|
喜欢
|
喜欢
|
王五
|
不喜?/div>
|
|
不喜?/div>
|
不喜?/div>
|
赵六
|
喜欢
|
喜欢
|
|
喜欢
|