<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/rss2full.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?><rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" version="2.0">

<channel>
	<title>Resys China</title>
	
	<link>http://www.resyschina.com</link>
	<description>all about recommender systems</description>
	<lastBuildDate>Mon, 12 Apr 2010 15:44:37 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://feeds.feedburner.com/resyschina" /><feedburner:info xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" uri="resyschina" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><item>
		<title>Resys Group 第四次活动总结 (by xlvector)</title>
		<link>http://www.resyschina.com/2010/03/resys-ibmcrl-xlvector.html</link>
		<comments>http://www.resyschina.com/2010/03/resys-ibmcrl-xlvector.html#comments</comments>
		<pubDate>Sun, 28 Mar 2010 03:51:53 +0000</pubDate>
		<dc:creator>xlvector</dc:creator>
				<category><![CDATA[resysevent]]></category>
		<category><![CDATA[ibmcrl]]></category>

		<guid isPermaLink="false">http://www.resyschina.com/?p=49</guid>
		<description><![CDATA[昨天邀请到了IBM CRL的3位研究人员给resys  group的成员们介绍了他们在推荐系统方面的一些研究成果，首先要感谢Intel社区给我们提供了场地。
因为我最近半年在IBM CRL实习，和 3为researcher在一个组，所以对他们的工作比较了解，所以在这里总结一 下我的一些看法。
第一个演讲的是赵石顽，他的演讲内容是 Pharos: Soical map based visual recommender for content-centric website。Pharos是他们去年做的一个项目，这个项目的主要内容是基于挖掘IBM Blog中的用户数据，给用户提供一个全新的浏览web2.0的方式。我们知道，很多web2.0网站都有他们独特的UI，比如delicous, digg，他们的UI设计都比较独到。不过他们的设计大都还是基于传统的网页设计，就是首先有分类，然后分类里面有分类，这样的层次结构。这种结构的缺点 就是不利于用户通过浏览的方式来找到自己感兴趣的东西。所以Pharos是希望提供一种新的浏览方式。他的主要手段，是通过数据挖掘，将用户，博主，关键 字以tag cloud的形式展现出来。当用户进入系统的时候，在首页上就可以看到很多聚类，每个聚类里用不同的颜色来区分了这个聚类的关键词，和主要用户。tag cloud的优点是可以在有限的空间里展示非常大量的信息。 Pharos里面用到的聚类方法主要是基于LDA的，他们用LDA将不同种类的entity（user, keyword, article)来聚类，而每个类里面通过pagerank来确定entity的权重。
第二个演讲的是袁泉，他主要是介绍了graph model。因为我在IBM的前一段时间就是研究Graph Model融合temporal信息的，所以对他的工作比较了解。Graph Model是一个历史非常悠久的模型，他的特点是万金油，什么东西都可以往上面放。不过他的缺点是很难确定不同种类数据的权重，以及边的转移概率。 graph上目前比较常用的都是基于随机游走的ranking算法，这类算法速度非常快。但是，有很多精度高的代数算法，却速度相对比较慢，比如对图的 Laplacian矩阵的分析，就需要借助SVD等等手段，当图的规模大了之后，效率还是有一定的问题。
另外，构图也是一个见仁见智的问题，一般来说构图比较简单，只需要将有关系的东西连在一起就行了，不过边的权重很难确定。另外图的算法大都是非 learning的算法，我个人一直希望提出一种有目标函数的情况下，自己学习边的权重的算法。
最后一个演讲的是张夏天，他主要介绍了对 tag推荐的研究。tag最近是推荐研究的一个热门。他有两个问题，一个是推荐tag，一个是利用tag改 善对item的推荐。不过我对这个方面研究的不是很多。在netflix prize中，我们用过一些类似tag的文本信息，比如电影的演员，导演作为tag。当时起的作用不是很大，这也许和电影的diversity不够大有关 系。不过tag起作用的，个人感觉还是在top-N推荐上，它对rating prediction的影响有限。 tag分布随时间的演化也许是一个值得研究的方面，夏天介绍了前人的tag对后人的影响，可以发现后人打tag非常依赖于前人的tag，所以tag的冷启 动也许是个问题（似乎这个只能通过自然语言理解，来提供了）
总之，非常感激三位的精彩演讲，这一次的演讲比较学术一点，公式稍微多了一点，不过大家如果仔细消化，还是可以获得不少的收获。
]]></description>
			<content:encoded><![CDATA[<p>昨天邀请到了IBM CRL的3位研究人员给resys  group的成员们介绍了他们在推荐系统方面的一些研究成果，首先要感谢Intel社区给我们提供了场地。</p>
<p>因为我最近半年在IBM CRL实习，和 3为researcher在一个组，所以对他们的工作比较了解，所以在这里总结一 下我的一些看法。</p>
<p>第一个演讲的是赵石顽，他的演讲内容是 Pharos: Soical map based visual recommender for content-centric website。Pharos是他们去年做的一个项目，这个项目的主要内容是基于挖掘IBM Blog中的用户数据，给用户提供一个全新的浏览web2.0的方式。我们知道，很多web2.0网站都有他们独特的UI，比如delicous, digg，他们的UI设计都比较独到。不过他们的设计大都还是基于传统的网页设计，就是首先有分类，然后分类里面有分类，这样的层次结构。这种结构的缺点 就是不利于用户通过浏览的方式来找到自己感兴趣的东西。所以Pharos是希望提供一种新的浏览方式。他的主要手段，是通过数据挖掘，将用户，博主，关键 字以tag cloud的形式展现出来。当用户进入系统的时候，在首页上就可以看到很多聚类，每个聚类里用不同的颜色来区分了这个聚类的关键词，和主要用户。tag cloud的优点是可以在有限的空间里展示非常大量的信息。 Pharos里面用到的聚类方法主要是基于LDA的，他们用LDA将不同种类的entity（user, keyword, article)来聚类，而每个类里面通过pagerank来确定entity的权重。</p>
<p>第二个演讲的是袁泉，他主要是介绍了graph model。因为我在IBM的前一段时间就是研究Graph Model融合temporal信息的，所以对他的工作比较了解。Graph Model是一个历史非常悠久的模型，他的特点是万金油，什么东西都可以往上面放。不过他的缺点是很难确定不同种类数据的权重，以及边的转移概率。 graph上目前比较常用的都是基于随机游走的ranking算法，这类算法速度非常快。但是，有很多精度高的代数算法，却速度相对比较慢，比如对图的 Laplacian矩阵的分析，就需要借助SVD等等手段，当图的规模大了之后，效率还是有一定的问题。</p>
<p>另外，构图也是一个见仁见智的问题，一般来说构图比较简单，只需要将有关系的东西连在一起就行了，不过边的权重很难确定。另外图的算法大都是非 learning的算法，我个人一直希望提出一种有目标函数的情况下，自己学习边的权重的算法。</p>
<p>最后一个演讲的是张夏天，他主要介绍了对 tag推荐的研究。tag最近是推荐研究的一个热门。他有两个问题，一个是推荐tag，一个是利用tag改 善对item的推荐。不过我对这个方面研究的不是很多。在netflix prize中，我们用过一些类似tag的文本信息，比如电影的演员，导演作为tag。当时起的作用不是很大，这也许和电影的diversity不够大有关 系。不过tag起作用的，个人感觉还是在top-N推荐上，它对rating prediction的影响有限。 tag分布随时间的演化也许是一个值得研究的方面，夏天介绍了前人的tag对后人的影响，可以发现后人打tag非常依赖于前人的tag，所以tag的冷启 动也许是个问题（似乎这个只能通过自然语言理解，来提供了）</p>
<p>总之，非常感激三位的精彩演讲，这一次的演讲比较学术一点，公式稍微多了一点，不过大家如果仔细消化，还是可以获得不少的收获。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.resyschina.com/2010/03/resys-ibmcrl-xlvector.html/feed</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Call for Paper</title>
		<link>http://www.resyschina.com/2010/03/callforpaper.html</link>
		<comments>http://www.resyschina.com/2010/03/callforpaper.html#comments</comments>
		<pubDate>Thu, 25 Mar 2010 11:36:48 +0000</pubDate>
		<dc:creator>yoyo</dc:creator>
				<category><![CDATA[resysmag]]></category>
		<category><![CDATA[CFP]]></category>

		<guid isPermaLink="false">http://www.resyschina.com/?p=11</guid>
		<description><![CDATA[CFP:1. WI2010 workshop on Web Personalization and Recommender Systems  2.  ACM Recommender Systems 2010]]></description>
			<content:encoded><![CDATA[<h2>1. WI2010 workshop on Web Personalization and Recommender Systems</h2>
<p style="text-align: right;"><a href="http://www.webpres-workshop.com/">http://www.webpres-workshop.com/</a><br />
2010年8月31日， 多伦多</p>
<p>随着网络应用的逐渐普及，信息过载的问题也日趋严重。在网络智能方面，个性化网络和推荐系统是应对信息过载的两个重要技术。个性化网络服务侧重考虑用户个人的兴趣和偏好。推荐系统则是依据用户个人需求推荐网络用户信息和产品。<br />
近几年，个性化网络和推荐系统的相关研究已经取得了一定成就，然后挑战性的问题依然存在，如何使现今的研究取得突破性进展？如何将个性化网络和推荐系统相结合？如何将现有的网络个性化技术和推荐技术商品化？&#8230;&#8230;<br />
针对这些问题，这次研讨会希望参会人员通过交流可以进一步加强在个性化网络和推荐系统方面的研究:</p>
<ul>
<li>交流对网络个性化合推荐系统的过去、现在、未来趋势的看法</li>
<li>从算法、用户接口到评估等方面分享开发有效推荐系统的研究成果和技术</li>
<li>探讨新的、革命性的方法</li>
</ul>
<p>涉及的话题包括：</p>
<ul>
<li>用户行为模型</li>
<li>协同和基于内容的过滤</li>
<li>推荐系统中的聚类</li>
<li>混合推荐系统</li>
<li>推荐系统中的安全和信任</li>
<li>自适应用户接口和个性化技术</li>
<li>议价和拍卖中的推荐系统</li>
<li>推荐系统中的解释和理由</li>
<li>分布式和点对点的推荐系统</li>
<li>社会化媒体站点的推荐应用</li>
<li>社会意识和可视化</li>
<li>个性化本体学习和挖掘</li>
<li>语义网技术</li>
<li>衡量个性化的有效性</li>
<li>推荐系统的评估方法</li>
</ul>
<p>截稿时间:4月16日</p>
<h2>2. ACM Recommender Systems 2010</h2>
<p style="text-align: right;"><a href="http://recsys.acm.org/2010/">http://recsys.acm.org/2010/</a><br />
2010年9月26-30日，巴塞罗那</p>
<p style="text-align: left;">从2006年在美国的明尼阿波利斯举办第一届开始，ACM Recommender Systems逐渐成为推荐系统方向重量级会议之一。和往届会议一样，本届会议也将努力促进产业界和学术界之间的互动，相互分享在推荐系统方面的想法、遇到的问题和解决方案。论文集由ACM集结出版。<br />
推荐系统涉及的内容十分广泛，应用领域从电子商务到社会化网络，涉及平台从互联网到移动网络甚至更广，相关技术种类繁多从协同过滤到基于案例的推理。</p>
<p style="text-align: left;">涉及话题包括：</p>
<ul>
<li>推荐系统实现的案例研究</li>
<li>计算广告学</li>
<li>对话式推荐系统</li>
<li>上下文感知和多维推荐系统</li>
<li>推荐系统的评估</li>
<li>组推荐</li>
<li>实践中推荐的冲击</li>
<li>推荐应用的革新</li>
<li>机器学习和推荐系统</li>
<li>推荐系统的新范式</li>
<li>个性化</li>
<li>推荐算法</li>
<li>社会化网络中的推荐</li>
<li>推荐系统的界面</li>
<li>可扩展性问题</li>
<li>安全、隐私和健壮性</li>
<li>语义网技术</li>
<li>推荐系统原理</li>
<li>用户模型和推荐系统</li>
<li>用户研究</li>
</ul>
<p style="text-align: left;">时间安排：</p>
<ul>
<li>4月16日前 提交论文简介</li>
<li>4月23日前 提交论文全文</li>
</ul>
<p style="text-align: left;">此外，我们注意到在Recsys召开之前，2010年9月20-24日在巴塞罗那还将召开一个相当不错的机器学习、知识发现方面的会议ECML/PKDD 2010 (<a href="http://www.ecmlpkdd2010.org/">http://www.ecmlpkdd2010.org/</a>).这个会议涉及的不少内容与推荐系统是互通的，一次远行参加两个会议，应该是个性价比很高的选择。该会议要求4月23日前提交论文简介，4月30日之前提交论文全文。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.resyschina.com/2010/03/callforpaper.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>KDD Cup2010:教育方面的数据挖掘竞赛</title>
		<link>http://www.resyschina.com/2010/03/kdd-cup2010-educational-dm-challenge.html</link>
		<comments>http://www.resyschina.com/2010/03/kdd-cup2010-educational-dm-challenge.html#comments</comments>
		<pubDate>Thu, 25 Mar 2010 10:12:43 +0000</pubDate>
		<dc:creator>yoyo</dc:creator>
				<category><![CDATA[resysmag]]></category>
		<category><![CDATA[KDDCup]]></category>

		<guid isPermaLink="false">http://www.resyschina.com/?p=32</guid>
		<description><![CDATA[KDD Cup由SIGKDD(ACM Special Interest Group on Knowledge Discovery and Data Mining)组织。每年一次的KDD Cup，和SIGKDD国际会议同期举行。同时面向学术界和产业界。
今年KDD Cup的主要内容是通过智能辅导教学系统和学生交互的日志预测学生数学题的成绩。这次的任务是一次有趣的科技挑战，兼具实践重要性和科学趣味性。]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft" title="KDD Cup2010" src="http://www.kdnuggets.com/images/cup.jpg" alt="" width="154" height="195" /> KDD Cup由SIGKDD(ACM Special Interest Group on Knowledge Discovery and Data Mining)组织。每年一次的KDD Cup，和SIGKDD国际会议同期举行。同时面向学术界和产业界。</p>
<p>今年KDD Cup的主要内容是通过智能辅导教学系统和学生交互的日志预测学生数学题的成绩。这次的任务是一次有趣的科技挑战，兼具实践重要性和科学趣味性。</p>
<p>任务描述：<br />
竞赛开始时，将提供5个数据集：3个开发数据集和2个挑战数据集。每个数据集都被分为训练部分和测试部分。在挑战数据集的测试部分中学生成绩分类将被隐藏起来，但在开发数据集中学生成绩分类都是可见的。竞赛任务要求开发出一种基于挑战/开发数据集的学习模型，使用这种算法通过学习挑战数据集训练部分的数据，可以准确预测学生在测试部分的成绩。竞赛最终的优胜者取决于他们的模型在挑战数据集中一个不可见部分的表现。最终成绩以各队挑战数据集的最后一次提交为准。</p>
<p>时间安排：<br />
3月15日 召集参与者<br />
4月1日  比赛开始<br />
6月1日  比赛结束</p>
<p>更多信息，<a href="https://pslcdatashop.web.cmu.edu/KDDCup/">https://pslcdatashop.web.cmu.edu/KDDCup/</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.resyschina.com/2010/03/kdd-cup2010-educational-dm-challenge.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Resys 第四次线下活动 – IBM CRL 专场</title>
		<link>http://www.resyschina.com/2010/03/resys-ibmcrl.html</link>
		<comments>http://www.resyschina.com/2010/03/resys-ibmcrl.html#comments</comments>
		<pubDate>Thu, 25 Mar 2010 05:39:04 +0000</pubDate>
		<dc:creator>clickstone</dc:creator>
				<category><![CDATA[resysevent]]></category>
		<category><![CDATA[event]]></category>
		<category><![CDATA[ibmcrl]]></category>

		<guid isPermaLink="false">http://www.resyschina.com/?p=25</guid>
		<description><![CDATA[本次活动，非常荣幸地邀请到了 IBM China Research Lab &#8211; User Mining &#38; Personalized Recommendation Team 的三位朋友，前来分享他们的研究心得！
活动时间：2010年3月27日 周六 14:00
活动地点：北京市海淀区中关村科学院南路2号融科资讯中心A座8层英特尔公司
共三个主题，各个精彩！
1. Pharos: Soical map based visual recommender for content-centric website
基于社区地图的可视化推荐 &#8212; 赵石顽
[slideshare id=3645395&#38;doc=pharos-socialmapbasedrecommendationforcontent-centricsocialwebsites-100406002518-phpapp01]
2. Soical Recommender System
社会化推荐 &#8212; 袁泉
[slideshare id=3645396&#38;doc=socialrecommendation-100406002525-phpapp02]
3. Tag-based Recommender System
基于tag的推荐 &#8212; 张夏天
[slideshare id=3645394&#38;doc=tagandtag-basedrecommender-100406002520-phpapp02]

活动总结：

Resys Group 第四次活动总结 (by xlvector)
IBM CRL at Resys Group，活动总结


Update: 相关录音稍后配上，敬请期待。
]]></description>
			<content:encoded><![CDATA[<p>本次活动，非常荣幸地邀请到了 IBM China Research Lab &#8211; User Mining &amp; Personalized Recommendation Team 的三位朋友，前来分享他们的研究心得！</p>
<p>活动时间：2010年3月27日 周六 14:00<br />
活动地点：北京市海淀区中关村科学院南路2号融科资讯中心A座8层英特尔公司</p>
<p>共三个主题，各个精彩！</p>
<p>1. Pharos: Soical map based visual recommender for content-centric website<br />
基于社区地图的可视化推荐 &#8212; 赵石顽<br />
[slideshare id=3645395&amp;doc=pharos-socialmapbasedrecommendationforcontent-centricsocialwebsites-100406002518-phpapp01]</p>
<p>2. Soical Recommender System<br />
社会化推荐 &#8212; 袁泉<br />
[slideshare id=3645396&amp;doc=socialrecommendation-100406002525-phpapp02]</p>
<p>3. Tag-based Recommender System<br />
基于tag的推荐 &#8212; 张夏天<br />
[slideshare id=3645394&amp;doc=tagandtag-basedrecommender-100406002520-phpapp02]</p>
<div style="padding: 5px 0 12px;">
<p><strong>活动总结：</strong></p>
<ol>
<li><a href="Resys Group 第四次活动总结 (by xlvector)" target="_blank">Resys Group 第四次活动总结 (by xlvector)</a></li>
<li><a href="http://www.wentrue.net/blog/?p=865" target="_blank">IBM CRL at Resys Group，活动总结</a></li>
</ol>
</div>
<p><strong>Update: 相关录音稍后配上，敬请期待。</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://www.resyschina.com/2010/03/resys-ibmcrl.html/feed</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>推荐系统五大问题</title>
		<link>http://www.resyschina.com/2010/03/%e6%8e%a8%e8%8d%90%e7%b3%bb%e7%bb%9f%e4%ba%94%e5%a4%a7%e9%97%ae%e9%a2%98.html</link>
		<comments>http://www.resyschina.com/2010/03/%e6%8e%a8%e8%8d%90%e7%b3%bb%e7%bb%9f%e4%ba%94%e5%a4%a7%e9%97%ae%e9%a2%98.html#comments</comments>
		<pubDate>Thu, 18 Mar 2010 07:08:59 +0000</pubDate>
		<dc:creator>gary</dc:creator>
				<category><![CDATA[resysmag]]></category>

		<guid isPermaLink="false">http://www.resyschina.com/?p=18</guid>
		<description><![CDATA[    本文翻译于互联网观察媒体“读写网”在2009年初发布的一篇文章。读写网在2009年初的时候编辑了一系列针对推荐系统的文章，在荷兰阿姆斯特丹举办的一次专门针对推荐系统的兴趣小组会议上，一些公司提出了实施和建设推荐系统需要面对的几个问题，本文针对这些问题，进行了初步的分析。在此与大家分享]]></description>
			<content:encoded><![CDATA[<h2>  本文翻译于互联网观察媒体“读写网”在2009年初发布的一篇<a href="http://www.readwriteweb.com/archives/5_problems_of_recommender_systems.php">文章</a>。</h2>
<h2>        读写网在2009年初的时候编辑了一系列针对推荐系统的文章，在荷兰阿姆斯特丹举办的一次专门针对推荐系统的兴趣小组会议上，一些公司提出了实施和建设推荐系统需要面对的几个问题，本文针对这些问题，进行了初步的分析。在此与大家分享：</h2>
<h2>1. 缺少数据</h2>
<p>对于推荐系统来说，可能最大的问题就是需要大量的数据才能产生推荐结果。这也是为什么那些表现最突出的推荐系统都是来自于有数据的大公司，比如Google，Amazon，Netflix，Last.fm。正如Strands公司在他的演讲中提到的那样，一个好的推荐系统首先要获得内容数据，接着必须获得和分析用户数据（行为事件），最后才是算法的工作。内容和用户数据越多，获得好的推荐的比率就会越高。但是这也是一个“鸡和蛋”的问题——推荐系统的目的就是带来更多的用户点击和购买，而好的推荐系统需要大量的用户，你才能为推荐系统提供需要的数据。</p>
<h2>2. 变化的数据</h2>
<p>这个问题曾经被智能推荐系统公司 Clicktorch CEO Paul Edmunds在以前的文章评论中提到过，Paul 指出推荐系统常常充斥着老的内容，而很难推荐出新的东西。时尚发烧友社区<a href="http://www.stylehop.com/">StyleHop</a> 的David Reinke 在他的<a href="http://www.stylehop.com/blog/2009/01/27/recommender-systems-and-why-fashion-social-shopping-hasnt-worked/">一篇博客</a>中举了一个例子——“流行趋势总是在变化，因此用户的过去行为并不是一个好的工具”。显然纯算法的方式是不太可能跟上流行的趋势的。大多数非时尚认识，我就属于这一类，只信赖那些可信的对时尚很谨慎的朋友和家人的推荐。</p>
<p>David Reinke 要说明的是往往产品中有很多时尚因素，比如肥瘦、价格、颜色、款式、材料、品牌等，对于同一个消费者来说，每个时尚元素在不同的时间都会有不同的重要程度，因此产品的推荐往往会效果不好，他还指出也许“社会化推荐”会解决这个问题。</p>
<h2>3. 变化的用户喜好</h2>
<p>同样也是由 Paul Edmunds提出的一个问题是，今天我们在Amazon上怀着某一特殊目的浏览，而明天我们的目的就会变化。一个经典的例子，某天我在Amazon上为自己找一本书，另一天我有可能会在Amazon上为我的妹妹找一个生日礼物。</p>
<p>另外一个有关用户喜好的话题就是推荐系统有可能会给用户打上错误的标签，比如经典的2002年华尔街日报上的笑话——<a href="http://online.wsj.com/article_email/SB1038261936872356908.html">If TiVo Thinks You Are Gay, Here&#8217;s How to Set It Straight</a>.</p>
<h2>4. 无法预测的事物</h2>
<p>在我们关于Netflix竞赛（由影片在线租赁公司Netflix举办的100万美金的推荐系统竞赛活动）的文章中，曾经提到关于某些“怪异电影”的问题，这些影片用户常常会表现出偏激的喜欢或者讨厌，比如《炸弹头拿破仑》（又名《大人物拿破仑》Napoleon Dynamite）。这些类别的影片很难做出推荐，因为用户的反应是多样化和不可预测的。</p>
<p>在音乐中有很多这样的内容。你能猜出我同时喜欢Metallica和Carpenters的音乐吗？我怀疑Last.fm不太能做出这样的推荐。</p>
<h2>5. 推荐系统是复杂的！</h2>
<p>我们上面只是说了一些表面的现象，Strands公司曾经介绍过，即使实施一个非常简单的推荐系统，也需要许多的变量（我们猜想以下的这些变量恐怕还仅仅是一小部分）。 </p>
<p>迄今为止，只有少数几家公司可以为用户提供高满意的推荐——Amazon，Netflix（他们仍然在寻求对算法的改进），Google也算是一个。尽管只有这么少的成功故事，成百上千的其它网站和应用程序仍在努力探寻着推荐系统的魔法公式——以给他们的用户产生满意的推荐。</p>
<p>事实上，我们在读写网上也非常希望让读者围绕我们的网站产生更多点击，发现其他内容。我们尝试了一些插件和方法，以实现这一点——但我们仍未感到满意。</p>
<h2>我们错过了什么东西？</h2>
<p>在实施推荐系统过程中会遇到很多问题——比如有些仅仅简单了提供“大众化”的推荐；有些不能够形成作古的长尾效应，只能给出一些显而易见的结果；还有的会有异常推荐等问题。随着应用和技术的进步，我们还会发现其它的一些问题。</p>
<h2><strong><em>译者点评：</em></strong></h2>
<p><em>以上提出的</em><em>5</em><em>大问题，在实施个性化推荐服务的过程中，或多或少的都会遇到，但是在不同的类型的网站、不同的内容和用户、不同的实施阶段和不同的目的，所面临问题的严重程度也会不同。</em><em></em></p>
<p><em>对于数据影响推荐质量的问题：为什么有大量数据的公司会做出效果更好的推荐服务，首先</em><em>推荐系统本身需要数据，其次在海量数据引起的信息过载问题更加严重，需求更加迫切。因此推荐系统的作用更加明显。因此，用户数据的绝对数量并不是限制推荐系统实施的门槛，而用户数据的稀疏程度会直接影响推荐的效果。</em><em></em></p>
<p><em>对于内容数据的变化问题：我们大部分人都不是时尚达人——在一般的服装电子商务网站上实施个性化推荐还是可以满足大部分人的需求的。虽然文中举出的例子有些极端，更像是在长尾的尾部。但是对于某些对时间性有要求的内容也还是会面临这样的问题。解决的方法除了对算法本身的选择和改进以外，还需要在产品设计的过程中加入时间因素的条件。</em><em></em></p>
<p><em>对于用户的喜好变化问题：实际上文中提出的例子倒不是喜好的变化，而是目的的变化。因此在进行推荐系统设计时，需要建立更加完整的用户模型。而对于文中的例子，比较好的处理办法是单独设计一个礼物的购物通道，比如</em><em>Amazon</em><em>上的礼物页面：</em><em>http://www.amazon.com/gp/gift-central/</em><em></em></p>
<p><em>推荐系统确实是非常复杂的，不仅涉及文中提出的数据获取的问题，还有对数据的处理，对算法的选择，对参数的优化，产品和服务设计，反馈收集，效果测试和改进，是一个螺旋式上升的过程，它不仅仅是一个或几个推荐服务新的功能开发，而是需要长期维护和改进，需要专业的团队和持续的投入才能完成的工作。</em><em></em></p>
<p><em>实际上效果不错的推荐服务不仅仅包括文中提到的网站，比如 digg, overstock, yahoo, AT&amp;T等一大批网站也在他们的业务中加入了不错的推荐服务。还有国内著名的豆瓣，当当网都有较高用户满意度的推荐产品，所以，请暂时忘了上面的这些问题，Just do it，我们才能克服这些困难。</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.resyschina.com/2010/03/%e6%8e%a8%e8%8d%90%e7%b3%bb%e7%bb%9f%e4%ba%94%e5%a4%a7%e9%97%ae%e9%a2%98.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Early Amazon: The first week</title>
		<link>http://www.resyschina.com/2010/03/early-amazon-1.html</link>
		<comments>http://www.resyschina.com/2010/03/early-amazon-1.html#comments</comments>
		<pubDate>Wed, 10 Mar 2010 14:58:51 +0000</pubDate>
		<dc:creator>clickstone</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[amazon]]></category>

		<guid isPermaLink="false">http://www.resyschina.com/?p=9</guid>
		<description><![CDATA[原文链接：http://glinden.blogspot.com/2006/01/early-amazon-first-week.html
 Greg Linden 毕业于华盛顿大学计算机学院，1997 年加入 Amazon，领导开发了享誉业界的 Amazon 推荐引擎。
 著名的 Item-based 推荐算法的提出者之一；Findory.com 创始人。
 其 Blog &#8211; Geeking with Greg 是个性化推荐领域最有影响力的博客（没有之一）。 

 1997 年初的亚马逊公司，邋遢、混沌、但令人兴奋。

 亚马逊公司位于美国西雅图市，办公室在第二大道的哥伦比亚大厦里，这是一座砖体结构的建筑物，已经有些年头了，离派克市场不远。从办公室的窗户望出去感觉 还不错，有一个本地的美沙酮诊所，还有一个贩卖怪诞假发的商店。你甚至隐约可以看见一些脱衣舞俱乐部，它们就藏在几个街区远的地方。插播八卦：派克市场有一个著名的 Athenian 餐厅，传世经典爱情影片《西雅图夜未眠》中，汤大哥就是在这里泡梅甜心的。
 当然了，我现在还只是一个眨巴着大眼睛的刚刚研究生毕业的菜鸟，还不敢奢望有这样一个靠窗的工位。
 我的工位在厨房。在亚马逊公司，空间从来都是一种奢侈，那个时候自然也是这样。报到的那天，我被领到我的办公室——一张安装在厨房角落里的牌桌，上面放着一台 PC。
 在厨房办公还是着实有些乐趣的。在亚马逊，我几乎什么人都不认识，大多数同事都沉浸在无聊的窃窃私语之中。不过，他们倒经常会到离我不远的柜台上去取茶和咖啡。我弄了一个糖果瓶——嗯，免费的——尽力和他们搞关系，以求套出些什么来。
 我的第一项任务是开始学习代码库。打开一个 shell 窗口，调出 emacs，然后开始阅读代码。我花了一些天来跟踪针对不同 URL 的分发器，研究 ol&#8217; obidos ——一个用来支持 Amazon 网站运转的大型 CGI 程序——是怎样漂亮地处理不同的请求，主页，书籍详情页，搜索，购物车，以及订单流转。至今，大多数亚马逊 URL 里面还包含着“/exec/obidos”。插播八卦：不用为不知道 Obidos 为何物而犯囧，哥只是个传说。这里是正解。

更多精彩文章，请看 Resys China 创刊号。
]]></description>
			<content:encoded><![CDATA[<p>原文链接：<a href="http://glinden.blogspot.com/2006/01/early-amazon-first-week.html" id="w4bh" target="_blank" title="Early Amazon: The first week">http://glinden.blogspot.com/2006/01/early-amazon-first-week.html</a></p>
<blockquote><p> Greg Linden 毕业于华盛顿大学计算机学院，1997 年加入 Amazon，领导开发了享誉业界的 Amazon 推荐引擎。<br />
 著名的 Item-based 推荐算法的提出者之一；Findory.com 创始人。<br />
 其 Blog &#8211; <a href="http://glinden.blogspot.com/" id="aaqq" title="Geeking with Greg">Geeking with Greg</a> 是个性化推荐领域最有影响力的博客（没有之一）。 </p></blockquote>
<p>
 1997 年初的亚马逊公司，邋遢、混沌、但令人兴奋。<br />
<img src="http://docs.google.com/File?id=ddjqwpms_532fxhwfbdt_b" style="float:right;height:358px;margin-left:1em;margin-right:0pt;width:308px"><br />
 亚马逊公司位于美国西雅图市，办公室在第二大道的哥伦比亚大厦里，这是一座砖体结构的建筑物，已经有些年头了，离派克市场不远。从办公室的窗户望出去感觉 还不错，有一个本地的美沙酮诊所，还有一个贩卖怪诞假发的商店。你甚至隐约可以看见一些脱衣舞俱乐部，它们就藏在几个街区远的地方。<i>插播八卦：派克市场有一个著名的 Athenian 餐厅，传世经典爱情影片《西雅图夜未眠》中，汤大哥就是在这里泡梅甜心的。</i></p>
<p> 当然了，我现在还只是一个眨巴着大眼睛的刚刚研究生毕业的菜鸟，还不敢奢望有这样一个靠窗的工位。</p>
<p> 我的工位在厨房。在亚马逊公司，空间从来都是一种奢侈，那个时候自然也是这样。报到的那天，我被领到我的办公室——一张安装在厨房角落里的牌桌，上面放着一台 PC。</p>
<p> 在厨房办公还是着实有些乐趣的。在亚马逊，我几乎什么人都不认识，大多数同事都沉浸在无聊的窃窃私语之中。不过，他们倒经常会到离我不远的柜台上去取茶和咖啡。我弄了一个糖果瓶——嗯，免费的——尽力和他们搞关系，以求套出些什么来。</p>
<p> 我的第一项任务是开始学习代码库。打开一个 shell 窗口，调出 emacs，然后开始阅读代码。我花了一些天来跟踪针对不同 URL 的分发器，研究 ol&#8217; obidos ——一个用来支持 Amazon 网站运转的大型 CGI 程序——是怎样漂亮地处理不同的请求，主页，书籍详情页，搜索，购物车，以及订单流转。至今，大多数亚马逊 URL 里面还包含着“/exec/obidos”。<i>插播八卦：不用为不知道 Obidos 为何物而犯囧，哥只是个<a href="http://discuss.fogcreek.com/joelonsoftware/default.asp?cmd=show&amp;ixPost=48202" id="d3:a" target="_blank" title="What Exactly Are Obidos?">传说</a>。这里是<a href="http://en.wikipedia.org/wiki/Obidos_%28software%29" id="nwk3" target="_blank" title="正解">正解</a>。</i><br />
<br />
更多精彩文章，请看 <a href="http://www.resyschina.com/2010/03/resysmag-1.html">Resys China 创刊号</a>。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.resyschina.com/2010/03/early-amazon-1.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Resys China 创刊号</title>
		<link>http://www.resyschina.com/2010/03/resysmag-1.html</link>
		<comments>http://www.resyschina.com/2010/03/resysmag-1.html#comments</comments>
		<pubDate>Sun, 07 Mar 2010 11:54:02 +0000</pubDate>
		<dc:creator>resyschina</dc:creator>
				<category><![CDATA[resysmag]]></category>

		<guid isPermaLink="false">http://www.resyschina.com/?p=1</guid>
		<description><![CDATA[《Resys China》，是依托于 Resys Group 并专注于推荐系统领域的一份电子杂志。
下面是创刊号的内容目录。

业界新闻
学术动态

Workshop on Social Recommender Systems
Collaborative Filtering Over Time

精品推荐

YouTube&#8217;s Quest to Suggest More
Recommendation Systems: Increasing Profit by Long Tail
推荐系统五大问题

系列连载

Greg Linden，Early Amazon：The First Week

精彩应用

开源推荐框架 DUINE 概览

Resys 精华帖

大家觉得推荐系统和长尾的关系是什么
基于 SNS/Lifestream 的推荐

轻松一下

感谢 yoyo、gary wang及阿稳同学在内容编辑方面的大力协助，感谢百分点科技在 pdf 文件制作方面的鼎力支持。
现在网络阅读越来越倾向于浅阅读，希望这份人工精编的内容能够给大家带来一些思考和收获。
[slideshare id=3358040&#038;doc=resys-100307110414-phpapp02&#038;type=d&#038;w=480]
PDF 可以从这里下载：Resys China 创刊号
]]></description>
			<content:encoded><![CDATA[<p>《Resys China》，是依托于 <a href="https://groups.google.com/group/resys" target="_blank">Resys Group</a> 并专注于推荐系统领域的一份电子杂志。</p>
<p>下面是创刊号的内容目录。</p>
<ol>
<li>业界新闻</li>
<li>学术动态</li>
<ul>
<li>Workshop on Social Recommender Systems</li>
<li>Collaborative Filtering Over Time</li>
</ul>
<li>精品推荐</li>
<ul>
<li>YouTube&#8217;s Quest to Suggest More</li>
<li>Recommendation Systems: Increasing Profit by Long Tail</li>
<li>推荐系统五大问题</li>
</ul>
<li>系列连载</li>
<ul>
<li>Greg Linden，Early Amazon：The First Week</li>
</ul>
<li>精彩应用</li>
<ul>
<li>开源推荐框架 DUINE 概览</li>
</ul>
<li>Resys 精华帖</li>
<ul>
<li>大家觉得推荐系统和长尾的关系是什么</li>
<li>基于 SNS/Lifestream 的推荐</li>
</ul>
<li>轻松一下</li>
</ol>
<p>感谢 <a href="http://twitter.com/gycheng" target="_blank">yoyo</a>、<a href="mailto:gary.wang1009@gmail.com">gary wang</a>及<a href="http://www.wentrue.net/blog/" target="_blank">阿稳</a>同学在内容编辑方面的大力协助，感谢<a href="http://www.baifendian.com/" target="_blank">百分点科技</a>在 pdf 文件制作方面的鼎力支持。<br />
现在网络阅读越来越倾向于浅阅读，希望这份人工精编的内容能够给大家带来一些思考和收获。<br />
[slideshare id=3358040&#038;doc=resys-100307110414-phpapp02&#038;type=d&#038;w=480]<br />
PDF 可以从这里下载：<a href="http://www.slideshare.net/clickstone/resys-china" target="_blank">Resys China 创刊号</a><br /></p>
]]></content:encoded>
			<wfw:commentRss>http://www.resyschina.com/2010/03/resysmag-1.html/feed</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
	</channel>
</rss>
