A. 推荐算法的基于协同过滤的推荐
基于协同过滤的推荐算法理论上可以推荐世界上的任何一种东西。图片、音乐、样样可以。 协同过滤算法主要是通过对未评分项进行评分 预测来实现的。不同的协同过滤之间也有很大的不同。
基于用户的协同过滤算法: 基于一个这样的假设“跟你喜好相似的人喜欢的东西你也很有可能喜欢。”所以基于用户的协同过滤主要的任务就是找出用户的最近邻居,从而根据最近邻 居的喜好做出未知项的评分预测。这种算法主要分为3个步骤:
一,用户评分。可以分为显性评分和隐形评分两种。显性评分就是直接给项目评分(例如给网络里的用户评分),隐形评分就是通过评价或是购买的行为给项目评分 (例如在有啊购买了什么东西)。
二,寻找最近邻居。这一步就是寻找与你距离最近的用户,测算距离一般采用以下三种算法:1.皮尔森相关系数。2.余弦相似性。3调整余弦相似性。调整余弦 相似性似乎效果会好一些。
三,推荐。产生了最近邻居集合后,就根据这个集合对未知项进行评分预测。把评分最高的N个项推荐给用户。 这种算法存在性能上的瓶颈,当用户数越来越多的时候,寻找最近邻居的复杂度也会大幅度的增长。
因而这种算法无法满足及时推荐的要求。基于项的协同过滤解决了这个问题。 基于项的协同过滤算法 根基于用户的算法相似,只不过第二步改为计算项之间的相似度。由于项之间的相似度比较稳定可以在线下进行,所以解决了基于用户的协同过滤算法存在的性能瓶颈。
B. 协同过滤推荐系统的应用领域有哪些
豆瓣,amazon,淘宝,当当等网站都在用,豆瓣的猜你喜欢,音乐推荐,书籍推荐什么的都是,推荐你看看两篇文章,探索推荐引擎内部的秘密,第1 部分: 推荐引擎初探 探索推荐引擎内部的秘密,第2 部分: 深入推荐引擎相关算法- 协同过滤,看完就基本了解了,http://www.ibm.com/search/csass/search/?sn=dw&lang=zh&cc=CN&en=utf&hpp=20&dws=cndw&lo=zh&q=%E6%8E%A2%E7%B4%A2%E6%8E%A8%E8%8D%90%E5%BC%95%E6%93%8E%E5%86%85%E9%83%A8%E7%9A%84%E7%A7%98%E5%AF%86
C. 求推荐推荐引擎 协同过滤方面的书
技术角度可以看《mahout in action》 商业角度可以看《个性化:商业的未来》
D. 协同过滤推荐算法产生推荐结果要多久
这种抄形式一般可以按袭推荐引擎的算法分,主要有基于协同过滤、基于内容推荐等算法。 “买过此商品的人,百分之多少还买过其他啥啥商品”:协同过滤item-based filtering “和你兴趣相似的人,还买过其他啥啥商品”:协同过滤 user-based filtering “相关商品推荐”:基于内容推荐content-based “猜你喜欢” 一般混合使用推荐算法。
E. 利用协同过滤算法为用户推荐商品的方法有哪些
协同过滤(Collaborative Filtering)的基本复概念就是制把这种推荐方式变成自动化的流程
协同过滤主要是以属性或兴趣相近的用户经验与建议作为提供个性化推荐的基础。透过协同过滤,有助于搜集具有类似偏好或属性的用户,并将其意见提供给同一集群中的用户作为参考,以满足人们通常在决策之前参考他人意见的心态。
本人认为,协同过滤技术应包括如下几方面:(1)一种比对和搜集每个用户兴趣偏好的过程;(2)它需要许多用户的信息去预测个人的兴趣偏好;(3)通过对用户之间兴趣偏好相关程度的统计去发展建议那些有相同兴趣偏好的用户。
F. 大数据进行kmeans聚类在hadoop2上怎么实现
k-means聚类不就是初始时抄,袭随机选取k个中心点,计算与其他点的距离,一次迭代完毕后,计算每个聚类中的中心点(也就是聚类中点的平均值)作为下次迭代的中心点,反复多次迭代直到达到迭代次数上限,或者达到迭代的效果(距离最短)。maprece实现的话就是:map函数计算每个点到中心点的距离,选择距离每个点最近的中心点,然后输出键值对<中心点,聚类中点的集合>,rece函数计算每个聚类的点的距离均值,并把它作为下次迭代的中心点。反复进行map和rece就是相当于反复迭代。望采纳!谢谢!
G. 协同过滤,基于内容推荐有什么区别
举个简单的小例子,我们已知道
用户u1喜欢的电影是A,B,C
用户u2喜欢的电影是A, C, E, F
用户u3喜欢的电影是B,D
我们需要解决的问题是:决定对u1是不是应该推荐F这部电影
基于内容的做法:要分析F的特征和u1所喜欢的A、B、C的特征,需要知道的信息是A(战争片),B(战争片),C(剧情片),如果F(战争片),那么F很大程度上可以推荐给u1,这是基于内容的做法,你需要对item进行特征建立和建模。
协同过滤的办法:那么你完全可以忽略item的建模,因为这种办法的决策是依赖user和item之间的关系,也就是这里的用户和电影之间的关系。我们不再需要知道ABCF哪些是战争片,哪些是剧情片,我们只需要知道用户u1和u2按照item向量表示,他们的相似度比较高,那么我们可以把u2所喜欢的F这部影片推荐给u1。
根据数据源的不同推荐引擎可以分为三类
1、基于人口的统计学推荐(Demographic-based Recommendation)
2、基于内容的推荐(Content-based Recommendation)
3、基于协同过滤的推荐(Collaborative Filtering-based Recommendation)
基于内容的推荐:
根据物品或内容的元数据,发现物品或内容的相关性,然后基于用户以前的喜好记录推荐给用户相似的物品
基于内容推荐的一个典型的例子,电影推荐系统,首先我们需要对电影的元数据有一个建模,这里只简单的描述了一下电影的类型;然后通过电影的元数据发现电影间的相似度,因为类型都是“爱情,浪漫”电影 A 和 C 被认为是相似的电影(当然,只根据类型是不够的,要得到更好的推荐,我们还可以考虑电影的导演,演员等等);最后实现推荐,对于用户 A,他喜欢看电影 A,那么系统就可以给他推荐类似的电影 C。
H. 基于用户的协同过滤推荐怎么计算出响应时间
高手解答!着急帮你做.
I. mahout 有基于用户的协同过滤算法的hadoop实现吗
mahout 有基于用户的协同过滤算法的hadoop实现经验丰富 体制程序健全,ok ,原创/
J. 协同过滤 推荐怎么处理原始数据集
以对原始的评分数据集进行变换,用评分值相对于平均评分值的偏差取代原始值,如...基于物品过滤的数据预处理 Amazon.com采用物品间