第二届挑战赛F2-基于项目和用户双重聚类的协同过滤推荐系统

发布时间:2014-08-27 作者:BdRaces 浏览量:1351

随着互联网技术的迅猛发展,人们逐渐走入了信息过载的时代。面对大量的信息,我们都显得有些无所适从。作为信息需求者,从大量信息中找到自己感兴趣的信息往往是一件非常困难的事情;而对于信息提供者,让自己的信息脱颖而出,受到大家的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统通过建立用户和信息产品之间的关系,利用已有的选择过程或相似性关系,一方面挖掘用户潜在感兴趣的信息,另一方面让信息能够展现在对它感兴趣的用户面前。协同过滤技术是目前推荐系统中应用最早和最为成功的技术之一,其发展面临着两个三个主要挑战:提高协同过滤算法的可扩展性;降低推荐系统数据集的稀疏性;提高推荐质量。针对这些问题本文提出一个改进的协同过滤算法——基于用户和项目双重聚类的协同过滤推荐算法。利用评分数据稀疏差异度和项目类别构造集合差异度度量公式,用以在用户-项目评分矩阵上进行项目聚类,解决了协同过滤推荐算法在面临高维数据稀疏特征时推荐效果差的难题;同时采用经典的K-means聚类方法对用户进行聚类,具有简单快速适于处理大数据的优点,省去了规范化处理。实验结果表明,此算法拥有基于用户聚类的协同过滤算法和基于项目聚类的协同过滤算法的优点,并摒弃了其缺点。

阅读全文