第六届挑战赛B2-基于协同过滤的电视产品个性化推荐

发布时间:2018-11-15 作者:BdRaces 浏览量:1480

摘 要:

本文使用基于协同过滤的算法处理用户观看节目的数据,一共解决了两个问题:1、为用户推荐新的电视节目;2、对用户进行画像分析,为用户打上个性化标签。

对于问题1,首先,本文根据收视和回看的历史信息对数据进行预处理,通过删去观看时间不足5分钟的信息,得到每个用户对每个频道的观看时间占比及观看频率。其次,通过将用户观看频率与观看时间按一定权重进行整理,用基于用户的协同过滤算法(userCF),计算出用户相似度矩阵。接着,根据用户点播信息,计算得到节目点播金额占比、观看时间占比及观看频率,同样按一定权重进 行整理,得到点播用户总频率,通过基于物品的协同过滤算法(itemCF),计算节目相似度矩阵。然后利用节目的相似度和用户的历史收视数据,给点播用户生成推荐列表(见表8);根据用户相似度矩阵与点播用户总频率,生成未点播用户 推荐列表(见表9);整合点播与未点播用户推荐表。运用同样的方法整理附件2的电视产品数据。最后,整合附件1与附件2的推荐表,得到用户推荐节目清单(见表10)。

对于问题 2,首先,根据节目类型和适宜人群构建附件2中的产品标签体系(见表12)。其次利用入网时间、观看节目及观看时间,构建用户标签体系(见表17)。然后,建立标签编号,为电视产品信息进行标签编号,得到产品数据标签,进而得到已标签用户推荐表。最后,结合用户相似度矩阵,计算未标签用户的标签推荐列表,最终整合得到用户数据标签及用户推荐标签(见表22)。


关键词:协同过滤;userCF 算法;itemCF 算法;用户画像;电视产品推荐


阅读全文