第十一届挑战赛C2-基于迁移学习与集成学习的招聘与求职双向推荐系统

发布时间:2023-09-01 作者:本站原创 浏览量:1797

摘要:

本文基于LDA 主题生成模型与K-modes 算法,构建了招聘信息画像和求职者画像;依据岗位胜任力模型公式分别构建岗位匹配度与求职者满意度模型;基于迁移学习与集成学习模型构建排序模型,最终通过贪心策略实现招聘与求职双向推荐。

针对问题一,本文使用爬虫算法爬取泰迪内推网站的找工作和找人才页面,并将招聘者和岗位的相关信息进行了数据清洗和预处理,使其变为结构化数据,存储在CSV 文件中。

针对问题二,应用问题一结果信息,针对不同特征,从多个方向建立招聘信息画像与求职者画像。使用LDA 主题生成模型对招聘信息、求职者自我介绍进行主题词生成,得到其主题关键词。通过K-modes 聚类算法,分别对招聘信息、求职者进行聚类,得到每个类别的代表性特征,即分类后的整体画像。

针对问题三,本文基于岗位胜任力模型公式,分别构建岗位匹配度模型和求职者满意度模型,从多维度对求职者或招聘岗位进行评估,得到求职者与招聘岗位间的匹配度和满意度。

针对问题四,分为两部分进行求解,首先基于迁移学习在公开数据集上对模型进行训练,选出最好的模型LightGBM 后,基于其预测分数获得求职者推荐排序序列。分别通过三种贪心策略,选择推荐序列中能够最优化履约率的求职者进行推荐,求职者选择接受最高满意度岗位的offer。通过对比实验,使用考虑offer 数量的贪心策略能够得到最接近于最佳结果的履约率,其与本数据集履约率极限值的比值为0.7802997。

关键词:双向推荐系统;人岗匹配;迁移学习;LightGBM;集成学习;贪婪策略

点击查看全文