第三届技能赛A-教育平台的线上课程智能策略推荐

发布时间:2020-12-31 作者:本站原创 浏览量:9552

摘要:

近年来,随着互联网与通信技术的高速发展,学习资源共享与建设呈现出新的发展趋势,多样化的线上教育平台如雨后春笋般争相涌入大众视野。尤其是在今年年初,受新冠肺炎疫情的冲击下,学生返校进行线下授课收到严重阻碍,由此,网络线上平台由此成为“互联网+教育”成果的重要发展领地,如何根据教育平台把握用户信息,掌握用户课程偏好并提供精准的远程课程推荐服务成为了线上教育的热点话题。因此,利用数据分析技术对教育平台的线上信息和用户学习信息进行研究具有重大意义。

针对任务一,对所给数据集进行缺失值、异常值、重复值等方面的处理。首先利用python对数据进行初步的描述性统计分析,使用pandas中的info函数进行缺失值计数,对不同的数据缺失情况采用不同的处理方式。其次,在填补缺失值的基础上对数据集进行异常值处理,对于重要性较高的数据,结合上下数据

或者其余数据进行填补处理。进一步地,对于重要性相对较低,或者对实际分析过程产生的影响较小的数据进行删除处理。最后,使用pandas 中的drop_duplicates函数,对于每一行中完全相同的数据进行删除处理,删除重复项。

针对任务二,首先,对该教育平台用户进行海外和国内使用情况分布分析,重点对中国内所有省市地区进行数量统计,并利用python对全国各个省份的用户数量分布绘制热力图,进一步对重点省份用户分布情况进行分析。其次,根据日期信息和国务院各年份法定节假日文件,对工作日和非工作日进行区分处理,统计24小时各个时段的用户活跃度并进行具体整体分析,绘制相应的柱形图实现对该教育平台用户进行活跃度分析。最后,通过查询相关文献给出用户流失概念,计算用户流失率并对未流失客户流失风险等级进行分类。最终结合上述用户分布、用户活跃度以及用户流失率分析,为该教育平台提供线上管理决策建议。

针对任务三,首先根据用户参与学习的记录,对每门课程的参与人数进行统计并计算出每门课程的受欢迎程度。其次根据相关数据,选出用户ID和课程列,进行用户-课程关系表的排布,并基于物品的协同过滤算法计算课程间相似情况,并对总学习进度最高的五名用户推荐相似的课程。最后对课程收费差异与用户学习进度进行相关性分析,并在此基础上给出线上课程的综合推荐策略。

点击查看原文