赛题A

发布时间:2020-11-13 作者:本站原创 浏览量:296

一、背景

近年来,随着互联网与通信技术的高速发展,学习资源的建设与共享呈现出新的发展趋势,各种网课、慕课、直播课等层出不穷,各种在线教育平台和学习应用纷纷涌现。尤其是2020年春季学期,受新冠疫情影响,在教育部“停课不停学”的要求下,网络平台成为“互联网+教育”成果的重要展示阵地。因此,如何根据教育平台的线上用户信息和学习信息,通过数据分析为教育平台和用户提供精准的课程推荐服务就成为线上教育的热点问题。

本赛题提供了某教育平台近两年的运营数据,希望参赛者根据这些数据,为平台制定综合的线上课程推荐策略,以便更好地服务线上用户。

二、目标

1. 分析平台用户的活跃情况,计算用户的流失率。

2. 分析线上课程的受欢迎程度,构建课程智能推荐模型,为教育平台的线上推荐服务提供策略。

点击下载赛题及数据(提取码:2020)

关于竞赛成果提交说明

1. 登录方式

    请使用队员1的账号登录数睿思,进入第三届技能大赛页面。为保证成功提交,请使用谷歌浏览器无痕模式。

2. 报告提交

    报告以PDF格式提交,文件名为“report.pdf”。要求逻辑清晰、条理分明,内容包括每个任务的完成思路、操作步骤、必要的中间过程、任务的结果及分析。针对各子任务,报告中应包含但不限于如下要点:

    (1) 任务1.1 应包含每个表中缺失值和重复值的记录数以及有效数据的记录数。

    (2) 任务1.2 应包含recently_logged字段的“--”值的记录数以及数据处理的方法。

    (3) 任务2.1 应包含各省份与各城市的热力地图以及主要省份和主要城市的数据表格,并进行分析。

    (4) 任务2.2 应包含工作日与非工作日各时段的柱状图,并进行分析。

    (5) 任务2.3 应包含对流失率的定义,并给出流失率的结果。

    (6) 任务2.4 应根据计算结果给出合理的建议。

    (7) 任务3.1 应包含最受欢迎的前10门课程的参与人数、受欢迎程度及柱状图。

    (8) 任务3.2 应包含相应推荐算法的描述,并给出总学习进度最高的5个用户的课程推荐数据。

    (9) 任务3.3 应包含数据分析的方法、算法描述以及主要结果。

3. 附件提交

    3.1 如使用编程实现,将任务1、2、3的源程序分别保存到“program1”,“program2”,“program3”文件夹,然后存放到“program”文件夹中;如使用TipDM大数据挖掘建模平台实现,将使用平台建立的工程截图保存到“program”文件夹中。

    3.2 将任务1、2、3所产生的结果文件,分别保存到“result1”,“result2”,“result3”文件夹,然后存放到“result”文件夹中。

    3.3 将“program”、“result”及报告的word版本打包成文档“appendix.zip”作为附件提交。

4. 提交界面

    4.1 在依次上传完“竞赛承诺书”、“作品”、“附件”后,点击“提交”。

 A1.png

    4.2 待页面弹出“上传成功”对话框,点击“确定”,在相应位置可以看到“已上传XXX”字样,表示相关文件提交成功。

 A2.png

    4.3 在比赛当天20:00竞赛成果截止提交之前,可多次上传相关文件,系统默认以最后上传的文件为准。