第一届太普华南杯数据挖掘竞赛


试题说明:1、参赛选手可从下述试题中任选一题作答,并在论文报告中标明
2、论文等级会综合考虑论文质量和难度系数


试题一 航空客运信息挖掘(难度系数:1.0)
很多人都听说过马来西亚的亚洲航空、美国的西南航空等公司的大名。这些公司成功的秘诀就是擅于提高上座率。为了争到客源,有些公司甚至提出了与长途巴士进行价格竞争的口号。如此看来,国内航空公司并不是把其它航空公司当作主要竞争对象,主要对手应当是火车或长途汽车。适当的低票价,将使航空资源得到充分利用,如果空座率居高不下,哪怕票价卖得很高,本身就已经出现了资源性亏损。
本例就是期望从航空公司感兴趣的主题,例如流失预测、客户细分和客户价值评估等方面,通过数据挖掘技术,实现提升航空客运的上座率目标。
附件数据集来自国内某航空公司的会员数据,共有62988个样本,每个样本有63个属性,各属性说明见“变量含义”Sheet页。除了每个客户的基本资料外,该数据集还包含了一个观测窗(2年)内8个季度的用户飞行数据,包括乘机次数、里程、积分等。参赛者可尽量使用任何的数据挖掘技术来发现尽可能多的知识,建议的数据挖掘主题包括但不限于建立客户流失模型、客户细分和客户价值评估。


试题一数据下载:试题一数据集(提取码:avfk)


试题二 道路缺陷自动识别(难度系数:1.0)
城市道路是城市建设的主要项目之一,工程建设涉及面较广,工程条件较复杂,是由多项目、多工序彼此交错和相互制约所组成的线形工程,影响工程质量的因素较多,施工中不可避免地会出现不同程度的质量问题,表 1列出了主要的道路缺陷类型,如龟裂,裂痕,网裂,坑槽,剥落等,详细图像数据见附件。请采用图像处理技术,对不同缺陷类型进行特征提取,并采用数据挖掘技术进行模式识别,实现不同道路缺陷类型的自动识别。

表一.jpg


试题二数据下载:试题二道路缺陷图像(提取码:v302)



试题三 肝癌手术治疗效果评价(难度系数:0.7)
选取某医院10年来肝癌病例总共4860例,每个病例有病人近80个信息,其中包括患者病历号、性别、年龄、学历、职业、住址、基本病史、临床体征、恶性肿瘤分类、实验室检验指标、影像学检查等,经过数据预处理,选取其中20个有代表性的样本,选取对预后有影响的l0个指标如表2。

表二.jpg

各指标项说明见表3。

表三.jpg

请以预后影响作为评价标准,建立数据挖掘模型,对手术的治疗效果和方案的优劣进行预测,为病人规划最佳的手术和治疗方案。


试题三数据下载:试题三数据集(提取码:dv7t)

     本届大赛吸引了全国近二十所高等院校相关专业的学生参加,比赛于2013年3月9日正式开始,2013年4月21日参赛者提交作品,竞赛结束。大赛总共收到56份优秀数据挖掘论文,经过广州泰迪智能科技技术有限公司、华南师范大学历时半月的评审,最后决出特等奖作品一份、一等奖作品三份、二等奖作品三份、三等奖作品五份、优秀论文奖作品十六份、成功入围奖作品十九份。评奖结果考虑到了不同题目的难度系数。由于研究生队伍的论文质量普遍高于本科生队伍,特等奖及一、二、三等奖中,论文质量接近的,本科生队伍排名在前。

 
获奖者名单:

特等奖(一队)

林昂、骆其伦(华南师范大学)

一等奖(三队) 

余燕团(湖南师范大学)
陈建林、肖宇,吴晓声(华南师范大学)
陈豪、张雄机(华南师范大学)

二等奖(三队)

陈福明、孙文翔、云伟标(中山大学)
程裕、蔡少真、李伟东(华南理工大学)
王军晓、周雨来、丁铖(大连海事大学)

三等奖(五队)

郑梓豪、卓梓烨(华南师范大学)
李银城、李燕珊(华南师范大学)
彭晨枫、李立宇(汕头大学)
黄楚云、张洪璇、唐梓桓(华南师范大学)
郭骁、张会、李婷(西北大学)

优秀论文奖  16组

蔡健威、莫朗星、李德惠(华南师范大学)
陈昭(福建中医药大学)
冯昭凯、李玉婷、徐惠欣(华南师范大学)
公荣涛、王旭、陈明艳(华南理工大学)
黄莉莉、陈彦、郑泽鹏(华南师范大学)
李立宇、孟迪(汕头大学)
李茜、马俐、张棋(西北大学)
李智(厦门大学)
林惠洁、陆要桂、许童舟(华南师范大学)
林瑾怡、吴舒、马丽璇(广东技术师范学院)
沈鹏、蔡陈炯、邓松华(华南师范大学)
沈秀琴、杨舒舒、谢晓东(华南师范大学)
王枝宁、杨燕生、黄梓博(韩山师范学院)
纪东升、杨瑞阳、王小平(兰州大学)
张龙、周汉海、雷鹏(兰州大学)
郑贵生、翟振威、吴迪(华南师范大学)

成功入围奖  20组

程艺林、陈茜、王璞玉(西北大学)
范丹、高斯远、陈晓宇(西北大学)
符泽厚、刘佳、吴鹏(西北大学)
李强、赵培源(西北大学)
李少华、李丽熠、王梓(西北大学)
李学峰、董晶晶、刘文霞(西北大学)
林晓丽、姚春玲、黄晓灵(华南师范大学)
林振清、罗细兰、林春梅(广东技术师范学院)
刘茜、索航、文都静(西北大学)
刘阳、马敏、许鸿(兰州大学)
裴家欢、奚圆圆、张欢(大连海事大学)
魏晓玲、肖海群、李广涛(广东技术师范学院)
徐京、蒋胜、(安徽工程大学)
许文杰(佳都新太科技股份有限公司)
姚三朵、王瑶、鱼欣(西北大学)
易发宝(湖北民族学院)
尹彩霞(鲁东大学)
张婕、黄诚鹏 李逸群(西北大学)
朱芳(重庆大学)
王珂、李航、窦浩桢(郑州大学)
魏弘平(广东石油化工学院)

  • 2013-04-18 17:52:42,本站原创
    为了在高校中推广数据挖掘的教学和实践,在企业中推广数据挖掘的创新和应用,加强校企交流互动和信息共享,提升高校的教学质量和企业的竞争能力,华南师范大学数学科学学院联合广州泰迪智能科技有限公司发起了第一届泰迪华南杯数据挖掘竞赛,为相关专业学生提供一个将理论知识与数据挖掘实践相结合的研究探索平台,为中国数据挖掘人才培养献出自己的一份力量。
  • 2013-03-06 10:02:26,本站原创
    1、网上报名的资料是否允许修改?2、是否允许以个人名义参赛?3、论文如何提交?此常见问题列表会持续更新,如有未提及问题,可通过QQ群 295026770 咨询老师。
  • 2013-02-25 20:35:54,本站原创
    报名时间:2013年2月20日------2013年3月8日;比赛指导:2013年3月9日------2013年3月22日;比赛时间:2013年3月9日------2013年4月21日;网评时间:2013年4月21日------2013年4月28日;终审时间:2013年4月29日------2013年5月5日