第二届挑战赛C1-设备维修信息数据挖掘

发布时间:2014-08-27 作者:本站原创 浏览量:1194

    随着市场竞争的日益激烈,维修售后服务成为了企业的重要竞争能力之一。然而由于产品故障的不确定性使得备件需求难于预测,维修备件越来越多使得备件库存维护成本不断增加。这些问题使得维修企业面临的负担加重。因此针对产品的备件需求问题,本文利用某设备生产企业的维修数据记录,基于数据挖掘技术对不同型号的手机常见故障进行分析,从而为公司的设备储藏提供意见。 

    首先,本文对原始维修数据记录进行了简单分析。在对噪声数据和“服务商代码”进行预处理之后,将数据集中的手机维修信息提取出来。接着利用clementine12.0软件分析得知“反映问题描述”属性与手机使用时长、市场级别、服务商所在地区、产品型号相关性较强。 
    其次,为了分析故障与其他属性的关系,本文采用关联规则Apriori和GRI算法分析手机使用时长、产品型号分别与故障之间的关联性。观察关联结果,发现最近买的手机(使用时间低于两个月)主要故障集中在LCD显示故障和网络故障;较早买的手机主要出现开机故障和通话故障。但是GRI算法得出的结果支持度或置信度较低,不具有说服力。所以本文主要利用基于协同过滤的推荐算法来分析反映问题描述属性与其他属性的关联规则,并得出了如下结果:地理位置上相近的地区,其手机常见故障也类似;不同种手机型号或不同地区的手机出现的常见故障都是:开机故障,触屏故障,按键故障和通话故障;在不同级别的市场购买手机,,其经常出现故障的手机的手机型号都是T818,T92,EG906,T912和U8。 
    最后,为了验证推荐算法的可信性,本文对该算法进行质量评价,利用Celmentine将数据分为训练集和测试集,然后进行算法检验。结果表明,推荐算法能够比较准确地得出推荐结果。