摘要:
评价车辆行驶安全性的方式多种多样,其中,通过对行车数据进行采集并做出分析处理是一种常见且有效的手段。
通过各类电子传感器采集到的车辆数据,蕴含着大量值得挖掘的信息,能够对人们分析判断车辆是否在行驶过程中存在安全隐患,提供有力的数据支撑。但是,由于电子设备本身的局限性,采集到的数据往往存在着价值密度低、蕴含大量噪声和异常的问题,要想提取出有价值的信息,需要我们对数据进行严谨的处理和科学的分析。
针对题目中的具体问题,我们从以下4个方面构建行车安全性多属性综合评价方法:
1.多角度对车辆的行驶数据进行分析与预处理(包括属性缺失值的处理以及异常值的处理),并从处理后的数据中提取出有用的信息,包括车辆的行驶速度和加速度、行驶里程、行驶路线等,同时将规定的十辆数据的每条路线图、平均速度以及急加速和急减速情况汇总到了数据的附件1。
2.针对问题二,我们首先在充分分析附件1数据的基础上,对每种不良驾驶行为首先构建判断模型,其次,对提取的结果分析,最后,与诸如百度地图等比较成熟的软件结果对比分析来验证判断方法的有效性,总共提出了劳驾驶、超速、急加速、急减速、怠速预热、超长怠速、熄火滑行、急变道等7种不良驾驶行为特征,在对7种评价指标进行了相关性分析的基础之上,最终形成了反映车辆行车安全性的7种评价指标,详细数据我们汇总到了数据的附件2.
3.针对问题二,评价模型的构建,首先,分别采用主客观的方法为评价指标赋予权重,在此基础之上,通过最小二乘法对两种权重进行融合,形成兼顾专家意见与客观数据因素的评价指标权重;其次,根据理想逼近解法TOPSIS法对评价模型进行构建,并在真实数据上对研究对象进行安全等级排序;最后,我们通过K-means对数据进行粗略地二分类,将TOPSIS标记与粗略二分类的标记进行对比,选出标记相同的数据作为标注数据,训练二叉决策树评价模型,利用训练好的模型再对不确定数据进行评价,最终以投票的方式将不确定的数据进行安全性评价,详细评价结果数据具体请参看我们数据的附件3.
4.针对问题三,在我们已经构建好了描述车辆不良驾驶的七种行为特征。在此基础之上,我们综合分析附件2给出的自然气象数据以及自己额外获取的关于车辆路线的道路状况数据,同时构建了行车天气环境指标以及道路状况指标,一共12个特征,从行车安全、节能、效率的角度分析,综合考虑行车安全、效率和节能,给出了一个行车安全的综合评价指标体系。为了反映各种指标之间相互影响影响,我们采用网络层次分析的结果,由指标的全局权重可以看出,疲劳驾驶、超速、急变速、急变道、天气类别这五个指标是评价指标体系中占权重最大的五个指标,这也与我们的主观感觉相符。而对于安全、节能、效率这三个方面,根据指标的综合权重结果可以看出,我们给出的这个综合评价指标体系,关注的程度最大的还是行车安全,然后是节能,最后才是效率。
关键词:特征提取、AHP、ANP、熵权法、TOPSIS、决策树、k-means