1、大数据环境下动车组故障数据挖掘分析技术分析李恒摘 要:动车组故障检修过程中积累大量数据资源,若能将其充分开发,可辅助动车组故障预警、维修工作的高效开展。为此本文分析大数据环境下动车组故障数据挖掘分析技术,通过数据分析挖掘,从中总结故障发生规律及原因,制定故障风险防控方案,实现故障的事前管理。关键词:大数据;动车组故障;数据挖掘引言:国内现役动车组车型较多,加之不同运行环境、运行压力的影响,使动车组故障类型及引发原因趋于复杂化,给故障预防和检修维护工作带来不小难度。大数据背景下,利用数据挖掘分析技术完成动车组故障信息的采集、筛选、分类和挖掘,即可为故障原因确定及预防维修方案制定提供可靠的理论依据
2、,帮助提高故障预防及检修水平,因此有必要对故障数据挖掘分析技术进行分析。一、数据挖掘分析技术(一)数据挖掘的内容数据挖掘主要完成关联分析、聚类分析、数据分类、规律预测、损失模型、偏差分析等任务。其中,关联分析对两个及以上变量间存在的相互影响管理进行分析,常用分析方法包括简单关联、因果关联以及时序关联,影响关联分析结果的主要参数为置信度和支持度。聚类分析将带有相同或类似特征的数据聚集到一起,命名为同一类别,以此来突出不同类别间的差异程度,聚类分析在图像处理、客户分析、模式识别等领域有广泛应用。(二)数据挖掘的步骤第一,数据清洗。数据清洗可剔除动车组故障数据中的噪声数据、冗余数据或无用数据。由于数
3、据来源较广,因此存在一定异常数据不可避免,但这部分数据会对数据挖掘分析结果产生一定干扰,因此在挖掘分析之前需将其剔除1。第二,数据集成。数据集成将不同数据源的数据相互组合,当描述相同概念的属性处于不同数据库中时,其有不同的命名方式,若进行数据集成易引发数据冗余或不一致的现象。数据体系中的冗余数据过多,会给挖掘分析速度带来负面影响,因此需将冗余数据重点清除。第三,数据转换。数据转换将原始数据转变为可被挖掘的形式后进行存储,主要操作步骤为数据格式化,即将原本连续的数据转化为离散型数据,易于符号归纳;或将离散型数据转化为连续型,方便神经网络计算。第四,数据挖掘。该步骤为数据挖掘分析的核心,从数据集或
4、数据体系中挖掘潜在的规律或模式,用以指导实际工作。数据挖掘开展于数据预处理之后,可根据挖掘任务特点选择相适应的数据处理技术。常见的数据挖掘任务有数据特征分析、数据分类、关联性分析等。第五,评估与表现。评估与表现对数据挖掘结果进行评价和筛选,找出最具价值的规律或模模式,经可视化处理后,将最终的结果以知识形式呈现给用户。二、數据环境下动车组故障数据挖掘分析技术(一)故障数据模型设计动车组故障数据模型可大致划分为四个层级:(1)状态信息层。该层级包括故障发生时的动车状态信息,如故障时间、车次、型号、运行区间、运行距离、运行环境等。(2)故障现象层。该层用以描述故障本身的状态,如故障位置、故障形式、发
5、生程度、影响范围、具体描述等。(3)解决方案层。解决方案层可被视为专家库,用以存储动车组常见故障类型、故障诱发原因、常用处理方案等,结合解决方案层的数据,可对动车组实际故障做定性分析,并结合历史数据找到最佳的故障排除方案。(4)故障处理层。该层包括故障处理时间、操作人员、具体措施、处理结果等信息。(二)故障数据库搭建动车组故障数据挖掘分析基于大量准确、有效的故障数据,为方便数据采集和存储,确保故障数据的规范性,需搭建相应的故障数据库,并完成网络配置。数据库系统软件设计可由计算机技术、网络技术、数据库技术完成。考虑到铁路系统现有资源配置情况及数据库搭建效率,以 OA 网作为数据库运行网络平台,动
6、车组故障数据库系统架构包括 OA 网络、数据库服务器、Web 服务器、挖掘分析终端、用户端等模块。故障数据库在 VisualStudio2008 环境下开发,使用 B/S 架构,并以 C#为编程语言,硬件服务器和软件服务器分别为 DELL_R720 PC 和 Windows Server 2008 R2 Standard。(三)数据库功能实现动车组故障数据库包含如下功能模块:(1)数据录入:完成动车组故障表单的填写、上传及故障数据的批量化导入;表单中部分信息为选择式填入,以确保录入数据、名称的规范性;从动车组上下载的故障数据在批量化导入之前,需对其进行筛选,清除操作提示、状态提醒等与动车故障无
7、关的数据。(2)信息查询:提供多条件组合查询方式。(3)故障统计:包括时间、里程和车型三种统计标准。(4)故障跟踪:跟踪对象为待处理故障和运行观察故障。(5)故障分析:分为车载故障、远程故障数据分析和部件平均寿命计算2。(6)标准数据:该模块可实现用户权限管理、故障模式配置、计算参数设定等功能。(四)成果检验将动车组故障数据挖掘分析技术应用至某铁路局 CRH1A 型动车组的故障分析工作中,采集其在 2018 年 912 月的故障数据信息,发现其在 12 月运行里程达到 320360 万公里时,发生转向架故障的概率要更高,该结果与动车组故障处理经验判断结果保持一致。经检测验证,该动车组转向架的齿轮箱、轴向轴承等节点度过高,因此建议在日常维修保养中,加强节点处零部件的检查。三、结论大数据时代,动车组故障分析、处理的信息化水平显著提高,借助数据挖掘分析技术,可有效降低动车组故障处理的难度和时间成本,同时强化故障风险的可预见、可预防性,确保动车组安全、高效运行。参考文献:1黄凌云.大数据环境下动车组故障数据挖掘分析技术研究D.中国铁道科学研究院,2019.2何腾翔.Flink 平台下 Eclat 算法的研究及在动车组故障关联关系挖掘中的应用D.北京交通大学,2019.