10.3963/j.issn.1674-4861.2018.03.002
基于文本挖掘的内河船舶碰撞事故致因因素分析与风险预测
作为一种典型的高风险海事事故,内河船舶碰撞事故致因因素众多.为了明确内河船舶碰撞事故致因因素,分析内河船舶碰撞风险,选取2013年至2017年长江内河航道419起船舶碰撞事故报告作为文本挖掘语料,将语料库中的人为因素、船舶因素、自然环境因素以及管理因素作为目标数据,利用R语言和文本挖掘方法,获得包含特征值和特征值权重属性的高维稀疏的原始特征向量空间集合,对tf-idf公式进行平滑改进,解决了文本识别过程中无法识别统计较为生僻的专业名词的问题,提升了文本挖掘方法在交通运输领域的适应性.使用统计对其进行降维,获得最终33个维度的文本特征项,确定了船舶碰撞风险致因因素.通过实验验证了文本挖掘得出的船舶碰撞致因因素置信率达到了81%.以碰撞过程中的4个步骤为主线,构建基于"人-船-环境-管理"系统的船舶碰撞风险贝叶斯网络结构,计算贝叶斯网络结构中各节点的条件概率表,进行船舶碰撞风险建模.结合贝叶斯网络实现内河船舶碰撞事故的风险预测,并通过反向推理确定了人为因素是船舶碰撞事故致因中的首要因素.
交通安全、内河船舶碰撞、R语言、文本挖掘、贝叶斯网络、风险预测
36
U694(水路运输技术管理)
国家重点研发计划课题2017YFC0804900,2017YFC0804904
2018-08-21(万方平台首次上网日期,不代表论文的发表时间)
共11页
8-18