10.3778/j.issn.1002-8331.2010-0269
交通行业事故文本数据的可视化挖掘分析方法
为降低交通行业安全生产风险,深入分析以文本形态隐式存在于事故数据中的时空特征及潜在致因,在用户字典模式对文本数据分词的基础上,使用Word2vec结合Sigmoid激活函数,构建交通安全事故词向量模型,对交通行业安全事故关键词进行分类提取,获得分别包含特征及致因属性的两类关键词,并利用Gephi及Neo4j对特征关键词进行可视化分析以及致因主题总结,对事故时空特征及致因关键因素进行深入挖掘.以北京市为例研究发现:交通安全事故主要集中发生在第三季度,且城六区在事故总量上远高于外环城区,但伤亡比例外环城区较高;通过致因关键词总结,发现人为、设备及环境因素是交通安全事故的主要致因因素;结合以上分析结果,提出合理建议,为北京市交通行业安全生产相关管理部门提供信息支持和科学指导.
文本数据;交通安全事故;词向量;关键词分类提取;可视化分析
57
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金青年项目;北京市自然科学基金;北京建筑大学研究生创新项目
2021-11-15(万方平台首次上网日期,不代表论文的发表时间)
共7页
116-122