10.3969/j.issn.1674-5698.2012.02.019
基于组织机构代码信息进行数据挖掘与属性关联分析的方法初探
本文以涵盖各类单位动态基本信息的全国组织机构代码数据库为基础,依托当前自然语言自动处理技术的成功经验和研究成果,探究实现大规模机构信息自由文本数据的信息抽取、切分词优化、统计分类推断、属性关联分析等方法.为“全国组织机构代码共享平台”实现核心字段动态自动翻译、知识发现、数据质量提高,以及信息自动填补等方面提供关键技术支撑,进而为提高数据库信息利用率提供技术参考,为积极推进国家电子政务信息建设做出有益探索.
组织机构代码信息、自由文本、信息抽取、属性关联
TP311.131;G40-057;F272.92
2012-09-29(万方平台首次上网日期,不代表论文的发表时间)
共5页
92-96