半监督的网络科技信息分类模型
[目的]开放的网络科技信息网页内容之间区分度较小,传统基于规则和统计学习的方法无法满足网络科技信息网页分类的具体应用需求.[方法]通过深入分析网络科技信息主题网页的内容和结构,利用开放本体等资源实现领域特征的学习,构建半监督的网络科技信息分类模型.[结果]实验结果表明提出的方法在网络科技信息分类实验中的精度、召回率和F1值分别达到0.9016、0.8756和0.8884,相比贝叶斯方法具有明显优势.[局限]该方法在应用到其他类别的网络科技信息分类时,仍然需要领域专家提供相关领域的核心种子特征.[结论]该方法可以满足网络科技信息深度加工的需求,实现有效的网络科技信息网页分类.
网络科技信息、网络科技信息分类模型、开放资源
TP181;G356(自动化基础理论)
本文系中国科学院文献情报能力建设专项“网络科技信息自动监测系统二期建设”项目项目编号:院1306和国家“十二五”科技支撑计划课题“科技知识组织体系共享服务平台建设”项目编号:2011BAH10B03的研究成果之一.
2014-12-18(万方平台首次上网日期,不代表论文的发表时间)
53-58