专家主页的信息块划分及特征提取研究
挖掘专家主页中的信息具有重要的研究意义,因此如何描述专家主页的特征去识别实体内容成为挖掘过程中最为关键的一步.文章对专家主页中的主要信息块进行划分,介绍了识别信息块的主要方法.利用Dreamweaver软件对2 000个专家主页进行标注,然后利用文本特征、视觉特征以及结构特征来提取专家主页中专家基本信息、研究兴趣、研究项目和出版物信息的特征,进行特征构建.
专家主页、信息特征、信息提取、研究方法
36
2013-11-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
109-113