10.3969/j.issn.1001-8867.2012.02.006
基于字角色标注的中文书目关键词标引研究
中文书目机器自动标引是数字图书馆建设中亟待解决的关键问题之一。本文试图将条件随机场(CRFs)序列标注机器学习算法引入到关键词抽取中,建立面向图书内容、基于字角色标注的中文书目关键词标引模型。将图书内容转化为字序列,进而提出构建关键词角色空间模型和综合利用字序列上下文特征的设计思路。通过实验,从题名和内容提要中分别自动抽取关键词,论证该模型的合理性和实用性。图6。表3。参考文献23。
中文书目、关键词标引、字角色、序列标注、自动标引
G25;TP391(图书馆学、图书馆事业)
国家社科基金项目“面向语义网本体的知识管理研究”09CTQ010的研究成果之一
2012-05-05(万方平台首次上网日期,不代表论文的发表时间)
共12页
38-49