基于字序列标注的中文关键词抽取研究
以某大学图书馆的所有馆藏书目为研究对象,在对图书关键词标引信息进行分析的基础上,总结中文关键词的基本特点及其抽取规律,构建一个基于字序列标注的中文关键词抽取模型,提出中文关键词抽取的基础思路和实现方案,并通过实验论证模型的合理性、正确性和实用性,认为字序列标注方法优于词序列标注,基本上可以解决不分词情况下的中文关键词抽取问题。
序列标注、条件随机场、关键词抽取、机器学习、字序列、词序列
TP391.1(计算技术、计算机技术)
2012-04-21(万方平台首次上网日期,不代表论文的发表时间)
39-45