10.3772/j.issn.2095-915x.2021.06.007
面向中医文献的短语挖掘方法
[目的/意义]在中医文献中存在大量的短语,目前的短语挖掘方法在中医文献上效果差强人意,针对这个问题,提出了面向中医文献的短语挖掘方法.[方法/过程]该方法在中医文献分词器基础上,利用中医领域新语言知识库,训练得到短语质量评分模型,并在此基础上利用词性标签信息构建短语分割模型对文献进行挖掘,提高中医文献中短语挖掘的准确率.并在《中医古代名医医案》上进行实验.[结果/结论]选取挖掘短语的Top300对其进行精确率的评估,其准确率为84.96%.实验证明中医文献分词器+短语分割模型的挖掘方法在中医领域文献上的短语挖掘效果优于其他挖掘方法.
中医文献短语挖掘;短语挖掘;高质量短语;中医文献分词器;短语质量评分模型;词性标签;短语分割模型
7
TP391.1;G35(计算技术、计算机技术)
中国科学技术信息研究所情报工程实验室开放基金项目
2022-03-17(万方平台首次上网日期,不代表论文的发表时间)
共12页
76-87