10.16069/j.cnki.51-1610/g4.2022.08.009
利用开源词向量扩充图情领域术语词
特定领域的信息检索和问答系统应用越来越广泛.这些系统的性能和该领域的专业词语密切相关.收集该领域的术语词是提升性能的一个关键环节.完全利用人工标注来获得术语词的方法成本高,效率低.通过词相似计算,在包含大量词语的开源词向量中获得相似词,然后进行人工筛选,可以高效低成本获得该领域的术语词.针对图书情报领域中专业词汇收集任务的实验表明,这个方法可以低成本高效率获得大量该领域的专业词汇.
词向量、图书情报、术语词
37
G250.7(图书馆学、图书馆事业)
四川省教育厅人文社会科学重点研究基地——四川特殊教育发展研究中心项目;互联网自然语言智能处理四川省高等学校重点实验室开放基金项目
2022-09-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
53-58