一种分布式语义增强的词汇链文本表示模型构建方法
[目的]利用分布式语义关联计算词衔接关系,解决目前词汇链构建时存在的词间关系探测深度不够等问题,提高词汇链构建质量.[方法]对词汇链构建的技术方法进行归纳,利用WordNet词典关系来计算文本中语言单元的语义关联,利用分布式记忆模型来计算语言单元之间的潜在语义关系,将这两种语义关系结合起来实现词汇链文本表示模型的构建.同时在理论研究的基础之上选择医学领域科技论文进行对比实验.[结果]在文本主题描述方面,本文方法的词汇链构建结果要优于非贪婪算法,算法耗时与非贪婪算法相当.[局限]算法耗时较长;没有完整考虑词衔接关系;只在对医学领域科技文献的主题识别中验证了该方法的有效性,还需要在更多领域进行证明o[结论]分布式语义关联可以识别潜在语义,对使用多元短语构建词汇链也有较大的帮助,能有效地增强词汇链构建效果.
WordNet、分布式记忆、词汇链、分布式语义
TP393;G350(计算技术、计算机技术)
2016-10-28(万方平台首次上网日期,不代表论文的发表时间)
34-41