10.3969/j.issn.2096-4706.2019.14.002
融合主题模型的在线可比度计算研究
在线挖掘可比语料是构建大规模可比语料库的可行途径之一,在线可比度计算是语料挖掘过程中的关键环节.本文提出一种融合词汇重合度和主题模型的在线可比度计算方式,主题模型选择能够进行在线学习的Online LDA,利用词对齐工具GIZA++进行主题映射,融合方式为加权求和.在下载的中英新闻语料上的测试结果表明,两种计算方式融合后的准确性比两种都要高.
可比语料库、可比度、主题模型、主题映射
3
TP391.1(计算技术、计算机技术)
国家语委十三五科研规划项目:基于主题模型的Web可比语料在线挖掘研究YB135-22;国家语委十三五科研规划项目:北宋书法家米芾书法字库创建及其推广应用YB135-33
2019-08-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
1-4