期刊专题

利用双语词典检索英汉跨语言剽窃文档对应内容

引用
[目的]在英汉跨语言剽窃文档中检索翻译对应内容.[方法]基于双语词典进行相似分析,合并整理词典以提高词语级匹配的准确率和效率,利用整体词频分布、匹配位置特征等解决歧义和多重匹配问题,根据词的对应情况、词的位置信息等综合加权计算句子及段落的相似度.[结果]在真实翻译语料上的实验结果表明,检索的准确率为0.841,召回率为0.748.[局限]未登录词的翻译关系不易根据词典判定.[结论]基于双语词典检索跨语言相似内容的方法简单易行,适用面广.

跨语言剽窃、相似度、歧义、双语词典、未登录词

TP18(自动化基础理论)

本文系校级科研专项基金项目“基于平行语料库的学生译文自动评价研究与实现”项目编号:2009JJ056和全国教育科学规划课题“计算机辅助音译系统的研究与实现”项目编号:GPA115033的研究成果之一.

2014-09-04(万方平台首次上网日期,不代表论文的发表时间)

114-119

暂无封面信息
查看本期封面目录

现代图书情报技术

1003-3513

11-2856/G2

2014,(7)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn