10.3778/j.issn.1002-8331.2010.30.003
现代汉语"V+N"序列关系的平行处理
目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源.以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同结构关系的动词和名词相互间的制约规则,再分别依据v+n中汉语名词、动词的语义在英语译文中的具体形式及上下文模板来判断v+n的结构关系类型.实验证明,在自动分词和词性标注的PCCEl000文本中,v+n单语处理的F值为72.14%,而进一步利用汉英词典和英语译文信息,F值到达了88.81%.提高了16.67个百分点.
平行语料、词语搭配、短语分析、自动识别、中文信息处理
46
TP391.1(计算技术、计算机技术)
国家社会科学基金项目07BYY050;国家社会科学青年基金项目10CYY021;江苏省哲学社会科学基金一般项目10YYB007;南京师范大学"211工程"三期重点学科建设项目;南京师范大学特聘教授、高层次人才科研启动基金项目184070H2A96
2011-01-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
8-10