DOI：10.3321/j.issn:1002-8331.2002.18.019

基于<知网>的中文信息结构抽取研究

引用

摘要：

文章提出了一种在真实文本中抽取中文信息结构的方法-利用大规模基于语义依存关系的语料库对<知网>的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从而从真实文本中最大限度地抽取符合知网中文信息结构定义的短语.该研究除了对将要建立的基于语义依存关系的语言模型是个有益的补充外,对于文本理解、对话系统甚至语音合成中的重音预测、韵律建模等等方面都有十分广阔的应用前景.

关键词：知网、中文信息结构、部分依存分析器、规则

所属期刊栏目：38

分类号：TP391.2(计算技术、计算机技术)

资助基金：国家高技术研究发展计划863计划863-306-ZD03-02-1;面向21世纪教育振兴行动计划985计划985校-22-攻关-06

在线出版日期：2004-01-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：56-58

英文信息展示

期刊专题