多载体数据流中的特定信息识别研究

引用

摘要：

提出了一种识别多载体数据流中包含的特定信息的新方法.该方法按照特征词及其拼音匹配规则,基于统计自然语言理论,通过自动的归纳学习,将从语料库中获得的词性间的转移值作为系统知识,利用有效的知识逼近策略判断真实数据流中的特征词与其上下文的关系,并得到特征词在真实文本中的评测值,以此来考查真实数据流中出现的全部特征词与在语料中所学到的特征词上下文搭配规则上的相似程度.如果整个数据流的评测值超过阈值,该数据流将被屏蔽.实验结果表明,根据该方法开发的识别及监控多载体数据注中不良信息的实验系统取得很好的效果.

关键词：信息识别、知识逼近、词性转称、归纳学习

所属期刊栏目：14

分类号：TP18(自动化基础理论)

资助基金：国家高技术研究发展计划863计划2001 AA 114101

在线出版日期：2003-10-31（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：1538-1543

英文信息展示

期刊专题