10.3969/j.issn.1002-137X.2012.08.018
基于语义的中文网页检索
用户期望搜索引擎能提供基于语义的网页信息检索.基于本体、基于自然语言理解、基于文本统计分析的方法是实现中文网页语义检索的主要途径.分析了它们的实现方法、技术挑战和优、缺点;建议中文网页语义检索系统的开发应选择与普通用户联系紧密的应用领域,并以汉语词汇为索引单元,适量地采用中文信息处理技术.基于语义的中文网页检索应在以下方面加强研究:语义相关性评价方法、本体构建和实体抽取算法、基于语义的索引、大规模语义标注样本集开发等.
语义检索、中文网页、本体、分类、聚类、信息抽取
39
TP391.3(计算技术、计算机技术)
教育部人文社会科学研究项目10YJA740120;湖北省教育厅人文社会科学研究项目2010b032
2012-12-05(万方平台首次上网日期,不代表论文的发表时间)
共9页
79-87