期刊专题

10.16652/j.issn.1004-373x.2019.16.015

文本信息检索系统的设计与实现

引用
随着信息化的发展,互联网上出现了越来越多的文档信息,如何根据用户的需要从海量的文档中快速获取相关信息成为了研究的热点.采用Python编程语言、Django Web应用框架、UWSGI Web服务器、Nignx代理服务器,基于Tex-tRank关键词提取算法、倒排索引结构、Jaccard相似度计算以及MySQL数据库技术构建了汉英文本信息检索系统.该系统包含文本注册、文本检索和文本注销三个模块,可实现千万量级文本数量上的快速注册和快速检索功能,为构建舆情分析系统提供服务,并可根据人们特定的需求,扩展文本检索服务.

信息检索、算法介绍、倒排索引、检索系统构建、快速注册、快速检索

42

TN911.2-34;TP391

国家自然科学基金资助项目61762084;国家自然科学基金资助项目61662077;国家自然科学基金资助项目61462083;国家自然科学基金资助项目61331011;新疆多语种信息技术实验室开放课题2016D03023

2019-08-27(万方平台首次上网日期,不代表论文的发表时间)

共5页

62-66

暂无封面信息
查看本期封面目录

现代电子技术

1004-373X

61-1224/TN

42

2019,42(16)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn