10.13833/j.issn.1007-7634.2018.10.012
基于LDA模型的交互式文本主题挖掘研究——以客服聊天记录为例
[目的/意义]挖掘出客服聊天记录中蕴含的主题,为客服自动问答系统的设计及优化提供指导方案.[方法/过程]本文针对保险网站客服聊天记录这类交互式短文本,利用会话切分、分词提取以及词汇过滤等方法进行文本预处理,通过名词短语提取、高频词汇提取以及外部数据集引入等方法进行特征选择,最终应用LDA建模方法获取交互式文本主题.[结果/结论]模型结果显示:用户主要关注保险详情、保险金额以及保险险种等主题.不同主题之间的话题具有一定的独立性,主题和话题之间存在很强的相关性.LDA模型结果成功挖掘出用户关注的主题,这为电子商务网站运营方进行自动问答系统的设计和优化提供了指导方案.
交互式文本、LDA模型、主题挖掘
36
G254(图书馆学、图书馆事业)
国家自然科学基金;国家自然科学基金
2018-10-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
64-70