微博中文本特征质量对检索效果的影响
[目的]通过对国内4大微博平台中特征词质量的测度,探讨其质量指标对检索效果的影响.[方法]将权重计算指标TF-IDF从特征词角度提升为特征的研究,并通过描述能力和辨别能力两个质量测度指标对国内4个主流微博平台中各特征的质量进行评估.[结果]微博中文本特征的描述能力和辨别能力对检索效果产生正向影响;各平台不同特征的质量对分类有着不同程度的影响,两种测度指标综合考虑时得到的分类效果最好.[局限]微博中的对话回复、粉丝数、关注数等特征并没有被考虑在内;对于语义研究中的特征词一词多义或者同义词的讨论并未涉猎.[结论]本研究可更好地揭示微博中各种特征影响检索效果好坏的重要程度,有助于研究者对各平台特征作用的深入理解,从而从根本上提高社会化媒体平台的检索质量.
微博、文本特征、描述能力、辨别能力、检索
G203(信息与传播理论)
2014-08-11(万方平台首次上网日期,不代表论文的发表时间)
79-86