提取核心特征词的惩罚性矩阵分解方法——以共词分析为例
[目的]在共词分析时对高维共词矩阵进行稀疏降维,直观快速地凸显出高维矩阵中的核心特征词.[方法]提出基于惩罚性矩阵分解(PMD)的文本核心特征词提取方法,选取有关高校图书馆使用社交网络这一主题的文献进行实验,用Matlab R2012a对构建的共词矩阵进行PMD分解降维.[结果]利用PMD从1 648个特征词中提取出65个核心特征词,不仅大于用主成分分析提取的34个特征词,而且揭示出高校图书馆使用社交网络的研究热点.[局限]实验中提取的高校图书馆使用社交网络的特征词未能全面涉及,有一定的主观性.[结论]用PMD方法对高维共词矩阵进行稀疏后,所获核心特征词更容易被理解和解释,也能够表明一些边缘化的主题.
惩罚性矩阵分析、特征词提取、主成分分析
G250(图书馆学、图书馆事业)
曲阜师范大学校级基金项目“多变量控制的先进建模方法研究”项目XJ200947的研究成果之一
2014-04-30(万方平台首次上网日期,不代表论文的发表时间)
共8页
88-95