TI-FastText自动商品分类算法
为了实现根据商品标题信息进行商品自动分类的功能,提出了基于词频-逆文本频率(TF-IDF)的中文Fasttext商品分类方法.该方法首先利用FastText本身的特点,将词库表示成前缀树;然后对n元语法模型n-gram处理后的词典进行TF-IDF筛选,从而在计算输入词序列向量均值时,偏向高群分度的词条;最后将文本内容以字符顺序进行大小为N的窗口滑动操作,使其更适用于商品标题分类.基于Anaconda平台,对基于FastText的商品分类算法进行实现和优化,经评估,最终的分类器准确率较高,能够满足电商平台对商品分类的需求.
商品分类、中文短文本分类、FastText、TF-IDF
49
TP391.9(计算技术、计算机技术)
辽宁省自然科学基金2019-ZD-0354
2022-06-22(万方平台首次上网日期,不代表论文的发表时间)
共5页
206-210