10.11925/infotech.2096-3467.2017.0820
专利发明等级分类建模技术研究
[目的]针对如何确定专利发明等级,提出一种基于机器学习分类算法的专利发明等级分类模型.[方法]从专利文本中提取技术特征词,利用Word2Vec训练的词向量模型构建专利技术特征向量,计算专利文本指标和后向引用指标,构造模型训练数据集,采用机器学习分类算法构建分类模型.[结果]获取语音识别技术领域相关专利,对领域专利数据分类,高等级与低等级发明专利占比约为1∶4,符合实际情况,证明了该模型可行性.[局限]由于使用了WordNet词典,对于技术特征词汇的抽取会受到词典收录局限的影响.[结论]该模型可以对专利进行发明等级分类,从而为企业推荐高发明等级的专利.
专利发明等级、技术特征向量、词向量、机器学习
G350;TP311(情报学、情报工作)
北京市社会科学基金项目“要素异质性视角下京津冀现代制造产业转移路径研究”15JGB124;北京市自然科学基金项目“基于技术交易数据的京津冀科技协同创新潜力挖掘”项目9172002的研究成果之一
2018-03-05(万方平台首次上网日期,不代表论文的发表时间)
共11页
63-73