10.3969/j.issn.1005-8095.2021.07.018
阿拉伯文文本预处理方法研究综述
[目的/意义]旨在促进阿拉伯文文本挖掘的研究与应用,为其他学者提供参考.[方法/过程]概述阿拉伯文的基本特征与语法规则,从分词、词性标注、词干提取、词形还原四个方面对比分析阿拉伯文文本预处理方法及主流应用,并指出现有研究的不足与未来研究方向.[结果/结论]未来研究中,可以通过完善词典、改进词义消歧效果等方法进一步提高阿拉伯文文本预处理的效率和准确率.
阿拉伯文、文本预处理、阿拉伯文分词、词性标注、词干提取、词形还原
TP391.1(计算技术、计算机技术)
国家自然科学基金71771054
2021-07-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
122-128