论文研究-基于LDA-wSVM模型的文本分类研究.pdf - 源码 - 源码 - 免费下载

论文研究-基于LDA-wSVM模型的文本分类研究.pdf

文件大小： 1049k

源码售价： 10 个金币积分规则积分充值

资源说明：SVM分类算法处理高维数据具有较大优势，但其未考虑语义的相似性度量问题，而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度，提出了一种新的LDA-wSVM高效分类算法模型。利用LDA主题模型进行建模和特征选择，确定主题数和隐主题—文本矩阵；在经典权重计算方法上作改进，考虑各特征项与类别的关联度，设计了一种新的权重计算方法；在特征词空间上使用这种基于权重计算的wSVM分类器进行分类。实验基于R软件平台对搜狗实验室的新闻文本集进行分类，得到了宏平均值为0.943的高精确度分类结果。实验结果表明，提出的LDA-wSVM模型在文本自动分类中具有很好的优越性能。

部分文件列表（点击文件名可查看文件内容）

					
									本源码包内暂不包含可直接显示的源代码文件，请下载源码包。