-
-
论文研究-基于LDA-wSVM模型的文本分类研究.pdf
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度,提出了一种新的LDA-wSVM高效分类算法模型。利用LDA主题模型进行建模和特征选择,确定主题数和隐主题—文本矩阵;在经典权重计算方法上 ... 进行分类,得到了宏平均值为0.943的高精确度分类结果。实验结果表明,提出的LDA-wSVM模型在文本自动分类中具有很好的优越性能。
-
论文研究-基于LDA和word2vec的英文作文跑题检测.pdf
针对目前国内的英语作文辅助批阅系统缺少准确而高效的跑题检测算法的问题,提出了一种结合LDA和word2vec的跑题检测算法。该算法利用LDA模型对文档建模并通过word2vec对文档进行训练,利用得到的文档主题和词语之间的语义关系,对文档中各主题及其特征词计算概率加权和,最终通过设定合理阈值筛选 ...
-
论文研究-基于LDA的结构—内容联合社团发现模型.pdf
... 网络中的社团不但可以将相似的用户划分在一个社团,还可以用来预测网络中潜在的连接关系。为了提高社会网络中社团发现的性能,提出了一种基于LDA的结构—内容联合社团发现模型。首先,对社会网络的图论描述进行转换,使其适用于LDA模型;其次,对LDA模型描述进行扩充,使其包含了用户间交互的文本信息;最后,通过Gibbs采样方法对模型的参数进行估计。实验表明,提出的社团发现模型与其他相关方法相比较,社团发现得到的社团 ...
-
论文研究-基于节点重要性的LDA社会网络话题模型研究.pdf
在社会网络话题模型中,一些频繁出现的单词往往出现在不同的话题中。用户对这些单词感兴趣,因而分析时不能省略,这给话题分析带来了严重的挑战。为了解决这一问题,对话题模型中的节点流行性进行建模,提出了一种考虑节点重要性的LDA(latent Dirichlet allocation)社会网络话题模型。在该模型中,提出了流行性组件的概念,并提出了一种包含了流行性组件的扩展话题模型。通过实验结果表明,提出的包含流行性组件的扩展话题模型具有更好的预测能力,其预测结果的准确性明显优于现有的相关研究。
-
论文研究-基于LDA模型和HowNet的多粒度子话题划分方法.pdf
针对LDA建模结果较泛化、子话题间文本相似度较高等问题,提出一种基于狄利克雷分配模型(LDA)和知网(HowNet)语义词典相结合的多粒度子话题划分方法(MGH-LDA)。首先采用LDA模型对不同新闻源的新闻集合进行初划分,并根据文档贡献度获得相同新闻话题的文档集合;其次在TF-IDF模型基础上获取多粒度粗细特征,作为核心词特征集合来表征新闻文 ...
-
论文研究-基于SVD和LDA的人脸识别方法.pdf
提出了一种基于奇异值分解与改进的LDA相结合的人脸识别方法。首先利用奇异值分解方法获得图像的有效特征;然后经过改进的LDA处理,这样不仅可以有效降低维数,而且使抽取特征的判别能力得到了有效增强;最后对压缩后的特征向量进行排序,将排序后的特征送入BP网络进行识别。实验结果表明,该方法在低维特征向量下取得了很高的识别率,达到99%,效果优于传统方法。
-
论文研究-基于LDA模型的Adhoc信息检索方法研究.pdf
传统的话题模型假设每个文档只属于一个话题,而实际情况下一个文档往往与多个话题相关。应用LDA模型将文档表示为多个话题的组合,并基于语言模型框架,提出了一种基于LDA的混合模型用于文本信息的Ad hoc检索。该方法将LDA模型与文档模型相结合,与聚类模型相比,在保持较低的计算复杂度外,具有很高的检索性能,因此更适用于大规模文档集的信息检索。
-
论文研究-LDA模型下不同分词方法对文本分类性能的影响研究.pdf
通过定义类别聚类密度、类别复杂度以及类别清晰度三个指标,从语料库信息度量的角度研究多种代表性的中文分词方法在隐含概率主题模型LDA下对文本分类性能的影响,定量、定性地分析不同分词方法在网页和学术文献等不同类型文本的语料上进行分类的适用性及影响分类性能的原因。结果表明:三项指标可以有效指明分词 ... 网页类型的语料对于各种分词法的适应性更强。尝试通过对语料进行信息度量而非单纯的实验来选择提高该语料分类性能的最佳分词方法,以期为网页和学术文献等不同类型的文本在基于LDA模型的分类系统中选择合适的中文分词方法提供参考。
-
论文研究-基于小波域PCA与LDA相结合的红外人脸识别方法.pdf
提出了一种新的小波域主元分析与线性辨别分析相结合的红外人脸识别方法。首先通过DWT将红外人脸图像通过二级小波分解成七个子带,舍去两次分解中的对角子带,对剩下的五个子带进行有效的组合;然后用PCA方法对组合后的向量进行特征提取,再把PCA提取的特征向量进行线性辨别分析;最后用欧氏距离和三近邻分类器得到分类结果。同传统的PCA和PCA LDA的方法相比,该方法更能利用人脸图像的有用判别信息,并得到更好的识别效果。
-
-