-
-
-
-
-
-
-
-
基于LDA的互联网广告点击率预测研究
... 点击率预测模型的过程中,往往面临着广告及用户的数量巨大以及训练数据集稀疏的问题,从而导致点击率预测的准确度下降。针对这些问题提出了一种基于LDA(latent Dirichlet allocation,LDA)的点击率预测算法,即LDA-FMs,该算法对原有训练集进行基于主题的分割,利用分割后的子训练集分别建立不同主题下的点击率预测模型;在此基础上,利用广告 ...
-
论文研究-基于2DPCA和2DLDA的人脸识别方法.pdf
提出了基于2DPCA、2DLDA两种特征采用融合分类器的人脸识别方法。首先提取人脸图像的2DPCA和2DLDA特征,对不同特征在决策层对分类器进行融合。在ORL人脸库上的试验结果表明,分类器决策层融合方法在识别性能上优于2DPCA和2DLDA,更具有鲁棒性。
-
论文研究-基于权重微博链的改进LDA微博主题模型.pdf
社交网络尤其是微博中含有大量的短文本。 短文本不同于传统的文本,其携带的语义特征信息密度低,很难对其进行准确的主题挖掘。针对这一问题,提出根据微博发布时间与原创、转发、评论微博等社交行为信息分配权重,使用背景知识丰富语义特征的微博链结构与基于此改进的LDA主题模型。实验结果表明,相比于标准的LDA模型,本模型的perplexity值更低,即具有较低的预测不确定度。
-
论文研究-基于优化密度的耦合空间LDA文本聚类算法研究.pdf
针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法。该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文本相似度,并对阈值敏感问题进行优化,确定不同密度区域对应的阈值半径。实验结果表明,与改进的DBSCAN文本聚类算法和R-DBSCAN文本聚类算法相比,该算法的文本聚类精度更高、聚类效果更优。
-