-
-
LDA Analysis
This page is focusing on the improvement of LDA model. It combines the LDA model and PLSA model so that the system will increase on data mining and topic detection of Blogs information.
-
LDA数学八卦
LDA数学八卦,标题挂上“八卦”两字, 因为八卦意味着形式自由、不拘束、可以天马行空,细节处理上也难免有不严谨的地方;当然我也希望八卦是相对容易理解的。LDA是一个在
-
-
(LDA)入门.pdf
LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,我们认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布
-
基于 LDA 模型的博客垃圾评论发现
Blo g 已经成为互联网上的主要信息源之一, 这也使得 Blo g 空间中的垃圾评论成倍增长, 因此如何识别垃圾评论成为面临的重要问题。 该文首先借鉴处理垃圾邮件的方法, 针对 Blog 本身的特点, 使用规则初步过滤垃圾评论, 然后对剩余评论, 利用 Latent Dirichlet Allocatio n( LDA)这种能够提取文本隐含主题的产生式模型, 对博客中的博文进行主题提取, 并结合主题信息进行判断, 从而识别 Blog 空间的垃圾评论。
-
-
最优LDA模型
LDA的自动找K的方法之一。调试很难,需要尝试很多次。
-
-
-
-