-
-
-
-
-
Latent Dirichlet Allocation(LDA)论文翻译
Latent Dirichlet Allocation(LDA)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。LDA是一种非监督机器学习技术,可以用来识别大规模文档集(document collection)或语料库(corpus)中潜藏的主题信息。此文档是LDA论文的翻译。
-
通俗理解LDA模型
印象中,最开始听说“LDA”这个名词,是缘于 rickjin 在 2013 年 3 月写的一个 LDA 科普系列,叫 LDA 数学八卦, 我当时一直想看来着,记得还打印过一次,但不知是因为这篇文档的前序铺垫太长(现在才意识到这些“铺垫”都是深 刻理解 LDA 的基础,但如果没有人帮助初学者提纲挈领、把握主次、理清思路,则很容易陷入 LDA 的细枝末节之 中),还是因为其中的数学推导细节太多,导致一直没有完整看完过。
-
-
rickjin的LDA数学八卦
深入理解LDA主题模型的数学原理。
一个函数:gamma函数
四个分布:二项分布、多项分布、beta分布、Dirichlet分布
一个概念和一个理念:共轭先验和贝叶斯框架
两个模型:pLSA、LDA
一个采样:Gibbs采样
-
-
LDA数学八卦
LDA-math 的汇总, "LDA数学八卦.pdf" 我整理贴出来了, 希望对大家理解 LDA 有帮助。 文章标题挂上“八卦”两字, 因为八卦意味着形式自由、不拘束、可以天马行空,细节处理上也难免有不严谨的地方;当然我也希望八卦是相对容易理解的。
-
-