LDA模型学习笔记
文件大小: 804k
源码售价: 10 个金币 积分规则     积分充值
资源说明:从LSA到PLSA到LDA,对文本的建模一步步的完善,LDA在document到topic一层引入了dirichlet分布,这是它优于PLSA的地方,使得模型参数的数量不会随着语料库的扩大而增多。LDA建模中最关键的是对参数的估计,原始paper中使用的是variational inference和EM算法,但这不是必须的,实际上有更容易计算的方法:Gibbs Sampling。目前已经有该方法的实现。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。