基于密度的自适应LDA模型选择方法
文件大小: 965k
源码售价: 10 个金币 积分规则     积分充值
资源说明:主题模型已成功用于信息分类和检索。 这些模型可以使用称为“主题”的低维多项式分布集捕获文本文档集合中的单词相关性。 但是,为特定数据集选择适当数量的主题很重要但很困难。 在本文中,我们研究了潜在狄利克雷分配(LDA)中最佳主题结构和主题之间距离之间的内在联系,并提出了一种基于密度自适应选择最佳LDA模型的方法。 实验表明,该方法无需手动调整主题数即可实现与LDA最佳匹配的性能。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。