基于LDA主题特征的自动文摘方法
文件大小: 274k
源码售价: 10 个金币 积分规则     积分充值
资源说明:近年来概率主题模型受到了研究者的广泛关注,LDA( Latent Dirichlet Allocation) 模型是主题模型中具有代表性的概率生 成模型之一,它能够检测文本的隐含主题。提出一个基于LDA 模型的主题特征,该特征计算文档的主题分布与句子主题分布的距 离。结合传统多文档自动文摘中的常用特征,计算句子权重,最终根据句子的分值抽取句子形成摘要。实验结果证明,加入LDA 模 型的主题特征后,自动文摘的性能得到了显著的提高。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。