论文研究-基于权重微博链的改进LDA微博主题模型.pdf
文件大小: 1109k
源码售价: 10 个金币 积分规则     积分充值
资源说明:社交网络尤其是微博中含有大量的短文本。 短文本不同于传统的文本,其携带的语义特征信息密度低,很难对其进行准确的主题挖掘。针对这一问题,提出根据微博发布时间与原创、转发、评论微博等社交行为信息分配权重,使用背景知识丰富语义特征的微博链结构与基于此改进的LDA主题模型。实验结果表明,相比于标准的LDA模型,本模型的perplexity值更低,即具有较低的预测不确定度。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。