基于lDA模型的主题词抽取
文件大小: 129k
源码售价: 10 个金币 积分规则     积分充值
资源说明:以 LDA 模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词 扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速 Gibbs 抽样算法进行。实验结果表明,快速 Gibbs 算法的速度约比 传统 Gibbs 算法高 5 倍,准确率和抽取效率均较高。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。