-
-
数据挖掘聚类分析大作业
数据挖掘的代码是用C++写的,包含了三个算法 k-means ,CURE,DBSCAN,分别对三个数据集做处理,分别为小麦种子,股票数据,糖尿病患者。另外还有其他两个算法,代码在cplusplus文件里面,但是没有用于数据分析,有需要可以自己加。资料里面还包含了我的实验报告,结合了weka进行预处理。另外还有可执行文件,该目录下的其他文件是预处理后的数据,删除后就不能执行。
仅供参考。
-
-
动态聚类算法合集
包括主流的几种动态聚类算法:K-means,K-means的改进算法,DBSCAN算法等等,还有数据作图代码,代码详细明晰!适合想学习动态聚类算法的朋友!
-
-
-
论文研究-基于相对密度的多耦合文本聚类算法.pdf
针对现有的空间向量模型在进行文本表示时忽略词条的位置和词条间关系的问题,提出了一种基于相对密度的多耦合文本聚类算法。在基于相对密度的聚类方法基础上,该算法根据相对密度越小文本相似性越小这一事实,将相对密度转换为文本相似度,融入了传统DBSCAN密度算法,并对核心对象的选取进行了优化。实验结果表明,与改进的K-means文本聚类和改进的DBSCAN文本聚类算法相比,本算法在文本聚类中更高效、聚类质量更优。
-
论文研究-一种新型的基于密度和栅格的聚类算法.pdf
针对网格和密度方法的聚类算法存在效率和质量问题,给出了密度与栅格相结合的聚类挖掘算法,即基于密度和栅格的聚类算法DGCA(density and grid based clustering algorithm)。该算法首先将数据空间划分为栅格单元;然后把数据存储到栅格单元中,利用DBSCAN密度聚类算法进行聚类挖掘;最后进行聚类合并和噪声点消除,并将局部聚类结果映射到全局聚类结果。实验通过人工数据样本集对该聚类算法进行理论上验证,表明了该算法在时间效率和聚类质量两方面都得到了提高。
-
论文研究-基于优化密度的耦合空间LDA文本聚类算法研究.pdf
针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法。该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文本相似度,并对阈值敏感问题进行优化,确定不同密度区域对应的阈值半径。实验结果表明,与改进的DBSCAN文本聚类算法和R-DBSCAN文本聚类算法相比,该算法的文本聚类精度更高、聚类效果更优。
-
论文研究-面向地下钱庄洗钱行为的可视化交互分析平台.pdf
... 对异构数据的同一化,建立了数据模型以及可视结构,资金链的可视化分析,允许用户交互操作,并结合地下钱庄洗钱的交易特征改进了DBSCAN算法;讨论了该平台的系统框架及其关键技术,并结合实际数据给出了应用实例。该平台能够给予办案人员更直观清晰的思路,提高办案效率。
-
-