-
-
论文研究-基于区域划分的DBSCAN多密度聚类算法.pdf
DBSCAN聚类算法使用固定的Eps和minPts,处理多密度的数据效果不理想,并且算法的时间复杂度为O(N2)。针对以上问题,提出一种基于区域划分的DBSCAN多密度聚类算法。算法利用网格相对密度差把数据空间划分成密度不同的区域,每个区域的Eps根据该区域的密度计算自动获得,并利用DBSCAN算法进行聚类,提升了DBSCAN的精度;避免了DBSCAN在查找密度相连时需要遍历所有数据的不足,从而改善了算法效率。实验表明算法能有效地对多密度数据进行聚类,对各种数据的适应力较强,效率较优。
-
论文研究-一种使用DBSCAN聚类的网络流量分类方法.pdf
提出了基于DBSCAN算法的网络流量分类方法,对流的定义、特征产生、特征选择以及分类规则和分类性能的评测等内容进行了介绍。提出了基于PCA的网络流量最优特征子集的选择方法。实验结果表明,提出的分类方法能够达到较高的总精确度和查准率,能够有效地使用于网络流量分类中。
-
论文研究-具有稳定饱和度的DBSCAN算法.pdf
在DBSCAN算法基础上提出SS-DBSCAN算法,克服了现有密度聚类方法存在的一些问题,在不增加算法时间复杂度的情况下,避免了空间邻近点被划入噪声簇和不同簇空间位置叠加等问题。提出饱和度概念,保证同一簇内部非空间属性分布的稳定性,并以热带气旋生成海域为例,证明这种算法可以取得很好的聚类效果。
-
论文研究-针对非均匀数据集的DBSCAN过滤式改进算法.pdf
针对在数据分布不均匀时,由于DBSCAN使用统一的全局变量,使得聚类的效果差,提出了一种基于过滤的DBSCAN算法。该算法的思想是:在调用传统的DBSCAN算法前,先对数据集进行预处理,针对所有点的k-dist数据进行一维聚类,自动计算出不同的Eps;然后再根据每个Eps分别调用传统的DBSCAN算法,从而找出非均匀数据集的各种聚类。实验结果表明,改进算法对密度不均匀的数据能够有效聚类。
-
论文研究-GreedyDBSCAN:一种针对多密度聚类的DBSCAN改进算法.pdf
针对基于密度的DBSCAN算法对于输入参数敏感、无法聚类多密度数据集等问题,提出了一种贪心的DBSCAN改进算法(greedy DBSCAN)。算法仅需输入一个参数MinPts,采用贪心策略自适应地寻找Eps半径参数进行簇发现,利用相对稠密度识别和判定噪声数据,在随机寻找核对象过程中使用邻域查询方式提升算法效率,最终通过簇的合并产生最终的聚类结果。实验结果表明,改进后的算法能有效地分离噪声数据,识别多密度簇,聚类准确度较高。
-
论文研究-基于LDA和DBSCAN的软件多版本克隆群映射方法.pdf
针对克隆群映射大多基于相邻版本对比,当克隆群在中期版本短暂消失,实现多版本间映射存在困难,提出一种基于LDA和DBSCAN的软件多版本克隆群映射方法。首先,对所有版本的克隆群进行预处理,获得克隆群文档集合;其次,根据贝叶斯信息准则选取合适主题数T,进行主题概率模型训练,将所有克隆群都表示成T个主题的概率分布向量;再次,计算克隆群之间的JS距离,利用DBSCAN算法将同源的克隆群聚成一簇;最后,对同簇的克隆群按版本先后排序,得到多版本克隆群映射结果。对五款开源软件83个版本进行了映射实验 ...
-
-
-
-
-