-
-
基于密度与动态阈值的任意形状聚类挖掘算法研究
本文分析了数据聚类算法BIRCH 的不足之处,提出了一种基于密度与动态阈值的任意形状聚类挖掘算法——DVTD 算法,它结合密度和阈值双重参数,并根据数据集内在特征,动态改变阈值T,既可以控制CF 树的大小,也能利用不同球形聚类逼近任意形状的数据聚类。实验结果表明,它的算法复杂度与 BIRCH 相当,并大大降低了 CF 的大小,对任意形状的聚类效果可以达到与DBSCAN 相近的效果。
-
混合模型:基于VGG-16+PCA+Meanshift/DBSCAN的图像分类
混合模型实战简介数据集训练集测试集实战讲解
简介
博主上次做的VGG16训练宝可梦多分类图像识别,5个每类,每个类别250张左右,训练数量并不多,但如果我的训练数量更少呢?因为在现实生活中,没办法穷尽所有的数据。我们期望更多的高质量数据:正常数据,穷尽类别,标注正确;但是现实大部分为普通数据:夹杂异常数据,包含部分类别,标注标准不一致。为了考虑这个问题,我们可以综合许多模型的优点。于是混合模型就出现了。
混合模型一般有是监督学习、无监督学习、机器学习和深度学习这四种混搭。本文采取的是监督+无监督学习,即 ...
-
基于机器视觉的茶小绿叶蝉识别方法研究
... 领域, 以实现茶园中茶小绿叶蝉的准确及时预报。采集了自然场景下黄色诱虫板的图像,利用超像素分割算法和多DBSCAN聚类图像融合的方法对采集的图像进行区域分割,保证了目标区域的准确性和完整性。在此基础上,提取了目标图像子区域的 ...
-
基于网格的聚类算法
... 算法,WaveCluster算法,WaveCluster聚类算法等。俗话说:“物以类聚,人以群分”,在机器学习中,聚类算法是一种无监督分类算法。聚类算法很多,包括基于划分的聚类算法(如:kmeans),基于层次的聚类算法(如:BIRCH),基于密度的聚类算法(如:DBScan),基于网格的聚类算法等等。基于划分和层次聚类方法都无法发现非凸面形状的簇,真正能有效发现任意形状簇的算法是基于密度的算法,但基于密度的算法一般时间复杂度较高,1996年到2000年间,研究数据挖掘的学者们提出了大量基于网格的聚类算法 ...
-
-
centrifuge-toolkit:用于可视化和凭经验分析二进制文件中编码信息的工具
... 距离小于特定数据类型的设置阈值,则该群集将被标识为该数据类型。 当前,存在针对高熵数据,UTF-8英语以及针对各种CPU架构的机器代码的参考分布。
这两种方法按顺序一起使用:首先DBSCAN查找聚类,然后测量聚类数据和参考分布之间的Wasserstein距离以识别其数据类型。 为了识别文件中发现的所有机器代码的目标CPU,Centrifuge使用 。
所需的图书馆
所有必需的库都与捆绑在一起。
*在 ...
-
-
微笑:统计机器智能和学习引擎
... ,随机森林,RBF网络,OLS,LASSO,ElasticNet,岭回归。
特征选择:基于遗传算法的特征选择,基于集成学习的特征选择,TreeSHAP,信号噪声比,平方和比。
聚类: BIRCH,CLARANS,DBSCAN,DENCLUE,确定性退火,K均值,X均值,G均值,神经气,增长神经气,分层聚类,顺序信息瓶颈,自组织图,谱聚类,最小熵聚类。
关联规则和频繁
-
-
基于激光诱导击穿光谱技术在线监测碳纤维复合材料激光清洗效果
... 多维空间中加工应用。首先确定激光清洗速度,并研究LIBS随激光单脉冲能量密度的变化规律,用来表征碳纤维复合材料清洗的效果。然后在数据分析的处理上,采用均值平滑去除背景的方法处理包络状的光谱连续背景;采用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法实现光谱噪声和有效数据的分离;采用皮尔逊系数分析的方法确定激光清洗的最佳烧蚀次数,为激光清洗实现过程自动优化控制提供判定依据。最后采用扫描电子显微镜分析碳纤维表面形貌特征 ...
-