Go To English Version 超过100万源码资源,1000万源码文件免费下载
关键字:
  • 基于新闻内容的新闻热点发现.docx ... 以财经领域的新闻为目标,通过爬虫技术抓取网络上的大量财经新闻,利用jieba分词对新闻内容文本进行预处理,去除一些对聚类无用的词,并给剩余的词加上词性;之后用词频-逆向文件频率方法(TF-IDF)得到分词以后的每篇新闻报道内容的文本特征,再用使用基于密度的DBSCAN聚类算法分析发现热点;从发现的热点中,再利用k-均值算法进行词汇聚类分析,得出热点所涉及的人或事物,以此分析出社会对经济领域比较关注的问题和话题,并通过实验对结果进行验证。考虑到通用性,在最后设计了一个可视化界面,通过操作窗口上的按钮来让他人 ...
  • dbscan1d-0.1.4.tar.gz DBSCAN算法是一种聚类算法,dbscan1d是DBSCAN算法的一维实现。 创建它是为了在大型1D阵列上高效地执行聚类。 Sci-kit Learn的DBSCAN实现没有一维的特殊情况,因为在这种情况下,计算全距离矩阵很浪费。 最好简单地对输入数组进行排序并执行有效的二等分以找到最接近的点要好得多。 这是运行软件包附带的简单配置文件脚本的结果。 在每种情况下,DBSCAN1D都比scikit Learn的实现快得多。
  • Clustering-Algorithms-master.zip 基于Python实现了K-Means、GMM、DBSCAN、AGNES等四种常见的聚类 ...
  • 聚类测试_31省市居民家庭消费水平-city.txt 运用K-Means进行聚类分析的数据。 通过无标签的数据,学习数据的分布或数据与数据之间的关系。 1.聚类算法定义:根据数据的“相似性”将数据分为多类的过程。 1.1可运用的算法模块:K-Means、近邻传播算法、DBSCAN算法,高斯混合模型(GMM)等。
  • 学生上网日志TestData.txt 学生上网日志的文件:TestData.txt,对其进行DBSCAN测试,下载后最好与.py放到同一文件夹下。
  • 数据挖掘聚类算法.rar 此资源包含俩个文件夹,一个是5种聚类算法(二分K-Means算法、K-Means算法、DBscan算法、层次算法、GMM算法)源码,一个是对这5种聚类算法的实验结果和评价。
  • 基于卡车的海量GPS轨迹数据的矿区路网自动更新技术 针对露天矿区道路网随环境的不断变化,运用矿用卡车的海量移动轨迹数据,实现矿区路网的自动更新技术。通过对轨迹数据的精度进行分析评价,筛选出可靠数据,并对数据应用改进后的DBSCAN密度聚类算法来获取聚类点簇,然后对聚类点簇执行B样条曲线拟合,建立拓扑关系,形成矿区路网图。结果表明该算法可以适用于绝大部分的矿区道路环境。
  • 论文研究 - 基于关联规则和标签聚类的犯罪嫌疑人预测 ... 。首先,采用FP-增长算法来计算犯罪分子和普通民众在其旅行和旅馆住宿数据中的关联规则,以便根据关联规则发现犯罪嫌疑人。 其次,采用DBSCAN算法对罪犯和普通人的标签数据进行聚类,然后进行相似度计算,以基于标签聚类发现犯罪嫌疑人。 最后,对上述两组犯罪嫌疑人 ... 出现在交叉路口的犯罪分子,从而获得最终的犯罪嫌疑人。 结果表明,根据FP增长算法计算的关联规则,检索到648名犯罪嫌疑人,而根据DBSCAN聚类和个人标签的余弦相似度,检索到973名犯罪嫌疑人。 两组相交后,犯罪嫌疑人的数量缩小到567名,使用验证集 ...
  • 使用MDL原则和DBSCAN进行轨迹聚类 lab2.py是主程序,silhouette_coefficient.py是计算轮廓系数的,但计算过程简化了,draw.py是可视化聚类结果的,参考论文:http://hanj.cs.illinois.edu/pdf/sigmod07_jglee.pdf
  • cluster_python.zip 通过python实现多种聚类算法(纯手打方法,仅调用numpy等常用包)。 程序包含k-means、DBSCAN、MeanShift等多种经典聚类算法,另结合MeanShift和DBSCAN提出LazyMeanShift算法。 应用举例包含2D散点聚类和图像聚类。