当前位置:网站首页>聚类了解
聚类了解
2022-08-09 10:39:00 【qq_26391203】
- 聚类与分类的区别: 分类是已知各类别的属性值,将事物通过特征的筛选归并到已知的类别。聚类通过相似性的度量方式,将距离相近的归并到同一类,距离较大的归并到不同类。
- 相似性度量:欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、余弦相似度、汉明距离、杰卡德距离& 杰卡德相似系数、皮尔逊相关系数、相关系数& 相关距离、信息熵
- 层次聚类:由下而上的合并cluster,优点:一次性得到整个聚类过程。缺点:层次聚类采用的是贪心算法,只能得到局部最优解
数据流的聚类算法
stream方法:采用分级聚类,但STREAM算法没有考虑数据流的演变,即算法没有给予最近的数据较大的权重。聚类的结果可能受控于过期的数据点。STREAM算法更趋近与一个批处理的过程,无法给出一个anytime的回应,即算法无法在任意时刻给出当前数据流的聚类结果。STREAM的不足还包括无法给出不同时间粒度的聚类结果等等。
基于层次的方法---clustream:联机的微聚类(micro clustering)和脱机的宏聚类(macro clustering).CluStream算法解决了STREAM算法的两个问题。即它是增量式(incremental)的聚类算法,在每个数据项到来时进行处理,能给出anytime的回应;并且,它使用Pyramidal时间框架,能给出不同时间粒度的聚类结果。这对于希望分别考察诸如上周、上月以及去年的聚类分析结果的用户意义重大
边栏推荐
猜你喜欢
研发需求的验收标准应该怎么写? | 敏捷实践
非科班毕业生,五面阿里:四轮技术面+HR一面已拿offer
Nodejs服务端
Attentional Feature Fusion
使用.NET简单实现一个Redis的高性能克隆版(四、五)
Solve the ali cloud oss - the original 】 【 exe double-click response can't open, to provide a solution
How tall is the B+ tree of the MySQL index?
Redis + NodeJS 实现一个能处理海量数据的异步任务队列系统
机器学习-逻辑回归(logistics regression)
[项目配置] 配置Qt函数库和ui界面库的封装并调用的项目
随机推荐
AQS同步组件-ForkJoin、BlockingQueue阻塞队列解析和用例
Attentional Feature Fusion
Pyhton实战汇总篇
深度学习--神经网络(基础讲解)
OneNote 教程,如何在 OneNote 中搜索和查找笔记?
Shell script combat (2nd edition) / People's Posts and Telecommunications Press Script 1 Find programs in the PATH
Database connection operations for MySQL and MyEclipse
Umi Hooks
pytorch widedeep文档
壁纸
Mysql多表查询
对话跨国消费品牌DPO:数据安全合规从何做起?8.11直播见!
1004 成绩排名 (20 分)
Unix Environment Programming Chapter 14 14.4 I/O Multiplexing
unix环境编程 第十五章 15.8信号量
xmms播放器加了播放列表的管理功能
MySQL外键在数据库中的作用
How to quickly get through the mirror release process?
阿里神作!吃透这份资料入厂率高达99%
[Original] Usage of @PrePersist and @PreUpdate in JPA