当前位置:网站首页>聚类了解
聚类了解
2022-08-09 10:39:00 【qq_26391203】
- 聚类与分类的区别: 分类是已知各类别的属性值,将事物通过特征的筛选归并到已知的类别。聚类通过相似性的度量方式,将距离相近的归并到同一类,距离较大的归并到不同类。
- 相似性度量:欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、余弦相似度、汉明距离、杰卡德距离& 杰卡德相似系数、皮尔逊相关系数、相关系数& 相关距离、信息熵
- 层次聚类:由下而上的合并cluster,优点:一次性得到整个聚类过程。缺点:层次聚类采用的是贪心算法,只能得到局部最优解

数据流的聚类算法
stream方法:采用分级聚类,但STREAM算法没有考虑数据流的演变,即算法没有给予最近的数据较大的权重。聚类的结果可能受控于过期的数据点。STREAM算法更趋近与一个批处理的过程,无法给出一个anytime的回应,即算法无法在任意时刻给出当前数据流的聚类结果。STREAM的不足还包括无法给出不同时间粒度的聚类结果等等。
基于层次的方法---clustream:联机的微聚类(micro clustering)和脱机的宏聚类(macro clustering).CluStream算法解决了STREAM算法的两个问题。即它是增量式(incremental)的聚类算法,在每个数据项到来时进行处理,能给出anytime的回应;并且,它使用Pyramidal时间框架,能给出不同时间粒度的聚类结果。这对于希望分别考察诸如上周、上月以及去年的聚类分析结果的用户意义重大
边栏推荐
猜你喜欢
随机推荐
unix环境编程 第十五章 15.10 POSIX信号量
Attentional Feature Fusion
数据存储:对dataframe类,使用to_csv()将中文数据写入csv文件
使用cpolar远程连接群晖NAS(创建临时链接)
【原创】VMware Workstation实现Openwrt软路由功能,非ESXI,内容非常详细!
相关系数计算,热力图绘制,代码实现
2021-01-11-雪碧图做表情管理器
一键完成物联网产品注册,快速体验在线调试设备
今天做了手机播放器的均衡器
Qt 国际化翻译
How tall is the B+ tree of the MySQL index?
Shell script combat (2nd edition) / People's Posts and Telecommunications Press Script 2 Validate input: letters and numbers only
antd表单
Electron application development best practices
MySQL索引的B+树到底有多高?
json库的dumps()方法和loads()方法
Cpolar内网穿透的面板功能介绍
UNIX Environment Programming Chapter 15 15.5FIFO
Solve the ali cloud oss - the original 】 【 exe double-click response can't open, to provide a solution
WUSTOJ:n个素数构成等差数列









