数据聚类和分类有何不同?

时间:01-17人气:20作者:狂凌辕

数据聚类是将相似的数据点自动分组,无需预先定义类别;而分类是根据已知标签对新数据进行归类。聚类是无监督学习,分类是监督学习。

区别

数据聚类:聚类像把一堆混在一起的物品按相似性分开,比如超市将水果按种类摆放,不需要提前知道种类数量。算法会计算数据点间的距离,把相近的归为一组。结果组数由数据决定,比如1000个客户可能分成5个消费群体。聚类常用于市场分析或图像分割,帮助发现隐藏模式。

数据分类:分类像给邮件贴标签,提前知道"垃圾邮件"和"正常邮件"两类。训练时用已标记的数据教会模型规则,比如"含'免费'词多属垃圾邮件"。新数据进来后,模型根据规则预测类别,比如判断新邮件是否为垃圾。分类常用于信用评分或疾病诊断,依赖明确的标签和训练数据。

注意:本站部分文字内容、图片由网友投稿,如侵权请联系删除,联系邮箱:happy56812@qq.com

相关文章
本类推荐
本类排行