新闻中心

2024香港资料大全
公司地址：广州市天河区林和中路188号附楼三楼A之D08
其它地址：湖南省长沙市天心区劳动西路293号嘉盛奥美城1708室；湖北省武汉市建设大道538号同城广场A栋1202；
联系电话：13148420404
公司传真：020-29819059
办公手机：18620250304
官方网址：/
企业邮箱：[email protected]

行业动态

您当前位置：首页 > 行业动态

聚类分析的主要步骤

信息来源：发布时间：2018-3-21 浏览:

聚类分析的主要步骤

1.数据预处理，
2.为衡量数据点间的相似度定义一个距离函数，
3.聚类或分组，
4.评估输出。
数据预处理包括选择数量，类型和特征的标度，它依靠特征选择和特征抽取，特征选择选择重要的特征，特征抽取把输入的特征转化为一个新的显著特征，它们经常被用来获取一个合适的特征集来为避免“维数灾”进行聚类，数据预处理还包括将孤立点移出数据，孤立点是不依附于一般数据行为或模型的数据，因此孤立点经常会导致有偏差的聚类结果，因此为了得到正确的聚类，我们必须将它们剔除。
既然相类似性是定义一个类的基础，那么不同数据之间在同一个特征空间相似度的衡量对于聚类步骤是很重要的，由于特征类型和特征标度的多样性，距离度量必须谨慎，它经常依赖于应用，例如，通常通过定义在特征空间的距离度量来评估不同对象的相异性，很多距离度都应用在一些不同的领域，一个简单的距离度量，如Euclidean距离，经常被用作反映不同数据间的相异性，一些有关相似性的度量，例如PMC和SMC，能够被用来特征化不同数据的概念相似性，在图像聚类上，子图图像的误差更正能够被用来衡量两个图形的相似性。

相关热点

·人民币对美元汇率连续大涨对出口增长影响不大

·中国调味品市场调研及行情分析

·2018年中国3D玻璃行业市场调查与发展现状分..

·关于市场调查中的抽样概念

·出版行业市场调查发展分析

·如何书写市场调研报告？

·2018年数字营销行业市场调查与发展趋势分析

·2019-2023年增城市新兴产业市场调查及投..

·调查数据分析报告如何指导产品经理进行产品设计？

·策智市场调研公司

·租房业市场调查分析