k-means算法,也被称为k-平均或k-均值,是数据挖掘技术中一种广泛使用的聚类算法。 它是将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,算法的主要思想是通过迭代过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优,从而使生成的每个聚类内紧凑,类间独立。
数据挖掘起源于 1989 年 8 月,美国底特律举办的第 11 届国际联合人工 智能学术会议中 Piatetsky·Sharpiro 提出的 KDD。从技术上来说,数据挖掘是一门交叉学科,融合了统计学、人工智能、模式识别、机器学习等内容。
聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分为若干组,划分的原则是组内距离最小化而组间距离最大化。
首先我们要认识到区域经济发展差异的普遍性,如果区域经济发展差距过大得不到及时控制,将会造成发达地区的资源过度集中,而经济落后的地区,由于资源流向了发达地区,落后地区的经济发展不能保障,会导致落后地区经济进一步衰退或者增长比较缓慢。