数学建模——主成分分析(SPSS)
在实际问题研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?
主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。
一、主成分分析的基本原理
假定有 个样本,每个样本共有 个变量,构成一个 阶的数据矩阵 .
当 较大时,在 维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。
定义:记 为原变量指标, 为新变量指标。
注:1.
2. 是 的一切线性组合中方差最大者, 是与 不相关的 的所有线性组合中方差最大者;…; 是与 都不相关的 的所有线性组合中方差最大者.
则新变量指标 分别称为原变量指标 的第1,第2,…,第m主成分。
二、计算步骤
设有 个样品,每个样品观测 个指标,将原始数据写成矩阵.
1.将原始数据标准化。这里不妨设上边矩阵已标准化了。
2.建立变量的相关系数阵:
3.求R的特征根及相应的单位特征向量
写出主成分。
计算主成分贡献率及累计贡献率
贡献率:
累计贡献率:
一般取累计贡献率达85%~95%的特征值 所对应的第1、第2、…、第m(m≤p)个主成分。
实例:
1.导入SPSS
2.
除地区外数据导入。
将系数选中。
选中碎石图,使结果直观。
点击确认后进行计算。导出结果为:
这个矩阵反应的就是两个指标之间的关系。
这个图直接告诉我们,主成分是两个,第一主成分占比重72.205%(可以这么理解),第二主成分占比重12.346%,这两个主成分达到85.551%,超过了80%,可以说用这两个指标评价各省份的经济可以近似代替原来的10个指标。
归一化处理:
通过系数得分矩阵和归一化处理,可以得出
- 上一篇:PS怎样旋转画布
- 下一篇:PS怎么制作一段动画? ps动画效果的制作方法
评论列表