知识库 > 数学方法 > 多元统计分析

主成分分析    

  •     载荷矩阵:  
        基于相关系数计算
    a、对进行Z分数标准化得到,再求协方差
    b、对进行特征值分解,得到递减的特征值序列以及对应的特征向量。并依据累计贡献率选出前个特征值。
    其中最大特征根的特征向量对应第一主成分的系数向量;第二大特征根对应的特征向量是第二大主成分的系数向量

    c、载荷矩阵:

        定义:princomp (x:array,ep:Real,isStand:bool,resid:array):array;
        说明:主成分分析,isStand为0时从中心化协方差出发进行主成分分析,为1时从相关系数出发,进行主成分分析
        参数:
        x:样本数据,二维数字数组
        ep:累计方差贡献度阈值,实数,缺省时默认为0.85
        isStand:是否标准化,布尔类型,缺省时为真
        resid:残差,变参输出,二维数字数组
        返回结果:
        ret["特征值",0]:协方差矩阵的特征值信息
        ret["特征向量",0]:特征值对应的特征向量
        ret['累计贡献率',0]:累计贡献率
        ret["主成分",0]:主成分
        ret["主成分载荷",0]:主成分载荷

        例:企业经济效益主成分分析(参见平台下的Demo_Princomp函数)
        某市为了全面分析机械类各企业的经济效益,选择了8个不同的利润指标,14家企业关于这8个指标的统计数据如表所示.
    企业净产值利润率%固定资产利润率%总产值利润%销售收入利润率%产品成本利润率%物耗利润率%人均利润率千元/人流动资金利润率%
    140.424.77.26.18.38.72.4420.0
    225.012.711.211.012.920.23.5429.1
    313.23.33.94.34.45.50.5783.6
    422.36.75.63.76.07.40.1767.3
    534.311.87.17.18.08.91.72627.5
    635.612.516.416.722.829.33.01726.6
    722.07.89.910.212.617.60.84710.6
    848.413.410.99.910.913.91.77217.8
    940.619.119.819.029.739.62.44935.8
    1024.88.09.88.911.916.20.78913.7
    1112.59.74.24.24.66.50.8743.9
    121.80.60.70.70.81.10.0561.0
    1332.313.99.48.39.813.32.12617.1
    1438.59.111.39.512.216.41.32711.6

        return princomp (X,0.85,1,resid);
    返回结果:特征值:特征向量:累计贡献率:]主成分:
    主成分载荷:
        由主成分载荷矩阵,我们基本可以得出第一主成分是综合指标,第二主成分是固定资产获利指标,第三主成分是人均获利。