“kk体育app官网”主成分聚类分析在行业统计数据中的应用

日期:2023-11-14 01:50 | 人气:

本文摘要::改革开放以来,在高速发展的中国经济造就下,各行各业有了进步的变革。

:改革开放以来,在高速发展的中国经济造就下,各行各业有了进步的变革。当然,中国经济的发展也必不可少各行各业何谓人士的辛勤劳动。虽然每个人专门从事的行业有所不同,但是每个人也都能在自己的行业上做出自己的贡献。文章以我国31个行政单位为研究对象,使用主成分聚类分析方法,运用spss19.0版软件,针对按照行业统计资料的31个行政地区的就业人数数据对31个行政地区展开聚类分析,指出了行业就业人数与地区的经济有关。

【关键词】:行业统计资料;主成分分析法;聚类分析法中国分类号:C81文献标识码:ATheApplicationofClusteringAnalysisinIndustryStatisticalDataAbstract:SinceChina'sreformandopeningup,intherapiddevelopmentofChineseeconomy,theprogressofallwalksoflifehasaleap.Ofcourse,China'seconomicdevelopmentisinseparablefromallwalksoflifetorecognizepeople'shardwork.Althougheveryoneisengagedintheindustryisdifferent,buteveryonealsocanintheirownindustrytomakeitsowncontribution.Article31administrativeunitsinChinaastheresearchobject,usingtheprincipalcomponentclusteranalysismethodandspss19.0versionsoftware,accordingtoindustrystatisticsof31administrativeregion'semploymentdataclusteringanalysiswascarriedoutonthe31administrativeregions,suggeststhattheindustryemploymentrelatedtotheregion'seconomy.Keywords:industrystatistics,Principalcomponentanalysis,Clusteringanalysis0章节在2003年7月24日公交行业统计资料工作座谈会上,国家统计局局长李德水同志讲话中明确提出:“行业统计资料是政府统计资料的最重要组成部分。”[1],从而行业统计资料的地位和起到在此获得国家政府统计资料机构的具体和认同。因此,对我国行业统计数据运用统计资料方法展开分析具备很最重要的理论和现实意义。

1指标的挑选及分析方法1.1指标的挑选由于行业的种类多样,本文提到的是《2012年中国统计资料年鉴》[2]中有关中国31个行政单位在行业统计资料中的就业人数数据来展开整理,获得19个体现各地区行业低收入的评价指标。这些指标还包括:农、林、牧、渔业()、采矿业()、制造业()、电力、燃气及水的生产和供应业()、建筑业()、交通运输、仓储和邮政业()、信息传输、计算机服务和软件业()、杂货和零售业()、住宿和餐饮业()、金融业()、房地产业()、出租和商务服务业()、科学研究、技术服务和地质勘查业()、水利、环境和公共设施管理业()、居民服务和其他服务业()、教育()、公共卫生、社会保障和社会福利业()、文化、体育和娱乐业()、公共管理和社会的组织()[2].1.2分析方法1.2.1主成分分析法主成分分析主要是利用降维的思想,把原本众多具备一定相关性的指标(如个指标),重新组合成一组新的相互牵涉到的综合指标来替换原本的指标[3]。它借助一个正交变换,将指标数据展开标准化处置,然后再行根据指标之间的相关性判断分类,最后就是确认主成分的个数。本文就是使用主成分分析法对我国31个行政地区的行业发展水平分析。

1.2.2聚类分析法聚类分析又称作分类分析、群集分析、集群分析,是研究“物以类聚”的一种多元统计分析方法。它必要较为各研究对象之间的性质,将性质相似的不属于一类,将性质差异较小的归属于有所不同的类[4]。聚类分析分成两种:Q型聚类和R型聚类。

Q型聚类是对观测个体的分类,R型聚类是对变量的分类,两者在数学上是平面的,没本质的区别。聚类分析的方法还包括层次聚类法和非层次聚类法。层次聚类法还包括挤满法和分解成法。

非层次聚类法最常用的就是K平均数法。本文就是先对数据展开主成分分析,然后对主成分分析的结果再行展开聚类分析,使用的聚类分析方法就是K平均数法。

2主成分分析过程本文用于的是spss19.0版软件作为分析的工具。首先,调用spss软件中的分析——降维——因子分析。将19个变量依序都引入因子分析的变量板中,展开主成分分析。

通过聚类结果可以显现出,第一类有6个对象,第二类有11个对象,第三类有14个对象。第一类还包括以下行政单位:北京,上海,江苏,浙江,广东,山东。第二类还包括以下行政单位:天津,内蒙古,吉林,黑龙江,海南,贵州,西藏,甘肃,青海,宁夏,新疆。第三类还包括以下行政单位:河北,山西,辽宁,安徽,福建,江西,广西,河南,湖北,湖南,重庆,四川,云南,陕西。

根据上边的分类,第一类对象为经济比较繁盛地区,第二类对象为比较欠发达地区,第三类城市为全国一般水平地区。这三类聚类结果与实际情况不相符合,特别是在是把天津分出了第二类。这解释,不存在着小范围的误差。

但是从地区行业统计数据的聚类结果分析可以显现出,经济发展之间的差异是不存在的。4结论本文应用于spss软件融合主成分分析和聚类分析技术,对我国31个行政地区的19个行业的发展水平展开了综合分析,结果表明:我国各地区各行业人数还是受到各地区经济发展水平的影响,但是也受到其他方面因素的相互影响。


本文关键词:kk体育app官网入口,kk体育app官网

本文来源:kk体育app官网入口-www.mamaleonconcierge.com

旋转小火锅定制流程

免费咨询

提供图纸

免费设计

免费报价

无忧安装

终身维护