首页 > 生活课堂 > 安全知识 > 居家安全 > SAS论文_统计分析与应用

SAS论文_统计分析与应用

文豪 收藏 投稿 点赞 分享
SAS论文_统计分析与应用

微信扫码分享

SAS

统计分析与应用

学号:xxxxxxxx

班级:xxx

姓名: xxx

word文档可自由复制编辑

目录

第一章摘要 (2)

第二章:基本介绍 (3)

2.1 研究目的 (4)

2.2 采用方法 (4)

2.3 理论知识 (4)

第三章数据预处理及具体模型 (4)

3.1 建立的数据集 (4)

3.2 主要程序. (4)

第四章计算结果及分析 (4)

4.1 使用INSIGHT 模块做主成分分析的步骤 (7)

4.2 主成分的结果分析 (7)

第五章总结分析 (8)

第六章参考文献 (8)

第七章附录 (9)

word文档可自由复制编辑

摘要

SAS 系统是世界公认的权威性统计软件之一,是一个大型集成信息分析管理系统。

本次论文是用SAS 系统对2007 各地区农村居民家庭平均每人现金现金支出状况进行分析采用的数据是北京、天津等省农村居民家庭平均每人现金现金支出状(原始数据见附录)。

选出31省的情况作为统计分析数据,其中分析的项目为:期内现金支出、生产费用支出、家庭经营费用支出、农业生产支出、牧业生产支出、购买生产性固定资产支出、税费支出、生活消费现金支出、财产性支出、转移性支出,次用变量X1、X2、X3、X4、X5、X6、X7、X8、X9 、X10。运用SAS 软件,运用主成分分析的方法对数据进行处理:

(一)对于所选取的统计数据用MEANS 过程进行简单描述统计分析,得出数据平均值、数据标准差等。

(二)对于所选取的统计数据用INSIGHT 模块做主成分分析计算协方差矩阵的特征值或是计算相关系数矩阵的特征值(Eigenvalue )、简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相关系数矩阵的特征向量。系统默认计算相关系数矩阵的特征值和特征向量。

(三)由相关系数矩阵的两个最大特征值的特征向量,可以写出第一、第二主成分以及第三主成分的得分。从以上结论分析可以知道影响各地区地区农村居民家庭平均每人现金支出的主要因素,从、可以更好的帮助国家调节国民经济和产业结构,使人民的生活更加富裕。

关键字: 主成分分析、简单统计量、相关系数矩阵、相关系数矩阵的特征值及特征向量。

word文档可自由复制编辑

二、基本介绍

1、研究目的:通过SAS 软件的分析,对各地区农村居民家庭平均每人现金支出的主要影响因素有一个大致的了解;有利于国家的宏观调控,从而可以促进全民经济更好的发展。

2、采用方法:

①描述统计量:MEANS

②检验:使用INSIGHT 模块主成分分析。

3、理论知识:

①MEANS 过程(均值过程)用于对数值型变量产生针对单个变量的简单描述性统计.proc means过程统计量参数缺省时输出N(样本数据)、Mean(数据平均值)、Std Dev(数据标准差)、Minimum (最小值)、Maximum(最大值)五种统计值,但means 过程可计算16 种统计量。

②主成份分析(Principal Components Analysis)是研究如何将多个变量指标间的问题化为较少的几个新指标问题。这些新的指标是彼此既互不相关,又能综合反映原来多个指标的信息,是原来多个指标的线性组合。多指标的主成份分析常被用来寻找判断某种事物或现象的综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地揭示事物内在的规律。这种处理问题的方法就称为主成份分析或主分量分析,综合后的新指标则称为原来指标的主成份或主分量。主分量分析还可用于揭示变量间的共线性。

三、数据预处理及具体模型:

对于数据较少的程序可以用DA TA 步创建永久SAS数据集。永久SAS 数据集,由定义逻辑库与定义数据集两个步骤完成。逻辑库定义通过

LIBNAME 语句完成,数据集定义应用DA TA 实现。

LIBNAME 语句语法格式:

LIBNAME 逻辑库名称, 子目录路径' ;

DA TA 语句语法格式:

DA TA 逻辑库名.数据集名称;

LIBNAME 语句把磁盘中的子目录与用户定义的逻辑库名连接起来。

用此种方法根据已知的数据就可以建立生成以下的数据集

3.1 建成的数据集为:

The SAS System 20:00 Tuesday, December 15, 2009

Obs area x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

1 北京5318.9 730.

2 606.4 124.2 232.5 123.7 1.9 4093.2 23.5 470.2

2 天津3267.8 1242.8 1172.9 203.

3 699.5 69.9 1.2 1896.1 6.0 121.6

3 河北2289.6 779.6 725.0 362.7 226.2 54.6 3.1 1361.7 14.9 130.3

4 山西2080.9 500.0 441.3 254.4 126.3 58.7 0.7 1431.2 4.0 145.1

5 内蒙古3338.7 1426.9 1223.5 865.7 316.

6 203.3 1.

7 1617.3 52.2 240.6

6 辽宁3926.2 1671.2 1546.2 719.9 754.5 125.0 3.8 1803.

7 38.7 408.9

7 吉林4517.7 2129.9 1836.9 1404.1 393.3 293.1 5.1 1741.0 202.9 438.7 word文档可自由复制编辑

8 黑龙江4424.6 2047.0 1812.2 1405.0 368.8 234.8 2.9 1699.1 301.8 373.9

9 上海5487.1 241.3 229.9 37.3 32.6 11.4 0.1 4616.7 1.4 627.6

10 江苏3412.9 632.1 561.8 236.1 137.5 70.3 12.8 2438.9 5.5 323.7

11 浙江5437.2 1320.2 1192.4 159.4 724.4 127.8 5.5 3587.7 23.7 500.1

12 安徽2390.0 554.9 490.7 297.2 116.7 64.2 6.0 1666.2 3.0 159.9

13 福建3026.0 626.4 566.8 251.0 208.1 59.6 0.7 2168.2 10.8 219.8

14 江西2199.8 680.6 591.7 339.7 160.4 89.0 4.5 1328.0 23.5 163.2

15 山东3060.9 969.5 842.4 423.3 314.6 127.1 5.7 1885.7 16.7 183.3

16 河南2163.8 583.9 523.9 237.1 228.8 60.0 0.6 1448.6 1.4 129.3

17 湖北2222.2 677.5 601.9 266.8 195.9 75.6 3.9 1471.3 4.6 64.8

18 湖南2418.9 555.8 497.8 196.7 175.2 58.0 3.8 1587.9 2.8 268.5

19 广东2895.2 576.3 547.4 171.3 216.3 29.0 1.7 2155.6 9.5 152.0

20 广西1900.9 697.4 589.5 348.5 187.6 107.9 2.9 1125.6 1.6 73.6

21 海南1902.8 656.1 639.2 324.3 165.4 16.9 0.3 1187.2 2.1 57.1

22 重庆1773.4 449.1 406.3 188.7 172.8 42.8 2.5 1107.3 0.9 213.5

23 四川2514.5 612.8 533.5 178.0 270.7 79.3 6.1 1669.5 7.0 219.1

24 贵州1432.8 412.5 324.7 167.7 122.2 87.7 1.4 846.3 1.0 171.6

25 云南1837.1 623.0 532.9 277.2 185.6 90.1 1.5 1089.9 6.8 115.9

26 西藏1022.3 203.9 92.3 53.2 8.8 111.5 0.2 800.7 0.1 17.5

27 陕西2261.3 580.1 442.6 240.6 128.4 137.5 3.9 1496.8 4.6 175.9

28 甘肃1622.3 473.2 391.2 298.3 74.4 82.0 0.9 1068.2 4.3 75.7

29 青海1753.8 447.9 348.0 190.1 92.5 99.8 1.7 1196.5 7.4 100.3

30 宁夏2592.8 1029.8 870.5 406.2 359.3 159.3 0.2 1325.6 31.3 205.8

31 新疆2705.0 1444.4 1109.7 813.2 236.6 334.7 1.0 1126.0 44.4 89.2

3.2、模型的具体程序:

data data1;

input area $ 1-6 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 ;

cards;

1 北京5318.9 730.

2 606.4 124.2 232.5 123.7 1.9 4093.2 23.5 470.2

2 天津3267.8 1242.8 1172.9 203.

3 699.5 69.9 1.2 1896.1 6.0 121.6

3 河北2289.6 779.6 725.0 362.7 226.2 54.6 3.1 1361.7 14.9 130.3

4 山西2080.9 500.0 441.3 254.4 126.3 58.7 0.7 1431.2 4.0 145.1

5 内蒙古3338.7 1426.9 1223.5 865.7 316.

6 203.3 1.

7 1617.3 52.2 240.6

6 辽宁3926.2 1671.2 1546.2 719.9 754.5 125.0 3.8 1803.

7 38.7 408.9

7 吉林4517.7 2129.9 1836.9 1404.1 393.3 293.1 5.1 1741.0 202.9 438.7

8 黑龙江4424.6 2047.0 1812.2 1405.0 368.8 234.8 2.9 1699.1 301.8 373.9

9 上海5487.1 241.3 229.9 37.3 32.6 11.4 0.1 4616.7 1.4 627.6

10 江苏3412.9 632.1 561.8 236.1 137.5 70.3 12.8 2438.9 5.5 323.7

11 浙江5437.2 1320.2 1192.4 159.4 724.4 127.8 5.5 3587.7 23.7 500.1

12 安徽2390.0 554.9 490.7 297.2 116.7 64.2 6.0 1666.2 3.0 159.9

13 福建3026.0 626.4 566.8 251.0 208.1 59.6 0.7 2168.2 10.8 219.8

14 江西2199.8 680.6 591.7 339.7 160.4 89.0 4.5 1328.0 23.5 163.2

15 山东3060.9 969.5 842.4 423.3 314.6 127.1 5.7 1885.7 16.7 183.3 word文档可自由复制编辑

16 河南2163.8 583.9 523.9 237.1 228.8 60.0 0.6 1448.6 1.4 129.3

17 湖北2222.2 677.5 601.9 266.8 195.9 75.6 3.9 1471.3 4.6 64.8

18 湖南2418.9 555.8 497.8 196.7 175.2 58.0 3.8 1587.9 2.8 268.5

19 广东2895.2 576.3 547.4 171.3 216.3 29.0 1.7 2155.6 9.5 152.0

20 广西1900.9 697.4 589.5 348.5 187.6 107.9 2.9 1125.6 1.6 73.6

21 海南1902.8 656.1 639.2 324.3 165.4 16.9 0.3 1187.2 2.1 57.1

22 重庆1773.4 449.1 406.3 188.7 172.8 42.8 2.5 1107.3 0.9 213.5

23 四川2514.5 612.8 533.5 178.0 270.7 79.3 6.1 1669.5 7.0 219.1

24 贵州1432.8 412.5 324.7 167.7 122.2 87.7 1.4 846.3 1.0 171.6

25 云南1837.1 623.0 532.9 277.2 185.6 90.1 1.5 1089.9 6.8 115.9

26 西藏1022.3 203.9 92.3 53.2 8.8 111.5 0.2 800.7 0.1 17.5

27 陕西2261.3 580.1 442.6 240.6 128.4 137.5 3.9 1496.8 4.6 175.9

28 甘肃1622.3 473.2 391.2 298.3 74.4 82.0 0.9 1068.2 4.3 75.7

29 青海1753.8 447.9 348.0 190.1 92.5 99.8 1.7 1196.5 7.4 100.3

30 宁夏2592.8 1029.8 870.5 406.2 359.3 159.3 0.2 1325.6 31.3 205.8

31 新疆2705.0 1444.4 1109.7 813.2 236.6 334.7 1.0 1126.0 44.4 89.2

run;

proc print;

run;

四、运行结果及分析

1. 使用INSIGHT 模块做主成分分析的步骤

使用INSIGHT 模块做主成分分析的步骤如下:

1) 在INSIGHT模块中打开数据集L.jjzb;选择菜单“Analyze”?“Multivariate(Y X)(多元分析)”,打开“Multivariate(Y X)”对话框;

2) 将做主成分分析的变量x 1~x10为Y 变量,将变量area 选为Label 变量。

3) 单击“Method”按钮,在打开的对话框中可以选择计算协方差矩阵的特征值或是计算相关系数矩阵的特征值。系统默认计算相关系数矩阵的特征值和特征向量,单击“OK”按钮返回。

图1

图2

word文档可自由复制编辑

3

4)单击“Output”按钮,在打开的对话框中包括“Descriptive Statistics”选项、“Bivariate

5)Plots”选项以及各种多元分析的选项。选中“Principal

ComponentAnalysis”复选框,单击下面的“Principal Component Options”按钮,打开“Principal Component Options”对话框,选中“Eigenvectors”复选框,取“Correlations(Structure)”

复选框。

2. 主成分的结果分析

输出的数字分析结果有4 个部分:简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相关系数矩阵的特征向量。

图4

图5

word文档可自由复制编辑

图6

五、结果分析

通过用主成分分析的方法对给定的2007年上半年的各地区农村居民家庭平均每人现金支出数据的分析,可以知道影响各地区农村居民家庭平均每人现金支出的主要因素是影响各地区农村居民家庭平均每人现金支出的主要因素是期内现金现金支出、工资性现金支出、财产性现金支出和转移性现金支出;其次是家庭经营现金支出、农业现金支出和牧业现金支出,最后是林业现金支出和渔业现金支出,知道这些主要因素的影响,可以更好的帮助国家调节国民经济和产业结构,使人民的生活更加富裕。

六、参考文献

[1]黄燕,SAS 统计分析及应用.机械工业出版社.2006

[2]何宁.统计分析系统SAS.武汉大学出版.2005

[3]薛富.SAS8.2 统计应用教程.北京希望电子出版社2007

word文档可自由复制编辑

七、附录:

地区农村居民家庭平均每人现金支出(2009年上半年)

单位:元期内

现金生产税费生活财产

性转移性

地区支出费用家庭购买生支出消费支出支出支出经营农业牧业产性固现金

费用生产生产定资产支出

支出支出支出支出

合计2631 777.4 678.2 348.3 231.3 99.2 3.4 1633.8 22.9 193.6

北京5318.9 730.2 606.4 124.2 232.5 123.7 1.9 4093.2 23.5 470.2 天津3267.8 1242.8 1172.9 203.3 699.5 69.9 1.2 1896.1 6 121.6

河北2289.6 779.6 725 362.7 226.2 54.6 3.1 1361.7 14.9 130.3 山西2080.9 500 441.3 254.4 126.3 58.7 0.7 1431.2 4 145.1 内蒙古3338.7 1426.9 1223.5 865.7 316.6 203.3 1.7 1617.3 52.2 240.6 辽宁3926.2 1671.2 1546.2 719.9 754.5 125 3.8 1803.7 38.7 408.9 吉林4517.7 2129.9 1836.9 1404.1 393.3 293.1 5.1 1741 202.9 438.7 黑龙江4424.6 2047 1812.2 1405 368.8 234.8 2.9 1699.1 301.8 373.9 上海5487.1 241.3 229.9 37.3 32.6 11.4 0.1 4616.7 1.4 627.6 江苏3412.9 632.1 561.8 236.1 137.5 70.3 12.8 2438.9 5.5 323.7 浙江5437.2 1320.2 1192.4 159.4 724.4 127.8 5.5 3587.7 23.7 500.1 安徽2390 554.9 490.7 297.2 116.7 64.2 6 1666.2 3 159.9 福建3026 626.4 566.8 251 208.1 59.6 0.7 2168.2 10.8 219.8 江西2199.8 680.6 591.7 339.7 160.4 89 4.5 1328 23.5 163.2 山东3060.9 969.5 842.4 423.3 314.6 127.1 5.7 1885.7 16.7 183.3 河南2163.8 583.9 523.9 237.1 228.8 60 0.6 1448.6 1.4 129.3 湖北2222.2 677.5 601.9 266.8 195.9 75.6 3.9 1471.3 4.6 64.8 湖南2418.9 555.8 497.8 196.7 175.2 58 3.8 1587.9 2.8 268.5 广东2895.2 576.3 547.4 171.3 216.3 29 1.7 2155.6 9.5 152 广西1900.9 697.4 589.5 348.5 187.6 107.9 2.9 1125.6 1.6 73.6 海南1902.8 656.1 639.2 324.3 165.4 16.9 0.3 1187.2 2.1 57.1 重庆1773.4 449.1 406.3 188.7 172.8 42.8 2.5 1107.3 0.9 213.5 四川2514.5 612.8 533.5 178 270.7 79.3 6.1 1669.5 7 219.1 贵州1432.8 412.5 324.7 167.7 122.2 87.7 1.4 846.3 1 171.6 云南1837.1 623 532.9 277.2 185.6 90.1 1.5 1089.9 6.8 115.9 西藏1022.3 203.9 92.3 53.2 8.8 111.5 0.2 800.7 0.1 17.5 陕西2261.3 580.1 442.6 240.6 128.4 137.5 3.9 1496.8 4.6 175.9 甘肃1622.3 473.2 391.2 298.3 74.4 82 0.9 1068.2 4.3 75.7

word文档可自由复制编辑

青海1753.8 447.9 348 190.1 92.5 99.8 1.7 1196.5 7.4 100.3 宁夏2592.8 1029.8 870.5 406.2 359.3 159.3 0.2 1325.6 31.3 205.8 新疆2705 1444.4 1109.7 813.2 236.6 334.7 1 1126 44.4 89.2

word文档可自由复制编辑

SAS论文_统计分析与应用相关文章:

SAS论文_统计分析与应用

221381
领取福利

微信扫码领取福利

SAS论文_统计分析与应用

微信扫码分享https://www.jinbitou.cn/shenghuoketang/anquanzhishi/jujiaanquan/109331.html