欢迎访问吾小秘【www.wxiaomi.cn】,您身边的文字小秘书!

spss实习报告

时间:

spss实习报告共6篇(统计学spss实训报告)

  下面是范文网小编分享的spss实习报告共6篇(统计学spss实训报告),供大家品鉴。

spss实习报告共6篇(统计学spss实训报告)

spss实习报告共1

  SPSS实验报告二

  实验目的:掌握方差分析、相关分析和回归分析的基本操作;掌握其中相关的问题检验;读懂输出结果并进行合理分析。

  第一题:利用外来工数据,使用多因素方差分析研究教育程度和月收入对家庭花费(V2_2c),

(1)说明两个因素的影响是否显著,有没有显著的交互作用;

(2)如果因素影响显著而交互作用不显著,建立非饱和模型,并利用多重比较比较(snk)各因素水平的高低;

  第二题:应用数据,研究固体垃圾排放量与宾馆、餐饮业用地、零售业用地、运输、批发企业用地、金属制造业用地、工业企业用地的关系。

(1)、通过散点图观察变量间的相关关系,并使用Enter建立模型,判断各自变量间是否存在多重共线性,写出回归方程,说明T检验和F检验的结果

(2)、利用Stepwise建立模型,通过计算D-W统计量和作出残差分布图、pp图等方法初步判断是否存在序列相关、异方差和正态性,保存模型的预测值。

  第三题:完成P283,例题9-3,画出外出就餐和年份的散点图,利用复合函数,指数函数和三次函数进行拟合,选择最好的拟合模型,写出曲线方程,并对之后两年年的数据进行预测。

spss实习报告共2

  广东海洋大学

  统计分析与SPSS的应用实习报告

  学院(系) 专业名称 使用班级 实习地点 起止时间

  姓名:班级:

  学号:

  统计分析与SPSS的应用实习报告

  学院(系)

  学生姓名

  学号 专业实习地点 班级

  实习要求:

1、掌握SPSS 软件使用基础;

2、熟练使用 SPSS 进行描述统计、频数分析;

3、使用SPSS进行参数估计,假设检验;

4、使用SPSS进行方差分析;

5、使用SPSS进行相关分析——包括相关图和相关系数;

6、使用SPSS进行一般的回归分析——理解模型的选定、估计、系数及方程的显著性检验、简单的残差分析、预测。

  实习目的:

  本课程从加强基础、培养学生动手能力、提高素质的教学目标出发,建立一个科学的、合理的统计分析与SPSS的应用这一实验教学课程体系。使学生通过本课程实验教学,不只是加深理解和巩固所学理论知识,而且更能切实掌握各种统计分析方法在统计软件SPSS中的实现,并能正确解释SPSS的运行结果。在实验教学中,同时加强对学生进行科学素质和良好的实验室工作习惯的训练,培养学生的时间意识,为培养具有创新精神和实践能力的高素质人才奠定良好的基础。

  实习时间:

  实习地点:

  实习内容:(对实习过程的描述)

  实习体会:

  成绩指导教师

  日期 第页,共页注:请用A4纸书写,不够另附纸。

※ 打印时删除后面的内容

  实习报告撰写的要求

(一)实习报告内容组成:实习报告应包括题目和正文两方面内容。

(二)实习报告撰写内容要求

1、题目:实习报告题目应该简短、明确、有概括性;字数要适当。如有特殊要求,可

  加注副标题。

2、正文:正文一般包括序言、实习内容与过程、实习心得体会与收获几部分组成。

(三)实习报告撰写规范

1、实习报告按规定要求,用计算机打印。汉字必须使用国家公布的规范字。纸张选用A4。

2、使用计算机完成实习报告,必须按照如下统一格式打印:(1)封页内容一律按照统一封面的样张式样打印,必须正确无误。(2)题目和标题:①实习报告题目为3号黑体字,可以分为1或2行居中打印。②题目下空二行为实习报告正文。(3)标题:一级标题以三号字黑体居中打印;副标题以四号黑体左起空二格打印。(4)正文:采用小四号宋体字打印。

(四)实习报告的装订:实习报告必须按规定的要求进行装订,装订顺序为:第一页:封面,第二页:题目、正文

spss实习报告共3

  SPSS的基本统计功能

1、数据的预处理

2、描述性统计和探索性统计

3、假设检验(包括参数检验、非参数检验等)

4、方差分析(包括一般的方差分析和多元方差分析)

5、相关分析

6、回归分析

7、多元统计分析,包括聚类分析、判别分析、因子分析、对应分析、主成分分析等

8、时间序列分析

9、信度分析

10、数据挖掘:决策树与神经网络

  SPSS 统计分析的一般步骤

1、建立SPSS数据文件: 在【变量视图】定义SPSS数据文件的结构,在【数据视图】进行录入数据文件的录入。

2、SPSS数据的管理数据的预处理

  集中于【数据】和【转换】两个菜单项。

3、SPSS数据的统计分析阶段

: 在【分析】菜单中选择正确的统计方法。

4、SPSS分析结果的阅读和解释

: 读懂SPSS输出窗口中的分析结果

5、明确其统计含义,并结合背景知识做出合理的解释。

  第2章 SPSS统计分析前的准备

一、SPSS数据文件的特点

1、SPSS数据文件是一种有结构的数据文件(一般文本文件仅有纯数据部分,而没有关于结构的描述);

2、由数据的结构和内容两部分构成;

3、其中数据的结构记录数据类型、取值说明、数据缺失等必要信息(在【变量视图】,每一列大家都要明白你在定义什么,有什么用);

4、数据的内容是那些待分析的具体数据;

5、在【数据视图】每一列代表一个变量(variable),变量名显示在表格顶部;

6、在【数据视图】的每一行代表一个记录(case)(即一个案例,或称一个对象、一个观察、一个个体) ,记录序号显示在表格的左侧;

7、在【数据视图】可以输入和编辑数据,但是不能输入数学表达式和函数

二、定义变量

1、【数据视图】是进行数据输入、数据编辑的界面,对应的表格用于查看、录入和修改数据。

2、【变量视图】 是定义数据文件的变量的界面,对应的表格用于输入和修改变量的定义。

3、用SPSS读取其他格式的数据:

  1)数据文件:*。sav

  语法文件:*。sps 结果文件:*。spo

  脚本文件: *。sbs 2)文件-打开-数据,可打开多种文件类型(。sav、。xls、。dbf、。txt、。dat等)

  注:要想顺利打开txt文档,txt文档最好有固定的分隔符,如一个空格或一个逗号等。

三、数据的编辑

  在SPSS中,数据文件的编辑、整理等功能被集中在了【数据】和【转换】两个菜单项中:

1、数据的增删、复制、剪切、粘贴;

2、数据的排序,Sort Cases排序便于数据的浏览,快捷找到最大值或最小值,迅速发现数据的异常值;

四、文件的拆分:文件的拆分相当于统计学中的数据分组,即将数据按一个或几个分组变量分组。

五、数据选取

  数据选取(个案选取)的基本方式

  按指定条件选取(If condition is satisfied )

  随机抽样(Random sample of cases) 选取某一区域内 (Based on time or case range)

六、个案加权:记录加权是对观测数据赋以权重,常用于频数表资料;

七、文件的合并:合并文件是指将外部数据中的记录或变量合并到当前的数据文件中去。合并数据文件包括两种方式:

  从外部数据文件增加记录到当前数据文件中——纵向合并或称追加记录。 从外部数据文件增加变量到当前数据文件中——横向合并或称追加变量。

八、变量的计算和变换:【转换】-【计算变量】

九、数据的重新编码recode 统计分组

  将字符型变量转换为数值型变量 将几个小类别合为一个类别 将数值型变量转换为字符型

十、统计结果的保存为word文件:【文件】-【导出】

  第3章

  SPSS描述性统计

(频率)过程的特色是产生频数表;功能 产生频数分布表;

  绘制条形图、饼图、直方图;

  计算集中趋势与离散程度、分布形状(峰度和偏度的意义)等统计量; 按要求给出分位数;

  对数据的分布趋势进行初步分析

(注:对于定性变量来说,一般来说产生频数分布表,制作条形图,饼图即可);

2.描述分析( Descriptives过程 )

  适用的分析对象:定量变量,测度为scale。 功能:

  调用此过程对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等; 并可将原始数据转换成Z分数((原始值-均值)/标准差)。

(探索)过程用于对数据概况不清时的探索性分析,定量变量; 在一般描述性统计分析的基础上,增加有关数据其他特征的文字与图形描述。 提供茎叶图、箱线图、PP图、QQ图等;

  指出异常值(Outliers) ,可检查数据是否有错误,剔除异常值和错误数据; 进行点估计和区间估计,计算均值的置信区间,; 检验一组数据是否呈正态分布; 4.列联表分析

(1)列联表分析的适用条件

  对一个定量变量的描述和分析,一般用频数分析(频数分布表、饼图、直方图、条形图); 对两个定性变量的描述和分析,通常使用列联表、对应分析,或使用卡方检验; 对两个以上定性变量的描述和分析,通常使用高维列联表。 (2)期望频数的分布

  如果行变量和列变量是独立的,可以计算出列联表中每个格子里的频数应该是多少,称为期望频数;

(3)列联表分析的基本思路

  检验列联表中的行变量与列变量之间是否独立(或是否相关)。 原假设为行变量与列变量之间独立(或不相关)。 比较观察频数与期望频数的差。

  如果两者的差越大,表明实际情况与原假设相去甚远;如果差越小,表明实际情况与原假设越相近。

  对于这个假设的检验,可以采用卡方分布,进行卡方检验。

(4)列联表分析的步骤

  检验列联表中的行变量与列变量之间是否独立(是否相关) 提出假设

  H0:行变量与列变量独立(不相关) H1:行变量与列变量不独立(相关 计算检验的统计量 统计决策

  进行决策:P值决策

  P

  所有单元的期望频数应该大于1,或不应有大量的期望频数小于5的单元格。

  如果列联表中有20%以上的单元格中的期望频数小于5,则一般不宜用卡方检验。 Pearson卡方检验最普遍

  第4章

  SPSS的均值比较过程 1。 Means过程

  对准备比较的各组计算描述指标,进行预分析,也可直接比较,定量变量。 (1)Means过程是专门计算各种平均数,并对平均数进行简单比较的; (2)虽然Descriptive Statistics(描述统计)菜单项中的几个过程也能计算均数,但Means过程的输出结果是将各组的描述指标放在一起的,便于相互比较;

(3)Means过程必须设置分组变量,若没有分组变量的话,可以使用Descriptive Statistics菜单项中的几个过程。

(4)适用于测度水平为SCALE的变量。

  2。 单样本T检验 (1)目的

  检验某变量的总体均值与指定的检验值之间是否存在显著差异。 (2)适用条件

  样本来自的总体服从正态分布 (3)基本步骤

  H0: μ=μ0 H1: μ≠μ0

  构造检验统计量 统计决策

  如果P值α,接受原假设;

  3。

  独立样本T 检验 (1)目的

  通过比较两个样本均值差的大小来确定两个总体的均值是否相等。 (2)适用条件

  独立性:两个样本相互独立,且均为大样本;

  正态性:如果两个样本相互独立但都是小样本,或有一个样本是小样本,则要求总体服从正态分布;

  方差齐性

(3)基本步骤

  a、方差齐性F检验

  原假设:两个总体方差相等; 备则假设:两个总体方差不相等;

  P值

  H1: μ1≠μ2 c、统计决策

  在SPSS中进行两独立样本t检验时,应首先对F检验作判断。如果方差相等,观察分析结果中Equal variances aumed列的t检验相伴概率值;如果方差不相等,观察Equal variances not aumed列的t检验相伴概率值。 如果P值α,不能拒绝原假设;

4.配对样本的T 检验

  配对样本是指对同一样本的某个变量进行前后两次测试所获得的两组数据,或是对两个完全相同的样本在不同条件下进行测试所获得的两组数据。 其差别在于抽样不是相互独立的,而是互相关联的。 (1)配对样本通常有两个特征: 第一, 两组样本的样本数相同;

  第二, 两个样本记录的先后顺序一一对应,不能随意更改。 (2)适用条件

  两样本数据必须两两配对 两总体服从正态分布

  配对样本的录入方式是:每对数据在同一个case的两个配对的变量上 (3)检验步骤 a、提出假设 H0: μ1=μ2

  H1: μ1≠μ2 b、统计决策

  如果P值α,不能拒绝原假设;

  第5章 方差分析

  如何对一个或两个总体的均值进行检验,我们可以用均值比较,如果要讨论多个总体均值是否相等,我们所采用的方法是方差分析。

  方差分析中有以下几个重要概念。 (1)因素(Factor):是指所要研究的变量,它可能对因变量产生影响。如果方差分析只针对一个因素进行,称为单因素方差分析。如果同时针对多个因素进行,称为多因素方差分析。

(2)水平(Level):水平指因素的具体表现,如销售的四种方式就是因素的不同取值等级。

(3)单元(Cell):指因素水平之间的组合。 (4)元素(Element):指用于测量因变量的最小单位。一个单元里可以只有一个元素,也可以有多个元素。

(5)交互作用(Interaction):如果一个因素的效应大小在另一个因素不同水平下明显不同,则称两因素间存在交互作用。

1.单因素方差分析

  单因素方差分析也叫一维方差分析,它用来研究一个因素的不同水平是否对观测变量产生了显著影响,即检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。 (1)适用条件

  在各个水平之下观察对象是独立随机抽样,即独立性;

  各个水平的因变量服从正态分布,即正态性;

  各个水平下的总体具有相同的方差,即方差齐性; (2)基本原理

  SST(总的离差平方和)=SSA(组间离差平方和)+SSE(组内离差平方和)

  如果在总的离差平方和中,组间离差平方和所占比例较大,说明观测变量的变动主要是由因素的不同水平引起的,可以主要由因素的变动来解释,系统性差异给观测变量带来了显著影响;反之,如果组间离差平方和所占比例很小,说明观测变量的变动主要由随机变量因素引起的。

  SPSS将自动计算检验统计量和相伴概率P值,若P

  另外,SPSS还提供了多重比较方法,多重比较是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异,最常用的多重比较方法是LSD。 (3)检验步骤 a、提出假设

  H0: 各个总体的均值无显著性差异。

  H1: 各个总体的均值有显著性差异。 b、统计决策

  方差齐性检验结果,P值>0。05,方差齐,否则,方差不齐;

  单因素方差分析表,P值>α,接受H0,都则,拒绝H0,接受H1。

2.多因素方差分析

  多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。它不仅能够分析多个因素对观测变量的独立影响,更能够分析多个因素的交互作用能否对观测变量产生显著影响。 (2)基本原理

  由于多因素方差分析中观察变量不仅要受到多个因素独立作用的影响,而且因素其交互作用和一些随机因素都会对变量产生影响。因此观测变量值的波动要受到多个控制变量独立作用、控制变量交互作用及随机因素等三方面的影响。以两个因素为例,可以表示为:

  Q总=Q控1+Q控2+Q控1控2+Q随其中,Q表示各部分对应的离差平方和。多因素方差分析比较

  Q

  控

1、

  Q 控

2、

  Q 控 1 控

  Q

  随

  占 Q

  总 的比例,以此推断不同因素以及因素之间的交互作用

2、是否给观测变量带来显著影响。

(3)基本术语

  a、Dependent Variable 观测变量或因变量 主要指研究中的定量变量

  如:移动话费、学生成绩、销售量、亩产量等

  b、Fixed Factor 固定效应因素,固定因素,控制因素

  主要指研究中的定性变量

  如:资费等级、客户类型、漫游类型、促销策略等 c、Random Factor 随机效应因素、随机因素

  人为无法对其水平值进行准确控制,只是能够直观观测到

  如:话费水平、收入水平、消费习惯等

  d、Interaction 交互作用、交互效应

  如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。

  当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须分另一个因素的不同水平研究该因素的作用大小。例如:饮食习惯、适量运动对减肥的作用; e、main effect 与交互效应相对应的

  主效应就是每个因素对因变量的单独影响(main effect) f、Covariates 协变量

  指对应变量可能有影响,需要在分析时对其作用加以控制的连续性定量变量 当模型中存在协变量时,一般是通过找出它与因变量的回归关系来控制其影响 (3)应用条件

  等方差;

  各样本的独立性:只有各样本为相互独立的随机样本,才能保证变异的可加性(可分解性);

  正态性:即所有观察值系从正态总体中抽样得出; (4)基本步骤

  提出假设

  H0:因素A中的r个水平的均值相等(因素A 对因变量无显著性影响) H1:因素A中的r个水平的均值不全相等(因素A 对因变量有显著性影响) 统计决断 P值检验法

  依次查看各F值的P值, p-值

  第6章

  非参数检验

  非参数检验(nonparametric test) ,又称为任意分布检验(distribution-free test); 不依赖于总体的分布类型,对样本所来自总体的分布不作严格假定的统计推断方法,称为非参数检验(nonparametric test)

  它不考虑研究对象总体分布的具体形式,也不对总体参数进行统计推断;

  而是通过检验样本所代表的总体分布位置及分布形状是否一致来得出统计结论。 特点

  参数检验条件不满足时的处理方法

  不对均数等参数检验,而是检验分布是否相同

  在总体分布未知的情况下,利用样本数据对总体的分布形态进行推断。 非参数检验的着眼点不是总体参数,而是总体的分布情况 非参数检验研究目标总体的分布是否与已知理论分布相同 非参数检验研究各样本所在总体的分布位置,形状是否相同 优点

  第一,具有较好的稳健性;

  第二,受限条件少:对数据要求不像参数检验那样严格

  第三,适用范围广:可应用于各种不同的情况,不受总体分布形状的限制,适合处理无法精确数量化的定性数据和小样本数据 第四,计算通常较简单,且容易理解 缺点

  第一,将定量数据转换为定性数据时,漏失了数据的一些信息

  第二,检验的敏感度和效果,均不如参数检验好。 检验效率低于参数检验,主要是犯第二类错误的可能性加大。

  第三,参数检验适用的数据,非参数方法会降低检验效能;当数据满足参数检验条件时,效能低于参数法,不满足参数法条件时,处于“优势” 非参数检验的应用场合

  定量数据,不满足参数检验的条件,且无适当的变量变换方法解决此问题; 定量数据,其分布类型无法获知,且为小样本; 定量数据,极度偏态,或个别数值偏离过大; 各组离散度相差悬殊

  一端或两端存在不确定数值的定量数据

  定序数据,比较各组间等级强度的差别; 非参数检验的主要方法 单个样本的非参数检验

  卡方检验( Chi-Square过程)

  二项检验( Binomial过程)

  游程检验( Runs过程)

  柯尔莫哥洛夫—斯米诺夫检验(l-Sample K-S过程) 两个独立样本的非参数检验 多个独立样本的非参数检验 两个配对样本的非参数检验 多个配对样本的非参数检验 顺序统计量

  通过对数据从小到大的排序(即排队),并由数据的大小排序号(排队号)代替原始数据进行统计分析。

  秩(Rank) :排序号(排队号)在统计学上称为秩

  结(ties):绝对值相等称为结,又称同秩,则取平均秩次。

  一般来说,秩就是该组数据按照升序排列之后,每个数据的位置。

1.单个样本的非参数检验 卡方检验( Chi-Square过程)

  用卡方检验来检验定性变量的几个取值(分类数据,或类别)所占比例是否和理论的比例没有统计学差异。 检验分类变量的分布

  适合于定性数据及频数资料的分析

  要求样本足够大,要求样本容量一般大于50; 应用领域

  如病人经治疗后治愈、好转、有效和无效的人数总的说来是否相同(实为治愈、好转、有效和无效的概率或机会是否相同) 成绩优、良、中、差的学生人数是否相同 赞同某种观点的人数是否达到80%,等等。

  比如在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 Chi-Square检验的基本思路

  先按照已知总体的构成比例分布,计算出样本中定性数据(即各类别)的期望频数然后求出观测频数和期望频数的差值,最后计算出卡方统计量 利用卡方分布求出P值,假设检验的H0是样本中某指标的比例与已知比例一致 得出检验结论

2.二项检验( Binomial过程) 检验二项分类变量分布

  用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。

  binomial过程对二项分类变量的单个样本作检验,推断总体中两个分类数据的比例是否分别为π和(1-π) 应用领域

  射击时,击中与未击中;学生成绩,及格与不及格;疾病诊断,阴性与阳性;硬币,正面与反面;人群性别,男和女;产品质量,合格和不合格 定量数据、符号检验(SING TEST)与Binomial过程

  定量数据:大样本;或小样本,总体服从正态分布,总体方差已知; 参数检验:单个样本的均值检验

  定量数据,不满足参数检验的条件,且无适当的变量变换方法解决此问题;

  极度偏态,或个别数值偏离过大;

  一端或两端存在不确定数值

3.游程检验( Runs过程)

  Runs过程借助样本序列的顺序推断总体序列的顺序是否是随机的,属随机性检验 二分类数据和定量数据(连续数据)均可

  对于一个取两个值的分类变量,游程检验方法是检验这两个值的出现是否是随机的。 游程检验还可以用于某个连续变量的取值小于某个值及大于该值的个数(类似于0和1的个数)是否随机的问题 游程检验的作用

1、检验总体分布是否相同

  将从两个总体中独立抽取的两个样本的观察值混合后,观察游程个数,进行比较。

2、检验样本的随机性

  将取自某一总体的样本的观察值按从小到大顺序排列,找出中位数,分为大于中位数的小于中位数的两个部分。用上下交错形成的游程个数来检验样本是否是随机的。 应用范围

  生产过程是否需要调整,即不合格产品是否随机产生; 奖券的购买是否随机;

  期货价格的变化是否随机等等。

  若事物的发生并非随机,即有某种规律,则往往可寻找规律,建立相应模型,进行分析,作出适宜的决策。

  当样本按某种顺序排列(如按抽取时间先后排列)时,一个或者一个以上相同符号连续出现的段,就被称作游程 ;

4.(l-Sample K-S过程)

  柯尔莫诺夫-斯米尔诺夫检验,考察某个连续性变量是否符合理论分布 利用样本数据推断总体是否服从某种分布

  可以检验的分布有正态分布、均匀分布、Poiion分布和指数分布。 数据要求:定量数据,Scale

  5。

  独立样本的非参数检

  检验两个或多个独立样本所在总体是否相同

  在不了解总体分布的情况下,通过分析样本数据均值或中位数的差异,推断样本来自的两/多个独立总体的分布存在的显著性差异。

  2 Independent Samples过程:主要用于检验两个独立样本所在总体分布是否相同 K Independent Samples过程:主要用于检验多个独立样本所在总体分布是否相同 界面上基本相同

(1)两个独立样本的非参数检验

  含义:由样本数据,推断两个独立总体的分布是否存在显著差异(或两样本是否来自同一总体) 分析对象:定量数据或定序数据 对分布的形状不加考虑

  分布形状相同或类似的两个总体分布位置比较,可以简化地理解为两总体中位数的比较 应用范围

  两种训练方法中哪一种更出成绩 两种汽 油中哪一个污染更少 两种市场营销策略中那种更有效

  与独立样本t检验的区别

  对于定量数据,如果方差相等,且服从正态分布

  两个独立样本的非参数检验的过程

  定序数据;对于定量数据,不满足两个独立样本t检验的条件

  曼-惠特尼U检验( Mann-Whitney U )

  为检验两总体的中位数是否相等,常用Mann-Whitney U 检验,或称Wilcoxon秩和检验(Wilcoxon rank sum test) ;

  这两种方法是独立提出的,检验结果完全等价的; 分析步骤

  建立检验假设,确定显著性水平α :

  H0:两个总体的分布位置相同,即高中生和大学生的每周平均上网时间的总体分布相同;

  H1:两个总体的分布位置不同,即高中生和大学生的每周平均上网时间的总体分布不同。 或:

  H0:M1=M2;

  H1:M1>M2

2、编秩,将两组数据由小到大统一编秩,编秩时如遇有相同数据,取平均秩次。

3、求秩和,两组秩次分别相加。

4、确定统计量

  若两组样本容量相等,则任取一组的秩和为统计量;

  若两组样本容量不等,则以样本样本容量较小者对应的秩和为统计量。

5、查表确定P值,作出推断结论。 若P>α,不能拒绝原假设。

  若则P

(2)多独立样本非参数检验

  对三个或三个以上的总体的均值是否相等进行检验,使用的方法是单因素方差分析 ; 单因素方差分析过程需要假定条件,F检验才有效; 有时候所采集的数据常常不能满足这些条件, K Independent Samples过程 K Independent Samples过程

  含义:由样本数据,推断多个独立总体的分布是否存在显著差异(或多个样本是否来自同一总体) 分析对象:定量数据或定序数据 对分布的形状不加考虑

  分布形状相同或类似的多个总体分布位置比较,可以简化地理解为多个总体中位数的比较。 应用范围

  各城市儿童身高分布一致吗?

  不同收入的居民存(取)款金额分布一致吗?

  电信公司人力资源部门比较3所大学雇员的管理业绩是否存在差异? 检验方法

  Kruskal-Wallis H :克鲁斯卡尔-沃利斯单因素方差分析最常用,原理同Wilcoxon检验 多个样本间的两两比较 多组独立样本;

  每组5个观察值,样本量小,分布类型未知;

  考虑采用秩转换的非参数检验方法——Kruskal-Wallis秩和检验。

(3)两/多个配对样本非参数检验

  检验两个或多个配对样本所在总体位置是否相同

  在不了解总体分布的情况下,通过分析两/多个配对样本,推断样本来自的两/多个总体的分布是否存在显著性差异。

  2 Related Samples过程:主要用于检验两个配对样本所在总体分布是否相同 K Related Samples过程:主要用于检验多个配对样本所在总体分布是否相同 界面上基本相同

  两个配对样本的非参数检验

  含义:由样本数据推断两配对总体分布是否存在显著差异。 数据要求

  两组配对的样本数据;

  两组数据的样本容量相同,先后次序不能任意改变,一一对应; 统计分析步骤

  提出基本假设

  H0:两配对总体分布无显著差异 H1:两配对总体分布有显著差异 统计决断

  P值>α,不能拒绝原假设

  P值

  多个配对样本非参数检验

  含义:由样本数据推断多个配对总体分布是否存在显著差异。

  数据要求:多组配对的样本数据,多组数据的样本容量相同,先后次序不能任意改变,一一对应; 应用范围

  三种促销形式的销售额分布一致吗? 收集乘客对多家航空公司是否满意的数据,分析航空公司的服务水平是否存在显著差异 评委打分一致吗? 三种检验方法

  Friedman M检验:最常用

  Kendall W检验 :和谐系数检验

  Cochran Q:要求样本数据为二分类数据(1-满意

  0-不满意) 检验方法的选择

  1)单个样本:若来自正态总体,可用t检验,若来自非正态总体或总体分布无法确定, 可用二项检验(二项检验) 2) 配对样本:

  二分类变量,可用McNemar检验;

  连续型变量,若来自正态总体,可用配对t检验, 否则可用Wilcoxon符号秩和检验。

  3) 两组独立样本:连续型变量,若来自正态总体,可用t检验,否则,可用 Wilcoxon秩和检验;

  二分类变量或无序多分类变量,可用卡方检验;

  有序多分类变量,宜用Wilcoxon秩和检验。 4) 多组独立样本

  连续型变量值,来自正态总体且方差相等,可用方差分析;否则,进行数据变换使其满足正态性或方差齐的要求后,采用方差分析;数据变换仍不能满足条件时,可用Kruskal-Wallis秩和检验。

  二分类变量或无序多分类变量,可用卡方检验。

  有序多分类变量宜用Kruskal-Wallis秩和检验。

  第7章 相关分析 概念

  相关关系反映出变量之间虽然相互影响,具有依存关系,但彼此之间是不能一一对应的。例如,学生成绩与其智力因素、各科学习成绩之间的关系、教育投资额与经济发展水平的关系、社会环境与人民健康的关系等等,都反映出客观现象中存在的相关关系。 相关关系的类型

  1)根据相关程度的不同,相关关系可分为完全相关、不完全相关和无相关。 2)根据变量值变动方向的趋势,相关关系可分为正相关和负相关。 3)根据变量关系的形态,相关关系可分为直线相关和曲线相关。 4)根据研究变量的多少,可分为单相关、复相关。 相关分析的作用

  1)判断变量之间有无联系

  2)确定选择相关关系的表现形式及相关分析方法 3)把握相关关系的方向与密切程度

  4)相关分析不但可以描述变量之间的关系状况,而且用来进行预测。 5)相关分析还可以用来评价测量量具的信度、效度以及项目的区分度等 相关系数

  相关系数是在直线相关条件下,说明两个变量之间相关程度以及相关方向的统计分析指标。相关系数一般可以通过计算得到。作为样本相关系数,常用字母r表示;作为总体相关系数,常用字母ρ表示。 相关系数的数值范围是介于–1与 +1之间(即–1≤ r ≤1),常用小数形式表示,一般要取小数点后两位数字来表示,以便比较精确地描述其相关程度。

  两个变量之间的相关程度用相关系数r的绝对值表示,其绝对值越接近1,表明两个变量的相关程度越高;其绝对值越接近于0,表明两个变量相关程度越低。如果其绝对值等于零1,则表示两个变量完全直线相关。如果其绝对值为零,则表示两个变量完全不相关(不是直线相关)。

  相关系数的注意事项

  1)相关系数只是一个比率值,并不具备与相关变量相同的测量单位。 2)相关系数r 受变量取值区间大小及样本数目多少的影响比较大。

  3)来自于不同群体且不同质的事物的相关系数不能进行比较。 4)对于不同类型的数据,计算相关系数的方法也不相同

1.简单相关分析的基本原理

  简单相关分析是研究两个变量之间关联程度的统计方法。它主要是通过计算简单相关系数来反映变量之间关系的强弱。一般它有图形(散点图)和数值(一方面应观察相关系数的大小,另一方面,应观察概率P值,其原假设为**不相关)两种表示方式。 简单相关系数

  1)皮尔逊(Pearson)相关系数

  常称为积差相关系数,适用于研究连续变量之间的相关程度。例如,收入和储蓄存款、身高和体重等变量间的线性相关关系。注意Pearson相关系数适用于线性相关的情形,对于曲线相关等更为复杂的情形,系数的大小并不能代表其相关性的强弱。 2)Spearman等级相关系

  Spearman等级相关系数是用来度量顺序水准变量间的线性相关关系。它是利用两变量的秩次大小作线性相关分析,适用条件为:

① 两个变量的变量值是以等级次序表示的资料;

  一个变量的变量值是等级数据,另一个变量的变量值是等距或比率数据,且其两总体不要求是正态分布,样本容量n不一定大于30。

  从斯皮尔曼等级相关适用条件中可以看出,等级相关的应用范围要比积差相关广泛,它的突出优点是对数据的总体分布、样本大小都不做要求。但缺点是计算精度不高。 3)Kendall’s等级相关系数

  它是用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情况。这种指标采用非参数检验方法测度变量间的相关关系。它利用变量的秩计算一致对数目和非一致对数目。

2.偏相关分析的基本原理

  方法概述

  简单相关分析计算两个变量之间的相互关系,分析两个变量间线性关系的程度。但是现实中,事物之间的联系可能存在于多个主体之间,因此往往因为第三个变量的作用使得相关系数不能真实地反映两个变量间的线性相关程度。 基本原理

  偏相关分析是在相关分析的基础上考虑了两个因素以外的各种作用,或者说在扣除了其他因素的作用大小以后,重新来测度这两个因素间的关联程度。这种方法的目的就在于消除其他变量关联性的传递效应。 3.距离分析的基本原理

  简单相关分析和偏相关分析有一个共同点,那就是对所分析的数据背景应当有一定程度的了解。但在实际中有时会遇到一种情况,在分析前对数据所代表的专业背景知识尚不充分,本身就属于探索性的研究。这时就需要先对各个指标或者案例的差异性、相似程度进行考察,以先对数据有一个初步了解,然后再根据结果考虑如何进行深入分析。

  距离分析是对观测量之间或变量之间相似或不相似的程度的一种测度,是计算一对变量之间或一对观测量之间的广义的距离。根据变量的不同类型,可以有许多距离、相似程度测量指标供用户选择。但由于本模块只是一个预分析过程,因此距离分析并不会给出常用的P值,而只能给出各变量/记录间的距离大小,以供用户自行判断相似性。

  第8章 SPSS的回归分析 1。 一元线性回归 方法概述

  线性回归模型侧重考察变量之间的数量变化规律,并通过线性表达式,即线性回归方程,来描述其关系,进而确定一个或几个变量的变化对另一个变量的影响程度,为预测提供科学依据。

  一般线性回归的基本步骤如下。

① 确定回归方程中的自变量和因变量。

② 从收集到的样本数据出发确定自变量和因变量之间的数学关系式,即确定回归方程。

③ 建立回归方程,在一定统计拟合准则下,估计出模型中的各个参数,得到一个确定的回归方程。

④ 对回归方程进行各种统计检验。

⑤ 利用回归方程进行预测。

  注:一元线性回归的经验模型是:Y=β0+β1X 统计检验

  在求解出了回归模型的参数后,一般不能立即将结果付诸于实际问题的分析和预测,通常要进行各种统计检验,例如拟合优度检验、回归方程和回归系数的显著性检验和残差分析等。

  1)输出结果的模型摘要

  其实就是对方程拟合情况的描述。通过这张表可以知道相关系数的取值(R),相关系数的平方即可决系数(R Square),校正后的可决系数(adjusted R Square)和回归系数的标准误(Std。Error of the Estimate)。注意这里的相关系数大小和前面相关分析中计算出的结果完全相同。可决系数R Square的取值介于0和1之间,它的含义就是自变量所能解释的方差在总方差中所占的百分比,取值越大说明模型的效果越好。

  2)输出结果中的方差分析表

  它是回归模型显著性检验的结果,所用方法为F检验,其零假设为原方程无效,通过P值来判断原方程是否有效。 3)输出结果中的回归系数表

  应特别关注回归系数β1 的T检验,它的零假设为β1 =0,通过P值来判断β1 是否有实际意义。

2.多元线性回归

  在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。

  其基本步骤与一元回归几乎一致,只是在输出结果的模型摘要中通过观察调整R2 来判断方程的拟合情况,另外,同样可通过折线图来观察模型拟合效果。

3.曲线拟合

  实际中,变量之间的关系往往不是简单的线性关系,而呈现为某种曲线或非线性的关系。此时,就要选择相应的曲线去反映实际变量的变动情况。为了决定选择的曲线类型,常用的方法是根据数据资料绘制出散点图,通过图形的变化趋势特征并结合专业知识和经验分析来确定曲线的类型,即变量之间的函数关系。

  在确定了变量间的函数关系后,需要估计函数关系中的未知参数,并对拟合效果进行显著性检验。虽然这里选择的是曲线方程,在方程形式上是非线性的,但可以采用变量变换的方法将这些曲线方程转化为线性方程来估计参数。

  在选择模型的时候可以结合专业知识多选几种,如同时选择“指数分布”、“逆模型”和“幂函数”,然后在模型汇总中比较R2 的大小,选择最大的一个,同时,注意观察各自的P值,其原假设为其模型无统计学意义。

4.非线性回归分析

  非线性回归分析是探讨因变量和一组自变量之间的非线性相关模型的统计方法。线性回归模型要求变量之间必须是线性关系,曲线估计只能处理能够通过变量变换化为线性关系的非线性问题,因此这些方法都有一定的局限性。相反的,非线性回归可以估计因变量和自变量之间具有任意关系的模型,用户根据自身需要可随意设定估计方程的具体形式。通过散点图观察,如果自变量和应变量不能通过线性回归或区县估计来实现,则可以在SPSS通过【分析】-【回归】-【非线性】来实现。

  以下是SPSS处理问卷的总结

  当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我们以SPSS为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过程:定义变量﹑数据录入﹑统计分析和结果保存。下面将从这四个方面来对问卷的处理做详细的介绍。

  SPSS处理:

  第一步:定义变量

  大多数情况下我们需要从头定义变量,在打开SPSS后,我们可以看到和excel相似的界面,在界面的左下方可以看到Data View, Variable View两个标签,只需单击左下方的Variable View标签就可以切换到变量定义界面开始定义新变量。在表格上方可以看到一个变量要设置如下几项:name(变量名)、type(变量类型)、width(变量值的宽度)、decimals(小数位)、label(变量标签)、Values(定义具体变量值的标签)、Miing(定义变量缺失值)、Colomns(定义显示列宽)、Align(定义显示对齐方式)、Measure(定义变量类型是连续、有序分类还是无序分类)。

  我们知道在SPSS中,我们可以把一份问卷上面的每一个问题设为一个变量,这样一份问卷有多少个问题就要有多少个变量与之对应,每一个问题的答案即为变量的取值。现在我们以问卷第一个问题为例来说明变量的设置。为了便于说明,可假设此题为:

  1。请问你的年龄属于下面哪一个年龄段( )? A:20—29 B:30—39 C:40—49 D:50--59 那么我们的变量设置可如下: name即变量名为1,type即类型可根据答案的类型设置,答案我们可以用

1、

2、

3、4来代替A、B、C、D,所以我们选择数字型的,即选择Numeric, width宽度为4,decimals即小数位数位为0(因为答案没有小数点),label即变量标签为“年龄段查询”。Values用于定义具体变量值的标签,单击Value框右半部的省略号,会弹出变量值标签对话框,在第一个文本框里输入1,第二个输入20—29,然后单击添加即可。同样道理我们可做如下设置,即1=20—

29、2=30—

39、3=40—

49、4=50--59;Miing,用于定义变量缺失值, 单击miing框右侧的省略号,会弹出缺失值对话框, 界面上有一列三个单选钮,默认值为最上方的“无缺失值”;第二项为“不连续缺失值”,最多可以定义3个值;最后一项为“缺失值范围加可选的一个缺失值”,在此我们不设置缺省值,所以选中第一项如图;Colomns,定义显示列宽,可自己根据实际情况设置;Align,定义显示对齐方式,有居左、居右、居中三种方式;Measure,定义变量类型是连续、有序分类还是无序分类。

  以上为问卷中常见的单项选择题型的变量设置,下面将对一些特殊情况的变量设置也作一下说明。

  1。开放式题型的设置:诸如你所在的省份是_____这样的填空题即为开放题,设置这些变量的时候只需要将Value、Miing两项不设置即可。

  2。多选题的变量设置:这类题型的设置有两种方法即多重二分法和多重分类法,在这里我们只对多重二分法进行介绍。这种方法的基本思想是把该题每一个选项设置成一个变量,然后将每一个选项拆分为两个选项,即选中该项和不选中该项。现在举例来说明在SPSS中的具体操作。比如如下一例:

  请问您通常获取新闻的方式有哪些( ) 1 报纸 2 杂志 3 电视 4 收音机 5 网络

  在SPSS中设置变量时可为此题设置五个变量,假如此题为问卷第三题,那么变量名分别为3_

1、3_

2、3_

3、3_

4、3_5,然后每一个选项有两个选项选中和不选中,只需在Value一项中为每一个变量设置成1=选中此项、0=不选中此项即可。

  使用该窗口,我们可以把一个问卷中的所有问题作为变量在这个窗口中一次定义。 到此,我们的定义变量的工作就基本上可以结束了。下面我们要作就是数据的录入了。首先,我们要回到数据录入窗口,这很简单,只要我们点击软件左下方的Data View标签就可以了。

  第二步:数据录入

  SPSS数据录入有很多方式,大致有一下几种: 1。读取SPSS格式的数据 2。读取Excel等格式的数据

  3。读取文本数据(Fixed和Delimiter) 4。读取数据库格式数据(分如下两步) (1)配置ODBC (2)在SPSS中通过ODBC和数据库进行

  但是对于问卷的数据录入其实很简单,只要在SPSS的数据录入窗口中直接输入就可以了,只是在这里有几点注意的事项需要说明一下。

  1。 在数据录入窗口,我们可以看到有一个表格,这个表格中的每一行代表一份问卷,我们也称为一个个案。

  2。 在数据录入窗口中,我们可以看到表格上方出现了

1、

2、

3、

4、5??。的标签名,这其实是我们在第一步定义变量中,我们为问卷的每一个问题取的变量名,即1代表第一题,2代表第二题。以次类推。我们只需要在变量名下面输入对应问题的答案即可完成问卷的数据录入。比如上述年龄段查询的例题,如果问卷上勾选了A答案,我们在1下面输入1就行了(不要忘记我们通常是用

1、

2、

3、4来代替A、B、C、D的)。

  3。我们知道一行代表一份问卷,所以有几分问卷,就要有几行的数据。 在数据录入完成后,我们要做的就是我们的关键部分,即问卷的统计分析了,因为这时我们已经把问卷中的数据录入我们的软件中了。

  第三步:统计分析

  有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。这要根据我们的问卷调查的目的和我们想要什么样的结果来选择。SPSS有数值分析和作图分析两类方法。

  1。作图分析:

  在SPSS中,除了生存分析所用的生存曲线图被整合到Analyze菜单中外,其他的统计绘图功能均放置在graph菜单中。该菜单具体分为以下几部分::

(1)Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学者可以通过它对SPSS的绘图能力有一个大致的了解。

(2)Interactive:交互式统计图。 (3)Map:统计地图。

(4)下方的其他菜单项是我们最为常用的普通统计图,具体来说有: 条图 散点图 线图 直方图 饼图 面积图 箱式图

  正态Q-Q图 正态P-P图 质量控制图 Pareto图

  自回归曲线图 高低图 交互相关图 序列图 频谱图 误差线图

  作图分析简单易懂,一目了然,我们可根据需要来选择我们需要作的图形,一般来讲,我们较常用的有条图,直方图,正态图,散点图,饼图等等,具体操作很简单,大家可参阅相关书籍,作图分析更多情况下是和数值分析相结合来对试卷进行分析的,这样的效果更好。

  2。数值分析:

  SPSS 数值统计分析过程均在Analyze菜单中,包括:

(1)、Reports和Descriptive Statistics:又称为基本统计分析。基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。Reports和Descriptive Statistics命令项中包括的功能是对单变量的描述统计分析。

  descriptive Statistics包括的统计功能有:

  Frequencies(频数分析):作用:了解变量的取值分布情况

  descriptives(描述统计量分析):功能:了解数据的基本统计特征和对指定的变量值进行标准化处理

  Explore(探索分析):功能:考察数据的奇异性和分布特征

  Crotabs(交叉分析):功能:分析事物(变量)之间的相互影响和关系 Reports包括的统计功能有:

  OLAP Cubes(OLAP报告摘要表):功能: 以分组变量为基础,计算各组的总计、均值和其他统计量。而输出的报告摘要则是指每个组中所包含的各种变量的统计信息。

  Case Summaries(观测量列表):察看或打印所需要的变量值 Report Summaries in Row:行形式输出报告 Report Summaries in Columns:列形式输出报告

(2)、Compare Means(均值比较与检验):能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是否具有统计意义?能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。

  以下是进行均值比较及检验的过程:

  MEANS过程:不同水平下(不同组)的描述统计量,如男女的平均工资,各工种的平均工资。目的在于比较。术语:水平数(指分类变量的值数,如sex变量有2个值,称为有两个水平)、单元Cell(指因变量按分类变量值所分的组)、水平组合

  T test 过程:对样本进行T检验的过程

  单一样本的T检验:检验单个变量的均值是否与给定的常数之间存在差异。

  独立样本的T检验:检验两组不相关的样本是否来自具有相同均值的总体(均值是否相同,如男女的平均收入是否相同,是否有显著性差异)

  配对T检验:检验两组相关的样本是否来自具有相同均值的总体(前后比较,如训练效果,治疗效果) one-Way ANOVA:一元(单因素)方差分析,用于检验几个(三个或三个以上)独立的组,是否来自均值相同的总体。

(3)、ANOVA Models(方差分析):方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法。例如:医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同饲料对牲畜体重增长的效果等,都可以使用方差分析方法去解决

(4)、Correlate(相关分析):它是研究变量间密切程度的一种常用统计方法,常用的相关分析有以下几种:

1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。

2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系

3、相似性测度:两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远

(5)、Regreion(回归分析):功能:寻求有关联(相关)的变量之间的关系在回归过程中包括:Liner:线性回归;Curve Estimation:曲线估计;Binary Logistic:二分变量逻辑回归;Multinomial Logistic:多分变量逻辑回归;Ordinal 序回归;Probit:概率单位回归;Nonlinear:非线性回归;Weight Estimation:加权估计;2-Stage Least squares:二段最小平方法;Optimal Scaling 最优编码回归;其中最常用的为前面三个。

(6)、Nonparametric Tests(非参数检验):是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。

  非参数检验的过程有以下几个: 1。Chi-Square test 卡方检验 2。Binomial test 二项分布检验 3。Runs test 游程检验

  4。1-Sample Kolmogorov-Smirnov test 一个样本柯尔莫哥洛夫-斯米诺夫检验 5。2 independent Samples Test 两个独立样本检验 6。K independent Samples Test K个独立样本检验 7。2 related Samples Test 两个相关样本检验 8。K related Samples Test 两个相关样本检验 (7)、Data Reduction(因子分析) (8)、Claify(聚类与判别)等等

  以上就是数值统计分析Analyze菜单下几项用于分析的数值统计分析方法的简介,在我们的变量定义以及数据录入完成后,我们就可以根据我们的需要在以上几种分析方法中选择若干种对我们的问卷数据进行统计分析,来得到我们想要的结果。

  第四步:结果保存

  我们的SPSS软件会把我们统计分析的多有结果保存在一个窗口中即结果输出窗口(output),由于SPSS软件支持复制和粘贴功能,这样我们就可以把我们想要的结果复制﹑粘贴到我们的报告中,当然我们也可以在菜单中执行file->save来保存我们的结果,一般情况下,我们建议保存我们的数据,结果可不保存。因为只要有了数据,如果我们想要结果的,我们可以随时利用数据得到结果。

  总结:

  以上便是SPSS处理问卷的四个步骤,四个步骤结束后,我们需要SPSS软件做的工作基本上也就结束了,接下来的任务就是写我们的统计报告了。值得一提的是。SPSS是一款在社会统计学应用非常广泛的统计类软件,学好它将对我们以后的工作学习产生很大的意义和作用。

spss实习报告共4

  实 验 报 告

  课程名称

  数据分析

  实验名称

  均值比较与方差分析

系别 电子信息科学学院 专业班级 信息管理15级专升本

  指导教师

  学号

  姓名

  实验日期 2015年11月18日实验成绩

一、实验目的

  1. 掌握均值比较和方差分析的原理、过程和应用

  2. 掌握两独立样本和两配对样本的t检验的过程和结果解释 3. 掌握单因素方差分析的分析过程和结果解释 4. 掌握多因素方差分析的分析过程和结果解释

二、实验环境

  1. 硬件环境:微机

  2. 软件环境: Windows,SPSS Statistics 22

三、实验内容

  1.数据文件GSS2004_中记录了男性或女性每周上网浏览网页的时间(变量WWWHR,单位小时)。用两独立样本t检验方法分析男性和女性在上网时间上是否不同。 (1)原假设

  男性和女性的上网时间没有显著差异。 (2)参数设置

  检验变量:WWW HOURS PER WEEK 分组变量:GENDER (3)操作步骤及计算结果 操作步骤:

① 选择菜单:【分析A】→【比较均值(M)】→【独立样本T检验(T)】;如图1-1

  图1-1

② 选择检验变量“WWW HOURS PER WEEK”到【检验变量(T)】框中。 ③ 选择总体标识变量“GENDER”到【分组变量(G)】框中。

④点击按钮定义两总体的标示值,如图1-2。其中,【使用指定值(U)】表示分别输入对应两

  个不同总体的标记值。

  图1-2

  计算结果:

(4)结果及其解释

  结果:男性和女性的上网时间存在显著差异。

  解释:从独立样本鉴定的表中可以看出F检验值为,对应的概率P值为<,所以拒绝原假设。由于两总体方差有显著差异所以要看到“不采用相等变异数”这一列,其中T统计量的值为,对应的概率P值为。如果显著性水平α为,由于概率P值小于,所以认为量总体的均值有显著差异。并且95%置信区间不夸零,也说明了有显著差异。

  2.数据文件GSS2004_中记录了受访者父亲和母亲的受教育情况。试用两配对样本t检验方法比较父亲的受教育情况(变量PAEDUC)和母亲的受教育情况(变量MAEDUC)是否不同。 (1)原假设

  父亲的受教育情况和母亲的受教育情况没有显著差异。 (2)参数设置

  成对变量:PAEDUC, MAEDUC (3)操作步骤及计算结果 ①选择菜单:

【分析(A)】→【比较均值(M)】→【配对样本T检验(P)】,如图2-1

  图2-1 ②选择PADUC和MADUC到【成对变量(V)】框中。 结果:

  图2-2

  图2-3

  图2-4 (4)结果及其解释

  结果:父亲的受教育情况和母亲的受教育与情况没有显著差异。

  解释:从图2-2的平均值可以看出没有较大的差异。图2-3中对应的概率P值为.000,如果显著性水平α为,则表明父亲和母亲的受教育情况有明显的线性变化,父亲和母亲的受教育情况相关性程度较强。从图2-4中可以看出,父亲与母亲的受教育情况的平均差异,仅只有;95%置信区间的上下限一正一负,则表示两者接近无显著差异;最后相对应的概率P值,如果显著性水平α为,则接受原假设,所以父亲的受教育情况和母亲的受教育与情况无显著差异。

  3.一家关于MBA报考、学习、就业指导的网站希望了解国内MBA毕业生的起薪是否与各自所学的专业相关。为此,他们在已经从国内商学院毕业并且获得学位的MBA学生中按照各专业分别随机抽取了10人,调查了这些学生的起薪情况,数据文件为。根据这些调查他们能否得出专业对MBA起薪有影响的结论。 (1)原假设

  国内MBA毕业生各自所学专业与起薪情况没有显著关系。 (2)参数设置 观测变量:起薪 控制变量:专业

(3)操作步骤及计算结果 操作步骤: ①选择菜单: 【分析(A)】→【比较均值(M)】→【单因素ANOVA】; ②选择观测变量“起薪”到【因变量列表(E)】框中,如图3-1;

④ 选择控制变量“专业”到【因子(F)】框中,如图3-2;

  图3-1 计算结果:

  图3-2 (4)结果及其解释

  结果:国内MBA毕业生各自所学专业与起薪情况没有显著关系;

  解释:从图3-2可以看出,F统计量的观测值为,对应的概率P值为。如果显著性水平α为,由于概率P值大于显著性水平α,所以接受原假设,认为国内MBA毕业生各自所学专业与起薪情况没有显著关系。

  4.一家连锁零售店试图对顾客的购买习惯进行调查。grocery_记录了顾客性别、购物方式、消费额等信息。使用多因素方差分析方法分析顾客性别和购物方式对消费额有何影响。 (1)原假设

不同顾客性别没有对消费额产生显著差异;不同购物方式对消费额没有显著差异;顾客性别和购物方式对消费额没有产生显著的交互影响。 (2)参数设置 观测变量:消费额

  控制变量:顾客性别,购物方式 (3)操作步骤及计算结果 操作步骤: ①选择菜单: 【分析(A)】→【一般线性模型】→【单变量(U)】; ②指定观测变量“消费额”到【因变量(D)】框中;

③指定固定效应的控制变量“顾客性别”和“购物方式”到【固定因子(F)】框中,如图4-1。

  计算结果:

  图4-2

  图4-2

(4)结果及其解释

  结果:不同顾客性别对消费额有显著差异;不同购物方式对消费额没有显著差异;顾客性别和购物方式对消费额有显著的交互影响。 解释:从图中可以看出Fgender,Fstyle,Fgender*style的概率P值分别为,和如果显著性水平α为,由于Fgender,Fgender*style概率P值小于显著性水平α,所以应该拒绝原假设,可以认为不同顾客性别对消费额有显著差异,顾客性别和购物方式对消费额有显著的交互影响,而Fstyle概率P值小于显著性水平α,则接收原假设认为不同购物方式对消费额没有显著差异。

四、实验小结(心得体会、遇到问题及其解决方法)

spss实习报告共5

  应用统计分析学习报告

  本科的时候有概率统计和数理分析的基础,但是从来没有接触过应用统计分析的东西,SPSS也只是听说过,从来没有学过。一直以为这一块儿会比较难,这学期最初学的时候,因为没有认真看老师给的英文教材,课下也没有认真搜集相关资料,所以学起来有些吃力,总感觉听起来一头雾水。老师说最后的考核是通过提交学习报告,然后我从图书馆里借了些教材查了些资料,发现很多问题都弄清楚了。结合软件和书上的例子,实战一下,发现SPSS的功能相当强大。最后总结出这篇报告,以巩固所学。

  SPSS,全称是Statistical Product and Service Solutions,即“统计产品与服务解决方案”软件,是IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,也是世界上公认的三大数据分析软件之一。SPSS具有统计分析功能强大、操作界面友好、与其他软件交互性好等特点,被广泛应用于经济管理、医疗卫生、自然科学等各个领域。具体到管理方面,SPSS也是一个进行数据分析和预测的强大工具。这门课中也会用到AMOS软件。

  关于SPSS的书,很多都是首先介绍软件的。这个软件易于安装,我装的是的,虽然有一些改变和优化,但是主体都是一样的,而且都是可视化界面,用起来很方面且容易上手。所以,我学习的重点是卡方检验和T检验、方差分析、相关分析、回归分析、因子分析、结构方程模型等方法的适用范围、应用价值、计算方式、结果的解释和表述。

  首先是T检验这一部分。由于参数检验的基础不牢固,这部分也是最初开始接触应用统计的东西,学起来很多东西拿不准,比如说原假设默认的是什么。结果出来后依然分不清楚是接受原假设还是拒绝原假设。不过现在弄懂了。这部分很有用的是T检验。T检验应用于当样本数较小时,且样本取自正态总体同时做两样本均数比较时,还要求两样本的总体方差相等时,已知一个总体均数u,可得到一个样本均数及该样本标准差,样本来自正态或近似正态总体。T检验分为单样本T检验、独立样本T检验、配对样本T检验。其中,单样本T 检验是样本均数与总体均数的比较的T检验,用于推断样本所代表的未知总体均数μ与已知的总体均数uo有无差别;独立样本T检验主要用于检验两个样本是否来自具有相同均值的总体,即比较两个样本的均值是否相同,要求两个样本是相互独立的;配对样本T检验中,要正确理解“配对”的含义,主要用于检验两个有联系的正态总体的均值是否有显著差异,跟独立检验的区别就是样本是否是配对样本。这几个方法用软件操作起来都是相对简单的,关键是分清楚什么时候用这个什么时候用那个。

  然后是方差分析。方差分析就是将索要处理的观测值作为一个整体,按照变异的不同来源把观测值总变异的平方和以及自由度分解为两个或多个部分,获得不同变异来源的均值与误差均方,通过比较不同变异来源的均方与误差均方,判断各样本所属总体方差是否相等。方差分析主要包括单因素方差分析、多因素方差分析和协方差分析等。这一部分在学习的过程中出现一些问题,就是用SPSS来操作的时候分不清观测变量和控制变量,如果反了的话会导致结果的不准确。其次,对Bonferroni、Tukey、Scheffe等方法的使用目的不清楚,现在基本掌握了多重比较方法选择:一般如果存在明确的对照组,要进行的是验证性研究,即计划好的某两个或几个组间(和对照组)的比较。宜用Bonferroni(LSD)法;若需要进行多个均数间的两两比较,且各组个案数相等,适宜用Tukey法;其他情况宜用Scheffe法。最后,对方差齐性检验、多重比较检验、趋势检验理解不够透彻,在方差检验中,Post Hoc键有LSD的选项:当方差分析F检验否定了原假设,即认为至少有两个总体的均值存在显著性差异时,须进一步确定是哪两个或哪几个均值显著地不同,则需要进行多重比较来检验。LSD即是一种多因变量的三个或三个以上水平下均值之间进行的两两比较检验。

  相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。相关分析研究现象之间是否相关、相关的方向和密切程度,一般不区别自变量或因变量。主要有双变量相关分析、偏相关、距离相关几个方法。双变量相关分析是相关分析中最常使用的分析过程,主要用于分析两个变量之间的线性相关分析,可以根据不同的数据类型和条件,选用Pearson积差相关、Spearman等级相关和Kendall的tau-b等级相关。当数据文件包括多个变量时,直接对两个变量进行相关分析往往不能真实反映二者之间的关系,此时就需要用到偏相关分析,从中剔除其他变量的线性影响。距离相关分析是对观测变量之间差异度或相似程度进行的测量,其中距离需要弄清楚,距离分析是对观测量之间相似或不相似程度的一种测度,是计算一对观测量之间的广义距离。这些相似性或距离测度可以用于其他分析过程,例如因子分析、聚类分析或多维定标分析,有助于分析复杂的数据集。

  接着是回归分析。相关分析研究的是现象之间是否相关、相关的方向和密切程度,一般不区别自变量或因变量。而回归分析则要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系。比如说,从相关分析中我们可以得知“质量”和“用户满意度”变量密切相关,但是这两个变量之间到底是哪个变量受哪个变量的影响,影响程度如何,则需要通过回归分析方法来确定。回归分析的目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。应用回归分析时应首先确定变量之间是否存在相关关系,如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。正确应用回归分析预测时应注意:①用定性分析判断现象之间的依存关系;②避免回归预测的任意外推;③应用合适的数据资料;

  接下来是因子分析。因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量。从显性的变量中得到因子的方法有两类。一类是探索性因子分析,另一类是验证性因子分析。探索性因子分析不事先假定因子与测度项之间的关系,而让数据“自己说话”。而验证性因子分析假定因子与测度项的关系是部分知道的,即哪个测度项对应于哪个因子,虽然我们尚且不知道具体的系数。这一部分不能用SPSS来操作,要用AMOS,用起来也很方便。

  最后一部分学习的是结构方程模型。结构方程模型是一种融合了因素分析和路径分析的多元统计技术。它的强势在于对多变量间交互关系的定量研究。在近三十年内,其大量应用于社会科学及行为科学的领域里,并在近几年开始逐渐应用于市场研究中。结构方程模型是对顾客满意度的研究采用的模型方法之一。其目的在于探索事物间的因果关系,并将这种关系用因果模型、路径图等形式加以表述。结构方程模型与传统的回归分析不同,结构方程分析能同时处理多个因变量,并可比较及评价不同的理论模型。与传统的探索性因子分析不同,在结构方程模型中,我们可以提出一个特定的因子结构,并检验它是否吻合数据。通过结构方程多组分析,我们可以了解不同组别内各变量的关系是否保持不变,各因子的均值是否有显著差异。

  这门课要学习完了,整个学习的过程是充满曲折和挑战的,我见证了自己从一无所知到困惑迷茫再到略懂再到会用的过程。甚至学完之后有些问题还没有彻底搞清楚,自己接下来还会不断的探索的。SPSS是个很神奇的工具,结合AMOS和EXCEL更是如虎添翼,相信学习了SPSS在以后的论文和数据分析中很有用。这门课给我的感觉是看起来很难,但是实际学起来就好很多,因为当我结合具体实例和软件的时候,很多抽象的问题就豁然开朗了。但是想给老师一个建议,这门课需要很强的统计和概率论的基础,要不然就会很难听懂或者听得半懂。然后这门课的很多方法的相关资料都是用在医疗卫生、自然科学领域的,在管理中的应用的资料不怎么多。老师希望我们上课的时候结合在管理中的应用来学习,但是资料有限,希望老师在这个方面多给学生一些引导。

spss实习报告共6

湖南大学

sp工程实训报告

题 目:关于湖南大学本科生暑假规划的调查

学院名称: 金融与统计学院 专业班级: 统计二班 学生姓名: 宿骐、王美超、吕芳婷、学号:

3、

3213、

3218、指导老师:

  目 录:

第一部分——sp分析原理及引言 第二部分——调查方案的设计 第三部分——调查结果及分析

第四部分——对本次调查的结论及相关建议 第一部分——sp分析原理及引言

此次调查是针对湖南大学本科生的暑期规划问题,调查问卷共设计15个题目,分别从被调查者给各种活动安排的时间、目的及其满意程度等方面进行数据资料的收集。

  我班同学组成了调查小组,对在校生的暑期规划情况进行了调查。由于调查对象范围比较大,本小组主要采用的是抽样调查的方法,共收回有效问卷100份。从性别、年级方面对被调查者个人信息进行汇总。

第二部分——调查方案的设计

一、调查方案

1、调查目的

了解学校本科生暑假的时间安排情况,如旅游、兼职、学习、休息等,并通过调查不同性别、年级的同学们的满意程度,帮助学校和家长熟悉湖大学生暑期生活,以及为同学们的暑期生活规划做出参考。

2、调查对象

全校在校本科生。

3、调查方法

我们采取了抽样和随机抽样相结合的方法,分别选择了在统计二班进行整群调查,以及在各学院和年级进行随机抽样。 4.调查方式

全体调查人员亲自到南北校区教学楼发放问卷并收集,网上制作问卷并征集答卷。 5.调查表

具体调查项目及调查表详见附录。 6.调查时间

5月25日—6月25日完成数据收集工作 7.调查人员

全体调查小组成员,共5位。 8.调查项目预算

共200份调查表,打印每张元,共40元。

二、调查问卷

关于湖南大学本科生暑假规划的调查问卷

  大家好,为了解同学们的暑期安排情况,我们小组研究的课题是湖大本科生的暑期规划。请帮忙填写以下问卷,谢谢!

年级_____ 性别_____ 院系_________________

1、您对自己的暑期生活是否有具体的计划安排? a、有,且很具体 b、有,但只是方向 c、没有,顺其自然

2、您暑期打算做什么?

a、旅游 b、兼职 c、学习 d、休息

3、如果旅游,您的目的是? a、丰富阅历,增长社会经验 b、培养和提高与人交流能力

c、调剂心情以更好地投入生活学习中 d、不打算旅游

4、如果旅游,您将去往?

a、湖南省 b、外省 c、国外d、不打算旅游

5、如果旅游,您向往的主题类型是? a、自然风光b、海滨度假 c、繁华都市

d、民俗古镇e、其他_________________

6、如果旅游,您打算花费大约多长时间? a、1周 b、半个月 c、1个月

d、1个半月 e、2个月 f、不打算旅游

7、如果兼职,您的目的是? a、体验生活,增加社会经验 b、锻炼自己为人处事的能力

c、增加收入,为自己和父母减轻负担 d、不打算兼职

8、如果兼职,您希望做哪些工作? a、家教 b、餐厅服务员

c、促销员 d、与专业相关的工作 e、其他________________ f、不打算兼职

9、如果兼职,您打算花费大约多长时间? a、半个月 b、1个月 c、1个半月 d、2个月e、不打算兼职

10、如果学习,您主要打算学习或复习什么? a、英语培训或复习 b、电脑培训或复习

c、驾校培训 d、自己感兴趣的___________________ e、不打算学习

11、如果学习,您打算花费大约多长时间? a、半个月 b、1个月 c、1个半月 d、2个月e、不打算兼职

12、如果休息,您的目的是? a、放松心情,调养身体 b、陪伴家人和朋友 c、在家休闲,省钱省力 d、不打算长时期休息

13、如果休息,您愿意怎样安排时间给学习? a、每天1-2小时b、每星期1-2天

c、每月1-2星期d、不打算花时间学习 e、其他_____________________

14、如果休息,您打算怎样安排时间给睡眠? a、每天6-8小时 b、每天8-10小时

c、每天10-12小时 d、每天12小时以上

15、您对自己的暑期生活安排满意吗? a、非常满意 b、基本满意 c、不太满意 d、不满意

谢谢配合!祝大家暑期愉快!

由此表数据可知:打算旅游的与打算做兼职的同学人数相差不多,分别占百分比24%、27%;而将假期时间主要花费在学习上的学生最多,达到了35%;与此相反,打算长时期在家休息的人数最少,只有14%。考虑到大学生暑假旅游与兼职的动机,主要即丰富阅历、增加社会经验,以及锻炼自己为人处世的能力等,学生们的选择情有可原。然而,由学习与休息的人数反差可见,作为新时代大学生,同学们依然坚持学习是自己的第一要务,此点值得欣慰。由以下关于学习内容的数据又得知,大学生的学习不再局限于课本知识,来源也趋于丰富多样化,说明大学的确是汲取知识的黄金阶段,因此,也希望同学们都能珍惜青春,抓住机遇,在大学打造出一个多功能的优秀的自己。 从上面的暑期打算调查中,我们可以看到,选择旅游的同学所占的比例占总比例的很大部分。可见,同学们对旅游是比较重视的。那么,同学们又会选择去哪儿旅游呢?如表3,我们可以清晰的看到,选择外省旅游的比例高达67%,次之的是选择在湖南省游玩,有极少部分选择出国游玩,部分同学则不会出去游玩。从下面饼状图可以一目了然,选择外省的比例独占鳌头。总的来说,暑假中绝大多数同学都会选择外出旅游,而旅游的同学中又有绝大多数同学选择外省旅游。这也不难理解。一方面,同学们在长沙呆了这么久,作为地区优势,早就把湖南省可以玩的地方统统玩遍了;另一方面,就算湖南省还没有玩遍,呆在长沙的时间还很长,可以留着以后玩,趁着这个长假好好感受异区文化,体味别样风情。在外省旅游也会增长更多在课本上学不到的东西,拓展自己的见闻,丰富自己的知识面,体会不一样的文化风情,也不失为一种明智的选择。 饼状图如下:

4——

既然上面分析的大部分同学都会出去旅游,那么,他们一般会选择游玩写什么地方呢?是繁华都市还是民俗古镇?是自然风光还是浪漫海滨?

不妨来看看表4。从表中所显示的比例我们可以看出,同学们的选择都倾向于自然风光和民俗古镇。从图4中更可以直观的看到。从中可以得出,同学们都倾向于比较优雅的环境去游玩而不是那些喧嚣繁华的都市。在城市生活中压抑太久,同学们为自己找了一个清新脱俗又生机盎然的旅游环境是势在必行的。一方面,同学们可以在大自然的怀抱中无拘无束的敞开自己的胸怀,放松自己的心情,感受大自然的魅力;另一方面,美丽的自然风光加上清新优雅的民俗古镇,伴着景美、人美、情美,畅玩我们这美丽的暑假,不失为一种别样的暑假选择。当然,也有少部分同学选择了阳光灿烂的海滨。

总的来说,清净、优雅、宁静、自然还是同学们旅游的主体倾向。

10——

从这次调查我们可以得出看出:

一、大部分学生都有令自己基本满意的暑期计划安排,但都只是方向而不够具体、明确;二:部分学生没有能按预期中的安排去度过暑假,主要原因是缺少自制力;

三、多数学生有着充分利用暑假的意识,懂得在学习之余,做一些兴趣之内的事,或是体验生活从而丰富阅历,但缺少一个正确的引导。因此,我们小组有以下建议: 1:在放暑假之前,老师可以根据自己的经验给学生提出建议,正确的引导学生; 2:老师可以适当布置少量暑期综合实践作业,如暑期实践论文、暑期生活总结等; 3:很多学生在暑期愿意从事一些兼职,但大学生应该在确保安全的前提下根据自己的实际情况去选择,适合大学生短期兼职的是家教和销售;

4:尽量让自己的暑期过的的充实,若无兼职、旅游、学习等计划,还可以帮家里做些家务活,就近选择一些公益组织参与志愿者活动。

spss实习报告共6篇(统计学spss实训报告)

将本文的Word文档下载到电脑,方便收藏
推荐度:
点击下载文档文档为doc格式