1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据 数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据 数据——选择个案——随机个案样本——输入70。 2、 利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序 数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、 利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算 转换——对个案内的值计数 输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、 利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置 学号放在名称变量,全部课程放在变量框中,确定后,完成转置。分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。先拆分 数据——拆分文件 按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。 方法二:利用变量计算,转换——计算变量 分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定
5、 利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
根据存款金额排序,观察其最大值与最小值,算出组数和组距。转换——重新编码为其他变量——将存款金额作为输出变量——定义输出变量的名称及标签——设定旧值和新值.
6、在习题二第6题数据中,如果认为调查中“今年的收入比去年增加”且“预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。
转换——对个案的值计数——设定目标变量及标签——将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。
7、 对习题二第5题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。
数据——加权个案——点击加权个案——将人数作为频率变量——确定。
第四章
SPSS基本统计分析
1、 利用习题二第6题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
2、利用习题二第6题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。
分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。
3、利用习题二第6题数据,如果假设存款金额服从正态分布,能否利用本章所讲解的功能,找到存款金额“与众不同”的样本,并说明理由。
分析——描述统计——描述,选择存款金额到变量中。对“将标准化得分另存为变量”打上勾,然后对数据编辑窗口中的最后一列变量标准化
Z变量进行排序,
并观察,找到它的绝对值大于3的都是“与众不同”的样本。理由:标
准化值反映的是样本值与样本均值的差是几个标准差单位。如果标准化值等于0,则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;如果标准化值小于0,则表示该样本值小于样本均值。如果标准化值的绝对值大于3,则可认为是异常值。 4、 简述SPSS的“Sort”功能与“Split”功能的不同。 “Sort”功能即排序功能,“Split”功能即拆分功能,数据拆分与数据排序很相似,但也有一个重要的不同点,即数据拆分不仅是按指定变量对数据进行简单排序,更重要的是根据指定变量对数据进行分组,它将为以后所进行的分组统计分析提供便利。
5、 利用习题二第6题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征。
分析——描述统计——交叉表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式条形图”。点击单元格——选择观测值、期望、行、列、合计。点击统计量——选择卡方。点击继续。确定。
6、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了了解住房条件对婆媳关系的影响,对600户家庭进行了调查并进行了列联分析,如下表: 1) 补充表中第一行和第四行空缺的计算结果。
婆媳关系*住房条件Crosstabulation差CountExpected Count紧张% within婆媳关系% within住房条件CountExpected Count婆媳关系一般% within婆媳关系% within住房条件CountExpected Count和睦% within婆媳关系% within住房条件CountExpected CountTotal% within婆媳关系% within住房条件5748.7529.23%38.00%4548.7523.08%30.00%4852.522.86%32.00%15015025.00%100.00%住房条件一般7868.2540.00%37.14%8768.2544.62%41.43%4573.521.43%21.43%21021035.00%100.00%好607830.77%25.00%637832.31%26.25%1178455.71%48.75%24024040.00%100.00%Total195195100.00%32.50%195195100.00%32.50%210210100.00%35.00%600600100.00%100.00%
2) 写出卡方检验的统计量并说明其构造基本原理。
(f0fe)2 Xfe23) 婆媳关系与住房条件有无联系?
判断婆媳关系与住房条件有无关系:因为P值为0.000,小于显著性水平0.01,属于高度显著,拒绝原假设,所以婆媳关系与住房条件有关系。
7、 利用习题二第5题资料,分析两种减肥产品所产生的效果分布是否一致。
分析——描述统计——交叉表,选择“产品类型”到行,选择“体重变化”到列。点击统计量——勾选卡方。点击单元格——选择观察值、期望值、行、列、总计。点击继续,确定。 8、下面第一幅图是某班同学对班级体活动满意度调查的部分数据。其中,t4_1、t4_2、t4_3是分别为你最满意的一次活动、你比较满意的一次活动和你认为最不满意一次活动。为分析哪次集体活动受到了同学们的广泛认可和满意,根据所获得的数据,可在SPSS中进行多选项分析。
请问:上面第二幅图所示的窗口是做什么用的?针对上述问题应在该窗口中进行怎样的操作。
答:第二幅图所示的窗口是定义多重响应集用的,根据题目,t4_1、t4_2、t4_3是分别为你最满意的一次活动、你比较满意的一次活动和你认为最不满意一次活动,显示出该问题最多不超过三项,而第一幅图中t4_1、t4_2、t4_3三个变量的备选答案则多于三项,故应选择采用分类法进行多选项分析处理。 9、 说明第2章第6题资料中的多选项问题是按照哪种拆分方式拆分的。利用多选项分析被调查者本次存款的最主要目的是什么。 答:第2章第6题资料的多选项问题是按照分类法拆分的。目的是为了把多选项问题的分析转化为对多个问题的分析,即对多个SPSS变量的分析。
因篇幅问题不能全部显示,请点此查看更多更全内容