第五章 平均水平的比较
第二节 Independent-Samples
T Test过程
在正态或近似正态分布的计量资料中(如临床常见的体温、血压、脉搏、身高、体重等测量值,几乎均为此类资料),经常在使用前一章计量资料描述过程分析后,还要进行组与组之间平均水平的比较。本章将分四节分别介绍这一统计方法:即常用的t检验和单因素方差分析。
第一节 Means过程
5.1.1 主要功能
与第四章中Descriptives过程相比,若仅仅计算单一组别的均数和标准差,Means过程并无特别之处;但若用户要求按指定条件分组计算均数和标准差,如分性别同时分年龄计算各组的均数和标准差,则用Means过程更显简单快捷。
5.1.2
实例操作
[例5.1]某医师测得如下血红蛋白值(g%),试作基本的描述性统计分析:
对象编号 |
性别 |
年龄 |
血红蛋白值 |
对象编号 |
性别 |
年龄 |
血红蛋白值 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
女 男 女 女 男 男 女 男 女 女 男 男 男 女 女 女 男 男 女 男 |
18 16 18 17 16 18 16 18 18 17 18 18 16 17 17 17 17 16 16 18 |
12.83 15.50 12.25 10.06 10.88 9.65 8.36 11.66 8.54 7.78 13.66 10.57 12.56 9.87 8.99 11.35 14.56 12.40 8.05 14.03 |
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 |
女 男 男 女 女 女 女 男 男 男 男 女 女 女 男 男 男 男 女 男 |
16 16 18 18 17 18 17 16 16 18 16 16 18 18 18 18 17 17 16 16 |
11.36 12.78 15.09 8.67 8.56 12.56 11.56 14.67 7.88 12.35 13.65 9.87 10.09 12.55 16.04 13.78 11.67 10.98 8.78 11.35 |
5.1.2.1 数据准备
激活数据管理窗口,定义变量名:性别为sex,年龄为age,血红蛋白值为hb。按顺序输入数据(sex变量中,男为1,女为2),结果见图5.1。
图5.1
原始数据的输入 |
5.1.2.2 统计分析
激活Statistics菜单选Compare Means中的Means...项,弹出Means对话框(如图5.2示)。今欲分性别同时分年龄求血红蛋白值的均数和标准差,故在对话框左侧的变量列表中选hb,点击Ø钮使之进入Dependent List框,选sex 点击Ø钮使之进入Independent List框,点击Next,可选定分组的第二层次(Layer 2 of 2),选age 点击Ø钮亦使之进入Independent List框。点击Options...可选统计项目:在Cell Displays项中,Mean为均数、Standard deviation为标准差、Variance为方差、Count为观察单位数、Sum为观察值总和,在Statistics for First Layer项中,将为第一层次的分组计算方差分析(ANOVA table and eta)和线性检验(Test of linearity)。选好后点击Continue钮返回Means对话框,点击OK钮即可。
图5.2
Means对话框 |
5.1.2.3 结果解释
在结果输出窗口中将看到如下统计数据:
- - Description of Subpopulations - - Summaries of HB By levels of SEX AGE
Variable Value Label Sum Mean Std Dev Variance Cases For Entire Population 457.79 11.4448 2.2690 5.1484 40 SEX 1 265.71 12.6529 2.0531 4.2154 21 AGE 16 111.67 12.4078 2.2455 5.0423 9 AGE 17 37.21 12.4033 1.8993 3.6074 3 AGE 18 116.83 12.9811 2.0933 4.3821 9
SEX 2 192.08 10.1095 1.6989 2.8863 19 AGE 16 46.42 9.2840 1.3494 1.8209 5 AGE 17 68.17 9.7386 1.4036 1.9700 7 AGE 18 77.49 11.0700 1.9158 3.6703 7
Total Cases = 40
|
For Entire Population一行表示40个观察值合计为457.79,均数为11.4448,标准差为2.2690,方差为5.1484,例数为40;接下去各行分别表示先按性别分组(分男性与女性),再按年龄分组(16,17,18岁三组)的观察值合计、均数、标准差、方差和例数。
若在Independent List中未分层次,即sex和age一起放在Layer 1 of 1中,则结果是分别计算男性与女性(不作年龄分组)、16,17,18岁三组(不作性别分组)的观察值合计、均数、标准差、方差和例数(如下所示)。
- - Description of Subpopulations - -
Summaries of HB By levels of SEX Variable Value Label Sum Mean Std Dev Variance Cases For Entire Population 457.79 11.4447 2.2690 5.1484 40 SEX 1 265.71 12.6529 2.0531 4.2154 21 SEX 2 192.08 10.1095 1.6989 2.8863 19 Total Cases = 40
Summaries of HB By levels of AGE Variable Value Label Sum Mean Std Dev Variance Cases For Entire Population 457.79 11.4448 2.2690 5.1484 40 AGE 16 158.09 11.2921 2.4649 6.0759 14 AGE 17 105.38 10.5380 1.9421 3.7719 10 AGE 18 194.32 12.1450 2.1827 4.7640 16 Total Cases = 40
|
第二节 Independent-Samples T
Test过程
5.2.1
主要功能
调用此过程可完成两样本均数差别的显著性检验,即通常所说的两组资料的t检验。
5.2.2 实例操作
[例5.2]分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇排出量(mg/dl)如下,试比较两组均数有无差别。
病 人 |
2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.36 2.72 2.37 2.09 7.10 5.92 |
健康人 |
5.18 8.79 3.14 6.46 3.72 6.64 5.60 4.57 7.71 4.99 4.01 |
5.2.2.1 数据准备
激活数据管理窗口,定义变量名:把实际观察值定义为x,再定义一个变量group来区分病人与健康人。输入原始数据,在变量group中,病人输入1,健康人输入2。结果如图5.3所示。
图5.3
两组资料t检验的原始数据 |
5.2.2.2 统计分析
激活Statistics菜单选Compare Means中的Independent-samples T Test...项,弹出Independent- samples T Test对话框(如图5.4示)。从对话框左侧的变量列表中选x,点击Ø钮使之进入Test Variable(s)框,选group 点击Ø钮使之进入Grouping Variable框,点击Define Groups...钮弹出Define Groups定义框,在Group 1中输入1,在Group 2中输入2,点击Continue钮,返回Independent-samples T Test对话框,点击OK钮即完成分析。
图5.4
Independent-samples T Test对话框 |
5.2.2.3 结果解释
在结果输出窗口中将看到如下统计数据:
t-tests for
independent samples of
GROUP
Number
Variable
of Cases
Mean
SD SE
of Mean
---------------------------------------------------------------
X
GROUP 1
14
4.3779 1.450
.387
GROUP 2
11
5.5282 1.735
.523
---------------------------------------------------------------
Mean Difference = -1.1503
Levene's Test for Equality of Variances: F= .440 P=
.514
|
这一部分显示两组资料的例数(Numbers of
cases)、均数(Mean)、标准差(SD)和标准误(SE of
Mean),显示两均数差值为1.1503,经方差齐性检验: F= .440
P= .514,即两方差齐。
t-test for
Equality of Means
95% Variances t-value df 2-Tail Sig SE of Diff CI for
Diff ----------------------------------------------------------------------- Equal -1.81 23
.084
.637
(-2.468, .167) Unequal -1.77 19.47
.093
.651
(-2.513, .213) -----------------------------------------------------------------------
|
这一部分显示t检验的结果,第一行表示方差齐情况下的t检验的结果,第二行表示方差不齐情况下的t检验的结果。依次显示值(t-value)、自由度(df)、双侧检验概率(2-Tail
Sig)、差值的标准误(SE of Diff)及其95%可信区间(Cl for
Diff)。因本例属方差齐性,故采用第一行(即Equal)结果:t=1.81,P=0.084,差别有显著性意义,即老年性慢性支气管炎病人的尿中17酮类固醇排出量低于健康人。
第三节 Paired-Samples T
Test过程
5.3.1
主要功能
调用此过程可完成配对资料的显著性检验,即配对t检验。在医学领域中,主要的配对资料包括:同对(年龄、性别、体重、病况等非处理因素相同或相似者)或同一研究对象分别给予两种不同处理的效果比较,以及同一研究对象处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。
5.3.2 实例操作
[例5.2]某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料,一段时期后将之宰杀,测定其肝中维生素A含量(mmol/L)如下,问饲料中缺乏维生素E对鼠肝中维生素A含量有无影响?
大白鼠对别 |
肝中维生素A含量(mmol/L) | |
正常饲料组 |
维生素E缺乏饲料组 | |
1 2 3 4 5 6 7 8 |
37.2 20.9 31.4 41.4 39.8 39.3 36.1 31.9 |
25.7 25.1 18.8 33.5 34.0 28.3 26.2 18.3 |
5.3.2.1 数据准备
激活数据管理窗口,定义变量名:正常饲料组测定值为x1,维生素E缺乏饲料组测定值为x2,数据输入后结果如图5.5所示。
图5.5
配对t检验的原始数据 |
5.3.2.2 统计分析
激活Statistics菜单选Compare Means中的Paired-samples T Test...项,弹出Paried-samples T Test对话框(如图5.6示)。从对话框左侧的变量列表中点击x1,这时在左下方的Current Selections框中Variable 1处出现x1,再从变量列表中点击x2,左下方的Current Selections框中Variable 2处出现x2。点击Ø钮使x1、x2进入Variables框,点击OK钮即完成分析。
图5.6
Paried-samples T Test对话框 |
5.3.2.3 结果解释
在结果输出窗口中将看到如下统计数据:
- - - t-tests for paired samples - - - Number
of
2-tail Variable
pairs
Corr Sig
Mean
SD
SE of Mean -------------------------------------------------------------------------------------------------------------- X1
34.7500
6.649
2.351
8
.586
.127 X2
26.2375 5.821
2.058 ------------------------------------------------------------------------------- |
这段结果显示本例共有8对观察值,相关系数(C)为0.586,相关系数的显著性检验表明P=0.127;变量x1的均数(Mean)、标准差(SD)、标准误(SE
of
Mean)分别为34.7500、6.649、2.351,变量x2的均数、标准差、标准误分别为26.2375、5.821、2.058。
Paired
Differences
| Mean
SD SE
of Mean |
t-value
df 2-tail
Sig ----------------------------------------------------|-------------------------------------------------- 8.5125
5.719
2.022
|
4.21
7
.004 95% CI (3.730, 13.295)
|
|
这段结果显示变量x1、x2两两相减的差值均数、标准差、标准误95%可信区间(95% Cl)分别为8.5125、5.719、2.022,95%可信区间(95% Cl)为3.730,13.295。配对检验结果为:t=4.21, P=0.004, 差别具高度显著性意义,即饲料中缺乏维生素E对鼠肝中维生素A含量确有影响。
第四节 One-Way ANOVA过程
5.4.1
主要功能
在实际研究中,经常需要比较两组以上样本均数的差别,这时不能使用t检验方法作两两间的比较(如有人对四组均数的比较,作6次两两间的t检验),这势必增加两类错误的可能性(如原先a定为0.05,这样作多次的t检验将使最终推断时的a>0.05)。故对于两组以上的均数比较,必须使用方差分析的方法,当然方差分析方法亦适用于两组均数的比较。方差分析可调用此过程可完成。
本过程只能进行单因素方差分析,即完全随机设计资料的方差分析。对于随机区组设计资料方差分析的方法,将在第五章介绍。
5.4.2
实例操作
[例5.4]某单位研究两种不同制剂治疗钩虫的效果,用大白鼠作试验。11只大白鼠随机分配于3组:一组为对照组、另外二组分别为使用甲、乙制剂的实验组。试验方法是:用药前每鼠人工感染500条钩蚴,感染后第8天实验组分别给予甲、乙制剂,对照组不给药,第10天全部解剖检查鼠体内活虫数,结果如下,问两制剂是否有效?
对照组 |
甲制剂组 |
乙制剂组 |
279 334 303 338 298 |
129 174 110 |
210 285 117 |
5.4.2.1 数据准备
激活数据管理窗口,定义变量名:实际观察值定义为x,组别用变量range表示:其中对照组的值为、甲制剂实验组的值为、乙制剂实验组的值为,输入后的结果如图5.7所示。
图5.7
单因素方差分析的原始数据 |
5.4.2.2 统计分析
激活Statistics菜单选Compare Means中的One-Way ANOVA...项,弹出One-Way ANOVA 对话框(如图5.8示)。从对话框左侧的变量列表中选x,点击Ø钮使之进入Dependent List框,选range 点击Ø钮使之进入Factor框,点击Define Range钮打开One-Way ANOVA: Define Range 对话框,因本例为3组比较,故在Minimum处输入1,在Maximum处输入3,点击Continue钮返回One-Way ANOVA 对话框。如果欲作多个样本均数间两两比较,可点击该点击对话框的Post Hoc...钮打开One-Way ANOVA: Post Hoc Multiple Comparisons对话框(如图5.9所示),这时可见在Tests框中有7种比较方法供选择:
图5.8 One-Way
ANOVA 对话框 |
图5.9 One-Way
ANOVA:Post Hoc Multiple Comparisons 对话框 |
Least-significant difference:最小显著差法。a可指定0~1之间任何显著性水平,默认值为0.05;
Bonferroni:Bonferroni修正差别检验法。a可指定0~1之间任何显著性水平,默认值为0.05;
Duncan’s multiple range test:Duncan多范围检验。只能指定a为0.05或0.01或0.1,默认值为0.05;
Student-Newman-Keuls:Student-Newman-Keuls检验,简称N-K检验,亦即q检验。a只能为0.05;
Tukey’s honestly significant difference:Tukey显著性检验。a只能为0.05;
Tukey’s b:Tukey另一种显著性检验。a只能为0.05;
Scheffe:Scheffe差别检验法。a可指定0~1之间任何显著性水平,默认值为0.05。
本例选用Student-Newman-Keuls显著性检验法。在Sample Size Estimate框中有Harmonic average of pairs和Harmonic average of all groups两选项,前者表示仅采用相互比较两组的调和均数,后者表示采用所有组(含比较的两组和尚未比较的其他组)的调和均数,本例选用前者,点击Continue钮返回One-Way ANOVA 对话框后,再点击OK钮即完成分析。
5.4.2.3 结果解释
在结果输出窗口中将看到如下统计数据:
- - -
- - O N E W A Y - - - - -
Variable
X By Variable RANGE
Analysis of Variance
Sum of
Mean
F
F
Source
D.F.
Squares
Squares
Ratio
Prob. Between
Groups
2
59724.3152
29862.1576
12.6804
.0033 Within
Groups
8
18839.8667
2354.9833 Total
10
78564.1818
|
上述结果显示组间、组内(实际上本例应称之为“剩余”)和合计的自由度(D.F.)、离均差平方和(Sum of Squares,即SS)、均方(Means Squares,即SS)、F值(F Ratio)和P值(F Prob.),本例F=12.6804,P=0.0033,表明甲、乙两种制剂中必有一种制剂治疗钩虫是有效的。
为了解哪一种制剂是有效的,本例采用SNK两两比较法,结果如下:
- - - -
- O N E W A Y - - - - -
Variable
X By Variable RANGE
Multiple
Range Tests:
Student-Newman-Keuls test with significance level
.050
The
difference between two means is significant if MEAN(J)-MEAN(I) >= 34.3146 * RANGE *
SQRT(1/N(I) + 1/N(J)) with the following value(s) for
RANGE:
Step
2
3 RANGE 3.27 4.04 (*) Indicates significant
differences which are shown in the lower triangle
G G G
r r r
p p p
2 3 1 Mean
RANGE 137.6667 Grp
2 204.0000 Grp
3 310.4000 Grp 1 * *
|
上述结果显示:如果两均数的差值34.3146×RANGE×,则差别有显著性意义。上面已用“*”标出2、3两组与1组比较均有显著性差异。具体作法是:以甲制剂与对照组的比较为例,均数差值
= 310.4000 - 137.6667 = 172.7333,已知RANGE为4.04,n1=5,n2=3,按上式求得101.2418,因172.7333
> 101.2418,故甲制剂有效;余同。即甲、乙制剂治疗钩虫均有效。因甲制剂与乙制剂比较,均数差值为66.3333,按上式求得界值为91.6180,故尚无证据表明甲、乙制剂间效果有差别。