第十四章 生存分析

第一节 Life Tables过程

14.1.1 主要功能

14.1.2 实例操作

第二节 Kaplan-Meier过程

14.2.1 主要功能

14.2.2 实例操作

第三节 Cox Regression过程

14.3.1 主要功能

14.3.2 实例操作

 

    在临床诊疗工作的评价中,慢性疾病的预后一般不适合用治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。这就是生存分析。

第一节 Life Tables过程

14.1.1 主要功能

    调用此过程时,系统将采用即寿命表分析法,完成对病例随访资料在任意指定时点的生存状况评价。

 

14.1.2 实例操作

   [例14-1 用中药+化疗(中药组,16例)和单纯化疗(对照组,10例)两种疗法治疗白血病患者后,随访记录存活情况如下所示,试比较两组的生存率。

 

中药组

对照组

随访月数

是否死亡

随访月数

是否死亡

10

2

12

13

18

6

19

26

9

8

6

43

9

4

31

24

2

13

7

11

6

1

11

3

17

7

 

14.1.2.1  数据准备

    激活数据管理窗口,定义变量名:随访月数的变量名为TIME,是否死亡的变量名为DEATH,分组(即中药组与对照组)的变量名为GROUP。输入原始数据:随访月数按原数值;是否死亡的,是为1,否为0;分组的,中药组为1,对照组为2

 

14.1.2.2  统计分析

    激活Statistics菜单选Survival中的Life Tables...项,弹出Life Tables对话框(图14.1)。从对话框左侧的变量列表中选time,点击Ø钮使之进入time框;在Display Time Intervals栏中定义需要显示生存率的时点,本例要求从0个月显示至48个月,间隔为2个月,故在0 through框中输入48,在by框中输入2。选death,点击Ø钮使之进入Status框,点击Define Event...钮弹出Life Tables:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Life Tables对话框。选group,点击Ø钮使之进入Factor框,点击Define Range...钮,弹出Life Tables:Define Range for Factor Variable对话框,定义分组的范围,在Mininum框中输入1,在Maxinum框中输入2,点击Continue钮返回Life Tables对话框。

 

14.1  生存资料的寿命表分析对话框

 

       点击Options...钮弹出Life Tables: Options对话框,在Plot栏中选Survival项,要求绘制生存率曲线图;在Compare Levels of First Factor栏中选Overall项,要求作组间生存状况的比较。之后点击Continue钮返回Life Tables对话框,再点击OK钮即完成分析。

14.1.2.3  结果解释

       在结果输出窗口中将看到如下统计数据:

       共有26个观察对象进入分析。系统先显示中药组(group = 1)的生存状况寿命表,按用户指定,从0月起,隔2个月直至42个月(原指定从048个月,但因42个月后,生存概率已为0,故42个月后至48个月的生存状况不再显示),分别显示进入该时点例数(Number Entrng this Intrvl)、从该时点失去的例数(Number Wdrawn Durong Intrvl)、该时点暴露于死亡危险的例数(Number Exposd to Risk)、该时点死亡的例数(Number of Termnl Events)、该时点死亡概率(Propn Terminating)、该时点生存概率(Propn Surviving)、该时点末生存率(Propn Surv at End)、单位时点的累积概率(Cumul Probability Densty)、该时点风险比例(Hazard Rate)、生存率的标准误(SE of Cumul Surviving)、单位时点累积概率的标准误(SE of Probability Densty)、风险比例的标准误(SE of Hazard Rate)。如本例,用中药+化疗的方式治疗白血病患者,至8个月时,死亡率为17.39%,生存概率为82.61%,生存率为66.38%,风险比例为9.52%。至42个月时,生存概率和生存率均为0,此时风险比例为100%。中药组的50%生存率在19.44个月。

       对照组同类结果的显示,因在16个月时生存概率已为0,故仅从0月起,隔2个月至16个月止。分析显示,单纯用化疗,白血病患者的半数生存率约在16个月多一点,比中药组少三个月。

 

This subfile contains:      26 observations

 Life Table

   Survival Variable  TIME

                 for  GROUP =  1

    Number Number Number Number                   Cumul        SE of  SE of

Intrvl Entrng Wdrawn Exposd   of    Propn  Propn Propn  Proba-       Cumul  Proba-  SE of

Start  this   During   to   Termnl  Termi-  Sur-  Surv   bility  Hazard  Sur-  bility   Hazard

Time  Intrvl  Intrvl   Risk  Events  nating  viving  at End Densty  Rate  viving  Densty   Rate

------  ------  ------   ------  ------   ------   ------  ------  ------   ------  ------   ------   ------

  .0   16.0    .0    16.0    .0    .0000  1.0000 1.0000  .0000  .0000  .0000  .0000   .0000

 2.0   16.0    .0    16.0   1.0    .0625   .9375  .9375  .0313  .0323  .0605  .0303   .0322

 4.0   15.0   1.0    14.5    .0    .0000  1.0000  .9375  .0000  .0000  .0605  .0000   .0000

 6.0   14.0    .0    14.0   2.0    .1429   .8571  .8036  .0670  .0769  .1019  .0441   .0542

 8.0   12.0   1.0    11.5   2.0    .1739   .8261  .6638  .0699  .0952  .1231  .0458   .0670

10.0    9.0   1.0     8.5    .0    .0000  1.0000  .6638  .0000  .0000  .1231  .0000   .0000

12.0    8.0   1.0     7.5   1.0    .1333   .8667  .5753  .0443  .0714  .1348  .0420   .0712

14.0    6.0    .0     6.0    .0    .0000  1.0000  .5753  .0000  .0000  .1348  .0000   .0000

16.0    6.0    .0     6.0    .0    .0000  1.0000  .5753  .0000  .0000  .1348  .0000   .0000

18.0    6.0   1.0     5.5   1.0    .1818   .8182  .4707  .0523  .1000  .1453  .0489   .0995

20.0    4.0    .0     4.0    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

22.0    4.0    .0     4.0    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

24.0    4.0   1.0     3.5    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

26.0    3.0   1.0     2.5    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

28.0    2.0    .0     2.0    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

30.0    2.0   1.0     1.5    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

32.0    1.0    .0     1.0    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

34.0    1.0    .0     1.0    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

36.0    1.0    .0     1.0    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

38.0    1.0    .0     1.0    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

40.0    1.0    .0     1.0    .0    .0000  1.0000  .4707  .0000  .0000  .1453  .0000   .0000

42.0    1.0    .0     1.0   1.0   1.0000   .0000  .0000  .2354 1.0000   .0000  .0727   .0000

 

 The median survival time for these data is  19.44

 

Life Table

   Survival Variable  TIME

                 for  GROUP =  2

    Number Number Number Number                   Cumul        SE of  SE of

Intrvl Entrng Wdrawn Exposd   of    Propn  Propn Propn  Proba-       Cumul  Proba-  SE of

Start  this   During   to   Termnl  Termi-  Sur-  Surv   bility  Hazard  Sur-  bility   Hazard

Time  Intrvl  Intrvl   Risk  Events  nating  viving  at End Densty  Rate  viving  Densty   Rate

------  ------  ------   ------  ------   ------   ------  ------  ------   ------  ------   ------   ------

  .0   10.0   1.0     9.5    .0    .0000  1.0000 1.0000  .0000  .0000  .0000  .0000   .0000

 2.0    9.0   1.0     8.5   1.0    .1176   .8824  .8824  .0588  .0625  .1105  .0553   .0624

 4.0    7.0    .0     7.0    .0    .0000  1.0000  .8824  .0000  .0000  .1105  .0000   .0000

 6.0    7.0   2.0     6.0   1.0    .1667   .8333  .7353  .0735  .0909  .1628  .0678   .0905

 8.0    4.0    .0     4.0    .0    .0000  1.0000  .7353  .0000  .0000  .1628  .0000   .0000

10.0    4.0   1.0     3.5   1.0    .2857   .7143  .5252  .1050  .1667  .2122  .0918   .1643

12.0    2.0   1.0     1.5    .0    .0000  1.0000  .5252  .0000  .0000  .2122  .0000   .0000

14.0    1.0    .0     1.0    .0    .0000  1.0000  .5252  .0000  .0000  .2122  .0000   .0000

16.0    1.0   1.0      .5    .0    .0000  1.0000  .5252  .0000  .0000  .2122  .0000   .0000

 

 The median survival time for these data is  16.00+

 

 

       接着显示两组比较的结果。系统采用Gehan比分检验法,得u = 0.012P = 0.9113,即中药组与对照组的生存率无差别。

 

Comparison of survival experience using the Wilcoxon (Gehan) statistic

   Survival Variable  TIME

          grouped by  GROUP

  Overall comparison    statistic  .012     D.F. 1        Prob.  .9113

  Group  label                Total N   Uncen    Cen   Pct Cen   Mean Score

    1                          16       8       8     50.00        .1875

    2                          10       3       7     70.00       -.3000

 

 

       最后,系统输出生存率曲线图(图14.2)。从图中可见,对照组(group = 2)在8个月前一段时点的生存率均较中药组(group = 1)略低,而8-12个月这一段其生存率又较中药组略高,12个月后再又下降。但在治疗中加用中药,对个别患者而言,20个月后依然有一定的生存率。

 

 

14.2  中药组与对照组生存率曲线的比较

 

 

第二节 Kaplan-Meier过程

 

14.2.1 主要功能

    调用此过程,系统将采用Kaplan-Meier方法,对病例随访资料进行生存分析,在对应于每一实际观察事件时点上,作生存率的评价。

 

14.2.2 实例操作

   [例14-225例某癌症病人在不同时期经随机化分配到AB治疗组进行治疗,同时随访观察至1974531日结束,资料整理后如下表,试对其结果进行生存率分析。

 

病人号

随访天数

是否死亡

治疗方式

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

8

180

632

852

52

2240

220

63

195

76

70

8

13

1990

1976

18

700

1296

1460

210

63

1328

1296

365

23

A

B

B

A

A

B

A

A

B

B

B

A

B

B

A

B

B

A

A

B

A

A

B

A

B

 

14.2.2.1  数据准备

    激活数据管理窗口,定义变量名:随访天数为TIME,是否死亡为DEATH,治疗方式为TREAT。变量TIME按原数值输入,DEATH为是的输入1、否的输入0,TREAT为A的输入1、为B的输入2。

 

14.2.2.2  统计分析

    激活Statistics菜单选Survival中的Kaplan-Meier...项,弹出Kaplan-Meier对话框(图14.3)。从对话框左侧的变量列表中选time,点击Ø钮使之进入time框;选death,点击Ø钮使之进入Status框,点击Define Event...钮弹出Kaplan-Meier:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Kaplan-Meier对话框。选treat,点击Ø钮使之进入Factor框。

 

14.3  Kaplan-Meier法生存率分析对话框

 

       点击Save... 钮弹出Kaplan-Meier:Save New Variables对话框,选Survival项,要求将各观察样例的生存率存入原始数据库中。点击Continue钮返回Kaplan-Meier对话框。

       点击Options...钮弹出Kaplan-Meier: Options对话框,在Plot栏中选Survival项,要求绘制生存率曲线图。之后点击Continue钮返回Life Tables对话框,再点击OK钮即完成分析。

 

14.2.2.3  结果解释

       在结果输出窗口中将看到如下统计数据:

       先对A治疗组资料进行分析。将原资料按生存天数的大小顺次排列,再逐例显示生存状态(Status,即死亡为1、生存为2)、生存率(Cumulative Survival)、生存率标准误(Standard Error)、累积死亡例数(Cumulative Event)和尚存活人数(Number Remaining)。如本例,A组共12人,死亡6人,生存6人,存活率为50.00%;平均生存时间为1023天,标准误为27695%可信区间为4821563天。B组共13人,死亡12人,生存1人,存活率为7.69%;平均生存时间为607天,标准误为22695%可信区间为1631051天。

 

Factor TREAT = A

 

  Time       Status     Cumulative     Standard     Cumulative      Number

                         Survival       Error         Events       Remaining

    8          1                                      1            11

    8          1         .8333        .1076            2            10

   52          1         .7500        .1250            3             9

   63          1                                      4             8

   63          1         .5833        .1423            5             7

  220          1         .5000        .1443            6             6

  365          0                                      6             5

  852          0                                      6             4

 1296          0                                      6             3

 1328          0                                      6             2

 1460          0                                      6             1

 1976          0                                      6             0

 

 Number of Cases:  12        Censored:   6      ( 50.00%)   Events: 6

          Survival Time    Standard Error   95% Confidence Interval

 Mean:         1023           276           (482,  1563 )

 (Limited to     1976 )

 Median:        220            .             (    .,    . )

 

 Factor TREAT = B

 

  Time       Status     Cumulative     Standard     Cumulative      Number

                         Survival       Error         Events       Remaining

   13          1         .9231         .0739           1            12

   18          1         .8462         .1001           2            11

   23          1         .7692         .1169           3            10

   70          1         .6923         .1280           4             9

   76          1         .6154         .1349           5             8

  180          1         .5385         .1383           6             7

  195          1         .4615         .1383           7             6

  210          1         .3846         .1349           8             5

  632          1         .3077         .1280           9             4

  700          1         .2308         .1169          10             3

 1296          1         .1538         .1001          11             2

 1990          0                                     11             1

 2240          1         .0000         .0000          12             0

 

 Number of Cases:  13        Censored:   1      (  7.69%)   Events: 12

 

          Survival Time    Standard Error   95% Confidence Interval

 Mean:        607             226          ( 163,  1051 )

 Median:       195             80          (  38,   352 )

 

                              Total       Number       Number        Percent

                                          Events       Censored       Censored

  TREAT          A           12            6             6           50.00

  TREAT          B           13           12             1            7.69

  Overall                       25           18             7           28.00

 

 

       系统按用户的请求输出生存率曲线图(图14.4)。从图中可见,生存天数为200左右之前,AB两组的生存率相近,而后,A组维持约50%的生存率,B组则不断下降。

       最后系统将各观察对象的生存率计算结果,逐一送入原始数据库保存(图14.5),变量名为sur_1。用户从中可见,如A组治疗8天死亡者,其8天的生存率为83.333%;又如B组治疗180天死亡者,其180天的生存率为53.846%

 

 

14.4  两种治疗方式生存率曲线比较

 

 

14.5  生存率分析结果的保存

 

第三节 Cox Regression过程

14.3.1 主要功能

    调用此过程可完成对病例随访资料中事件发生时点与一系列相关独立变量之间关系的评价,即建立Cox回归模型(亦称比例风险模型)。

    第一、二节介绍的方法,仅仅是对生存资料作较简单的统计,即描述和分析一个因素(如治疗方式)对生存时间的影响。而在Cox回归模型中,某一时点t,除了有一个本底风险量h0(t)外,第i个影响因素可使该本底风险量h0(t)增至eβixi倍而成为h0(t)·eβixi  。因此如果有k个因素同时影响生存过程,那么时点t的风险量(常称之为风险函数)表达为:

    h(t) = h0(t) ·e(β1x1+β2x2+...+βkxk)

14.3.2 实例操作

       [14-3]某医师在研究急性白血病患者的生存率时,收集了33名患者的资料,按Ag阳、阴性分组(Ag阳性组17例,Ag阴性组16例),同时考察白细胞数的影响作用。试据下表资料作Cox回归模型的分析。

 

Ag阳性组

Ag阴性组

生存月数

是否死亡

白细胞数(×109 /L

生存月数

是否死亡

白细胞数(×109 /L

1

1

4

5

16

22

26

39

56

65

65

100

108

121

134

143

156

100.0

100.0

17.0

52.0

6.0

35.0

32.0

5.4

9.4

2.3

100.0

4.3

10.5

10.0

2.6

7.0

0.8

2

3

3

3

4

4

4

7

8

16

17

22

30

43

56

65

27.0

10.0

28.0

21.0

19.0

26.0

100.0

1.5

31.0

9.0

4.0

5.3

79.0

100.0

4.4

3.0

14.3.2.1  数据准备

    激活数据管理窗口,定义变量名:生存月数为TIME,是否死亡为DEATH,白细胞数为WBC,Ag阳性与否为AG。TIME按原数据输入,DEATH是的输入1、否的输入0,WBC亦按原数据输入,AG阳性的输入1、阴性的输入2。

14.3.2.2  统计分析

    激活Statistics菜单选Survival中的Cox Regression...项,弹出Cox Regression对话框(图14.6)。从对话框左侧的变量列表中选time,点击Ø钮使之进入time框;选death,点击Ø钮使之进入Status框,点击Define Event...钮弹出Cox Regression:Define Event for Status Variable对话框,在Single value栏中输入1,表明death = 1为发生死亡事件者;点击Continue钮返回Cox Regression对话框。选wbcag,点击Ø钮使之进入Covariates框。

 

 

14.6  Cox回归模型分析对话框

 

       Method处有一下拉菜单,系统提供7种回归运算方法让用户选择:

       1Enter:所有自变量强制进入回归方程;

       2Forward: Conditional:以假定参数为基础作似然比概率检验,向前逐步选择自变量;

       3Forward: LR:以最大局部似然为基础作似然比概率检验,向前逐步选择自变量;

       4Forward: Wald:作Wald概率统计法,向前逐步选择自变量;

       5Backward: Conditional:以假定参数为基础作似然比概率检验,向后逐步选择自变量;

       6Backward: LR:以最大局部似然为基础作似然比概率检验,向后逐步选择自变量;

       7Backward: Wald:作Wald概率统计法,向后逐步选择自变量。

       本例因自变量较少,故选用Enter法。

       点击Plots...钮弹出Cox Regression:Plots对话框,在Polts Type栏中选Survival项,要求绘制生存率曲线图,同时选Hazard项,要求绘制风险量变化图。然后点击Continue钮返回Cox Regression对话框。

       点击Save... 钮弹出Cox Regression:Save New Variables对话框,在Survival栏中选Function项,要求将生存率计算结果存入原数据库;在Diagnostics处选Hazard function项,要求将风险函数计算结果存入原数据库;再选X*Beta项,要求计算各自变量与其系数的乘积并存盘。完成选择后点击Continue钮返回Cox Regression对话框。

       点击Options...钮弹出Cox Regression:Options对话框,在Model Statistics栏中选At last step项,要求只显示回归方程拟合过程的最终结果;同时选Display baseline function项,要求显示各样本的本底风险量。之后点击Continue钮返回Cox Regression对话框,再点击OK钮即完成分析。

14.3.2.3  结果解释

       在结果输出窗口中将看到如下统计数据:

       系统显示共有33例样本进入分析,其中29例在观察期内死亡,4例仍存活,存活率为12.1%Cox回归方程拟合结果的χ2检验,χ2值为11.773P = 0.0028,表明AGWBC两自变量对生存状态均有作用。得到风险量增加倍数为e(0.0089×WBC - 1.1219×AG),其中白细胞数的变量系数为正值,意味着白细胞数愈高,死亡风险愈大;Ag的变量系数为负,意味着Ag阳性者,死亡风险小。

 

33  Total cases read

         0  Cases with missing values

         0  Valid cases with non-positive times

         0  Censored cases before the earliest event in a stratum

         0  Total cases dropped

        33  Cases available for the analysis

 

Dependent Variable:  TIME

 

          Events       Censored

            29         4 (12.1%)

 

Beginning Block Number 0.  Initial Log Likelihood Function

 

-2 Log Likelihood     153.394

 

Beginning Block Number 1.  Method:  Enter

 

Variable(s) Entered at Step Number 1..

    AG

    WBC

 

-2 Log Likelihood     142.761

 

                     Chi-Square    df       Sig

Overall (score)           11.773      2      .0028

Change (-2LL) from

 Previous Block         10.633       2      .0049

 Previous Step          10.633       2      .0049

 

-------------------- Variables in the Equation ---------------------

Variable         B        S.E.     Wald   df     Sig       R      Exp(B)

AG          -1.1219     .4505    6.2025   1    .0128    -.1655     .3256

WBC          .0089     .0052    2.9703   1    .0848     .0795    1.0089

 

       接着,系统显示各生存时点(亦即各样本)的本底风险量(Cum Hazard)、生存率(Survival)、生存率的标准误(SE)和本底风险量的标准误(SE of Cum hazard)。并提示将在原数据库中产生三个新的变量,即生存率、风险比例和风险量倍数。

 

          Baseline   ---- At mean of covariates ---

Time      Cum Hazard   Survival      SE     SE of Cum Hazard

   1         .0701       .9503     .0338        .0510

   2         .1069       .9252     .0415        .0778

   3         .2286       .8468     .0574        .1663

   4         .3730       .7623     .0691        .2714

   5         .4305       .7311     .0738        .3132

   7         .4907       .6998     .0776        .3570

   8         .5555       .6676     .0809        .4041

  16         .6977       .6020     .0858        .5075

  17         .7755       .5688     .0877        .5642

  22         .9484       .5016     .0895        .6899

  30        1.0552       .4641     .0901        .7677

  39        1.1770       .4248     .0910        .8562

  43        1.3251       .3814     .0894        .9640

  56        1.7359       .2829     .0829       1.2628

  65        2.3579       .1799     .0679       1.7153

 100        2.8882       .1223     .0635       2.1011

 108        3.5394       .0762     .0521       2.5748

 121        4.3891       .0411     .0369       3.1929

 143        6.4697       .0090     .0133       4.7066

 156         .           .0000     .            .

 

Covariate Means

Variable         Mean

AG              .5152

WBC          29.1667

 

3 New variables have been added:

  Name      Label

  SUR_1     Survival Function

  HAZ_1     Cumulative Hazard Function

  XBE_1     X'Beta

 

 

       从输出的Cox模型生存率曲线图(图14.7)中可见,随时间的延长,患者生存率逐渐下降,接近160个月时,生存率几乎为0

 

 

14.7  Cox模型的生存率曲线

 

       下图为Cox模型的风险量曲线图,其趋势也十分明显,即随时间的延长,患者在生存上所经历的死亡风险愈来愈大,到140个月时,大约是起初(0个月)的5倍。

 

 

14.8  Cox模型的风险量曲线

       系统在原始数据库中将生存率以变量sur_1、风险比例以变量haz_1和风险量倍数以变量xbe_1存盘(图14.9)。用户从中可见,如经治疗后1月内死亡、其白细胞数为100.0×109 /LAg阳性者,生存率为94.592%、风险比例为5.560%、风险量倍数为0.08695;又如经治疗后26月内尚存活、其白细胞数为32.0×109 /LAg阳性者,生存率为66.318%、风险比例为41.070%、风险量倍数为-0.51874

 

 

14.9  Cox回归模型分析结果的保存