生存分析

COX 比例风险回归模型--有感

夙愿已清 提交于 2019-11-26 20:12:14
生存分析 三大块内容: 1,描述性的 生存率、中位生存期、生存曲线等,常用Kaplan-meier法 2,比较分析 两组的生存曲线是否有差别,log-rank检验(单个因素) 3,cox比例风险回归 类似logistic回归,多个变量对Y的影响,得到一个概率值,只不过加了时间 多花点时间聊聊cox的感受 首先理解一个概念 风险函数(hazard function)h(t)=f(t)/S(t) f(t)为瞬时死亡率,其实就是时间趋近于零时刻的死亡率,又称死亡概率密度函数,曲线下面积为1. S(t)为生存率:a, 若无删失,表示为t时刻存活人数/总观察人数        b,若有删失,计算为各个时段下生存概率的乘积( 生存概率:活过该年的人数/年初人数) 象形的理解,瞬时死亡率只受到某时刻,死亡人数的影响,若t时刻死亡10人,瞬时死亡率肯定高于t+1时刻死亡1人 而,生存率,会越来越低。分子/分母,h(t)风险函数肯定增大。 对于COX风险比例模型,h(t,x)=h0(t)exp(βX)=h0(t)exp(β1x1+β2x2+```+βx) 前半部分为基线风险函数,不需要特定分布,为非参 后半部分相当于对多重线性回归的输出进行了次方变换,保证了 正值和 单调性 (参数模型) 两者相乘即为COX,(半参) 那么聊聊参数估计 对偏似然函数 ,采用极大似然估计 先不管这个所谓偏似然函数