数据准备:使用 sample
函数对原始数据进行随机抽样,抽取 70% 的数据作为训练集(n=329),其余的作为测试集(n=141),抽样结果(训练集)保存在 sample.txt 文件中。
建立模型:使用 stats
程序包中的 glm
函数对训练集数据使用单因素和多因素 Logistic 回归分析,确定发生植体周炎的危险因素(P < 0.05)。用多因素 Logistic 回归分析的结果计算 OR 值,并借助 boot
程序包,使用 Bootstrap 法计算 OR 的 95% 置信区间。使用 rms
程序包建立列线图预测模型。
验证模型:分别借助 rms
程序包中的 calibrate
函数和 pROC
程序包中的 plot.roc
函数,使用 C-index 和校准曲线来检验模型的区分度和校准度。Logistic 回归的 C-index 即为 ROC 曲线下面积(AUC)。内部验证和外部验证分别使用训练集和测试集数据进行。