dplyr
是一种数据操作语法(“A Grammar of Data Manipulation”),提供了一组连贯的动词来帮助处理常见的数据操作。
dplyr
是一种数据操作语法(“A Grammar of Data Manipulation”),提供了一组连贯的动词来帮助处理常见的数据操作。
tidyverse
是由哈德利·威克汉姆和他的团队引入的 R 编程语言的开源包集合,它们“共享一个基本的设计理念、语法和数据结构”,用于整理数据(tidy data)。tidyverse 包的特点包括广泛使用非标准评估和鼓励渠道。1
表格: R 的帮助函数 / 11 用于管理 R 工作区的函数 / 13 处理数据对象的常用函数 / 42 用于操作数据框的 dplyr 函数 / 58 函数: with() / 25;within() / 47 主题: 因子、列表、tibble / 26-30 导入数据 / 31- 特殊 …
参考:
获取帮助 ?topic 或 type?topic 可以获取关于 topic 的帮助。? 为 help() 的简便写法。 ??pattern 或 field??pattern 可以在帮助系统中查找带有字符串 pattern 的实例(包、类、函数等)。?? 为 help.search() 的简便写法。 …
数据集 通常是由数据构成的一个矩形数据,行表示观测(值)(observation),列表示变量(variable)。 在数据库领域,行和列分别被称为记录(record)和字段(field);在数据挖掘和机器学习领域则分别被称为示例(example)和属性(attribute)。 R 中右多种用于储 …
数据准备:使用 sample
函数对原始数据进行随机抽样,抽取 70% 的数据作为训练集(n=329),其余的作为测试集(n=141),抽样结果(训练集)保存在 sample.txt 文件中。
建立模型:使用 stats
程序包中的 glm
函数对训练集数据使用单因素和多因素 Logistic 回归分析,确定发生植体周炎的危险因素(P < 0.05)。用多因素 Logistic 回归分析的结果计算 OR 值,并借助 boot
程序包,使用 Bootstrap 法计算 OR 的 95% 置信区间。使用 rms
程序包建立列线图预测模型。
验证模型:分别借助 rms
程序包中的 calibrate
函数和 pROC
程序包中的 plot.roc
函数,使用 C-index 和校准曲线来检验模型的区分度和校准度。Logistic 回归的 C-index 即为 ROC 曲线下面积(AUC)。内部验证和外部验证分别使用训练集和测试集数据进行。
Enter any child page of Series.