📘 原书正文提炼(OCR页 85-86)
原书重讲“女士品茶”实验,核心不是故事本身,而是统计学三个动作:提出无效假设、随机安排试验、计算偶然得到当前结果的概率。
p值衡量的是“在无效假设为真时,当前结果有多罕见”,不是“无效假设为假的概率”。这一点是医学写作最常见误读。
样本量与试验设计决定检验力量:杯数太少时,纯猜中的概率并不低,显著与否很难反映真实能力。
🔍 深入讲解(第三次扩写)
假设检验真正解决的问题是:观察到的差异能否仅由随机误差解释。若概率极低,我们倾向拒绝“仅由随机误差造成”这一解释。
但“拒绝无效假设”不等于“研究假设100%正确”。它只是一种证据更新,后续仍需结合效应量、区间、先验合理性和外部证据。
在医学研究里,预先注册假设、终点和分析路径非常关键。否则很容易出现结果导向分析(p-hacking),导致名义显著但可重复性差。
把I类错误与II类错误放在同一框架看,才是完整决策:过于保守会漏检真实效应,过于激进会放大假阳性。
🧩 概念拆解与方法边界
- 无效假设:默认状态,通常代表“无差异/无关联”。
- p值:在无效假设成立时,得到当前或更极端结果的概率。
- 检验效能:当真实差异存在时,检验能够检出的概率。
🏥 医学科研落地场景
- • 随机对照试验中预设主终点,避免事后挑结果。
- • 多终点研究需做多重比较校正,控制整体假阳性。
- • 院内质控评估中同步考虑误报与漏报成本。
🧪 小例题(本章最短实战)
A/B两方案比较时预先设定双侧检验与α=0.05,避免结果出来后临时改方向。
💻 R 最短复现片段
set.seed(107)
a <- rnorm(45, 8.1, 1.2)
b <- rnorm(45, 7.5, 1.2)
t.test(a, b, alternative="two.sided")
📌 R结果解释标准模板
- • 数据概况:双侧检验用于评估两组是否存在任意方向差异。
- • 核心结果:关注均值差、95%CI 与双侧 P 值。
- • 解释句式:'在预设双侧α=0.05下,两组差异具有/不具有统计学意义。'
🛠️ 常见报错排查(R运行失败时怎么改)
- • 报错 `object not found`:先运行完整代码块(含 `set.seed`、`data.frame`),不要只运行最后两行模型代码。
- • 报错 `could not find function`:确认函数来源包是否已安装并加载;优先执行 `install.packages('包名')` 后再 `library(包名)`。
- • 报错 `non-numeric argument`:检查变量类型,必要时用 `str(dat)` 查看并将字符变量转为数值或因子。
- • 报错 `contrasts can be applied only to factors`:分组变量先转因子,例如 `dat$group <- as.factor(dat$group)`。
- • 报错 `NA/NaN/Inf in ...`:先清理缺失或无穷值,如 `dat <- na.omit(dat)`,并排查除零与非法变换。
- • 结果与页面示例不完全一致:先确认 R 版本与包版本,再完整重跑代码块;模拟数据场景下以“方向与解释框架一致”为主。
🖱️ SPSS 最短复现片段
分析 > 比较均值 > 独立样本T检验;在方案书中提前写明双侧检验。
T-TEST GROUPS=group(0 1)
/VARIABLES=outcome
/CRITERIA=CI(.95).
🧾 论文/汇报可直接套用
论文结果句:'在预设显著性水平α=0.05下,观察到组间差异具有统计学意义(P=0.012),并结合效应量评估其临床意义。'
⚠️ 本章高发误区
- • 把p值当“结论正确率”。
- • 结果不显著后临时改单侧检验。
- • 进行多次检验却不做校正。
- • 显著即宣称“临床有效”。
✅ 本章实操清单
- • 在研究前写清H0/H1与检验方向。
- • 明确α、功效和样本量依据。
- • 同步报告效应量与95%CI。
- • 区分统计显著与临床显著。
📝 课后思考题
- • 你最近一次分析是否存在“先看结果再定检验”的风险?
- • 如果P=0.049与P=0.051,你的结论会完全相反吗?
- • 在你的课题里,I类与II类错误哪个代价更高?