← 返回白话统计学目录
第7章 / 共16章

第7章 女士品茶与假设检验

检验是反证思维,不是“证明我对”的话术。

📘 原书正文提炼(OCR页 85-86)

原书重讲“女士品茶”实验,核心不是故事本身,而是统计学三个动作:提出无效假设、随机安排试验、计算偶然得到当前结果的概率。

p值衡量的是“在无效假设为真时,当前结果有多罕见”,不是“无效假设为假的概率”。这一点是医学写作最常见误读。

样本量与试验设计决定检验力量:杯数太少时,纯猜中的概率并不低,显著与否很难反映真实能力。

🔍 深入讲解(第三次扩写)

假设检验真正解决的问题是:观察到的差异能否仅由随机误差解释。若概率极低,我们倾向拒绝“仅由随机误差造成”这一解释。

但“拒绝无效假设”不等于“研究假设100%正确”。它只是一种证据更新,后续仍需结合效应量、区间、先验合理性和外部证据。

在医学研究里,预先注册假设、终点和分析路径非常关键。否则很容易出现结果导向分析(p-hacking),导致名义显著但可重复性差。

把I类错误与II类错误放在同一框架看,才是完整决策:过于保守会漏检真实效应,过于激进会放大假阳性。

🧩 概念拆解与方法边界

🏥 医学科研落地场景

🧪 小例题(本章最短实战)

A/B两方案比较时预先设定双侧检验与α=0.05,避免结果出来后临时改方向。

💻 R 最短复现片段

set.seed(107)
a <- rnorm(45, 8.1, 1.2)
b <- rnorm(45, 7.5, 1.2)
t.test(a, b, alternative="two.sided")

📌 R结果解释标准模板

🛠️ 常见报错排查(R运行失败时怎么改)

🖱️ SPSS 最短复现片段

分析 > 比较均值 > 独立样本T检验;在方案书中提前写明双侧检验。

T-TEST GROUPS=group(0 1)
/VARIABLES=outcome
/CRITERIA=CI(.95).

🧾 论文/汇报可直接套用

论文结果句:'在预设显著性水平α=0.05下,观察到组间差异具有统计学意义(P=0.012),并结合效应量评估其临床意义。'

⚠️ 本章高发误区

✅ 本章实操清单

📝 课后思考题