第7章女士品茶与假设检验

📘 原书正文提炼（OCR页 85-86）

原书重讲“女士品茶”实验，核心不是故事本身，而是统计学三个动作：提出无效假设、随机安排试验、计算偶然得到当前结果的概率。

p值衡量的是“在无效假设为真时，当前结果有多罕见”，不是“无效假设为假的概率”。这一点是医学写作最常见误读。

样本量与试验设计决定检验力量：杯数太少时，纯猜中的概率并不低，显著与否很难反映真实能力。

假设检验真正解决的问题是：观察到的差异能否仅由随机误差解释。若概率极低，我们倾向拒绝“仅由随机误差造成”这一解释。

但“拒绝无效假设”不等于“研究假设100%正确”。它只是一种证据更新，后续仍需结合效应量、区间、先验合理性和外部证据。

在医学研究里，预先注册假设、终点和分析路径非常关键。否则很容易出现结果导向分析（p-hacking），导致名义显著但可重复性差。

把I类错误与II类错误放在同一框架看，才是完整决策：过于保守会漏检真实效应，过于激进会放大假阳性。

A/B两方案比较时预先设定双侧检验与α=0.05，避免结果出来后临时改方向。

set.seed(107)
a <- rnorm(45, 8.1, 1.2)
b <- rnorm(45, 7.5, 1.2)
t.test(a, b, alternative="two.sided")

• 报错 `object not found`：先运行完整代码块（含 `set.seed`、`data.frame`），不要只运行最后两行模型代码。
• 报错 `could not find function`：确认函数来源包是否已安装并加载；优先执行 `install.packages('包名')` 后再 `library(包名)`。
• 报错 `non-numeric argument`：检查变量类型，必要时用 `str(dat)` 查看并将字符变量转为数值或因子。
• 报错 `contrasts can be applied only to factors`：分组变量先转因子，例如 `dat$group <- as.factor(dat$group)`。
• 报错 `NA/NaN/Inf in ...`：先清理缺失或无穷值，如 `dat <- na.omit(dat)`，并排查除零与非法变换。
• 结果与页面示例不完全一致：先确认 R 版本与包版本，再完整重跑代码块；模拟数据场景下以“方向与解释框架一致”为主。

分析 > 比较均值 > 独立样本T检验；在方案书中提前写明双侧检验。

T-TEST GROUPS=group(0 1)
/VARIABLES=outcome
/CRITERIA=CI(.95).

论文结果句：'在预设显著性水平α=0.05下，观察到组间差异具有统计学意义（P=0.012），并结合效应量评估其临床意义。'