第9章置信区间：给估计留点余地

📘 原书正文提炼（OCR页 103-104）

原书说明了95%置信区间的经典含义：在重复抽样框架下，约95%的此类区间会覆盖总体参数。它是程序性质，不是单次概率宣言。

区间宽度受样本量与波动程度共同影响：样本更大、波动更小，区间通常更窄，估计更精确。

区间解释比“显著/不显著”更连续：既看是否跨越无效值，也看区间是否落在临床可接受范围。

🔍 深入讲解（第三次扩写）

把CI与临床阈值结合，远比只看p值更有意义。比如OR的95%CI虽未跨1，但若上、下限都贴近1，临床价值可能有限。

单次研究的CI不应被读成“参数有95%概率在区间内”。严格说法是：采用该方法反复抽样时，长期覆盖率约95%。

在复杂模型或分布假设不稳时，Bootstrap区间常是实用补充，可减少正态近似偏差带来的误导。

科研汇报建议把CI可视化（森林图/误差线），让“精度与方向”同屏呈现，避免结论过度二元化。

🧩 概念拆解与方法边界

覆盖率：CI方法在长期重复中的命中比例。
精度：区间越窄通常估计越精确。
临床阈值：需要与区间一起判断实际应用价值。

🏥 医学科研落地场景

• 治疗效果报告中优先给RR/OR及95%CI。
• 诊断研究里比较AUC时同步展示区间重叠程度。
• 亚组分析应关注区间宽度，避免过度解读小样本波动。

🧪 小例题（本章最短实战）

比较两组治疗反应率时，同时报告OR与95%CI，判断是否跨越无效值1。

💻 R 最短复现片段

m <- matrix(c(46,24,31,39), nrow=2, byrow=TRUE)
dimnames(m) <- list(treat=c("A","B"), event=c("yes","no"))
chisq.test(m, correct = FALSE)
fisher.test(m)

📌 R结果解释标准模板

• 数据概况：2×2 列联表，比较两组事件发生差异。
• 核心结果：报告 χ²/Fisher 检验结果与 OR(95%CI)。
• 解释句式：'两组事件率差异具有/不具有统计学意义，且效应量 OR=...。'

🛠️ 常见报错排查（R运行失败时怎么改）

• 报错 `object not found`：先运行完整代码块（含 `set.seed`、`data.frame`），不要只运行最后两行模型代码。
• 报错 `could not find function`：确认函数来源包是否已安装并加载；优先执行 `install.packages('包名')` 后再 `library(包名)`。
• 报错 `non-numeric argument`：检查变量类型，必要时用 `str(dat)` 查看并将字符变量转为数值或因子。
• 报错 `contrasts can be applied only to factors`：分组变量先转因子，例如 `dat$group <- as.factor(dat$group)`。
• 报错 `NA/NaN/Inf in ...`：先清理缺失或无穷值，如 `dat <- na.omit(dat)`，并排查除零与非法变换。
• 结果与页面示例不完全一致：先确认 R 版本与包版本，再完整重跑代码块；模拟数据场景下以“方向与解释框架一致”为主。

🖱️ SPSS 最短复现片段

分析 > 描述统计 > 列联表；勾选风险估计（OR及CI）。

CROSSTABS
/TABLES=treat BY event
/STATISTICS=CHISQ RISK.

🧾 论文/汇报可直接套用

结果句：'暴露与结局的关联估计为OR=1.42（95%CI 1.08~1.86），提示存在统计学关联且效应方向稳定。'

⚠️ 本章高发误区

• 把CI当作单次概率陈述。
• 只看是否跨1/0，不看区间宽度。
• 忽略区间与临床阈值关系。
• 显著后不报告区间端点。

✅ 本章实操清单

• 主结果必须附95%CI。
• 同时解释方向、宽度与阈值关系。
• 复杂情形考虑Bootstrap区间。
• 在图表中可视化区间信息。

📝 课后思考题

• 你的主结论如果去掉p值，仅看CI还能成立吗？
• 区间宽度是否足以支持临床决策？
• 是否有关键亚组因样本太小而CI过宽？