← 返回白话统计学目录
第8章 / 共16章

第8章 参数估计:一叶落而知秋

估计不是猜数字,而是用样本逼近总体参数。

📘 原书正文提炼(OCR页 96-97)

原书把参数估计分成点估计与区间估计:点估计给一个最可能值,区间估计给不确定范围。点值直观但脆弱,区间更符合科研表达。

最小二乘估计用于线性回归时,目标是让观测值与模型预测值之间的误差平方和最小,从而得到“最贴近数据”的参数。

估计值永远是样本条件下的近似,而非总体真值本身,必须连同误差范围一起解释。

🔍 深入讲解(第三次扩写)

点估计的好处是简洁,但其稳定性依赖样本代表性与样本量。样本稍有偏移,点值就可能明显波动,这也是可重复性问题的重要来源。

最小二乘法之所以常用,是因为它把“拟合好不好”转化为可计算的优化目标;但它也依赖线性关系、误差结构等前提,不满足时需改用更稳健方案。

医学论文中常见“只报OR=1.35”而不报区间,这会让读者无法判断估计精度。规范做法是点值+区间+模型假设检查。

估计阶段建议做敏感性分析:更换变量形式、剔除影响点、替换协变量组合,观察参数方向与量级是否稳定。

🧩 概念拆解与方法边界

🏥 医学科研落地场景

🧪 小例题(本章最短实战)

估计“体重与收缩压关系”的回归系数,同时给出95%CI,避免只报单一β值。

💻 R 最短复现片段

set.seed(108)
wt <- rnorm(160, 65, 9)
dat <- data.frame(
  wt = rnorm(160, 65, 9),
  sbp = 95 + 0.8*wt + rnorm(160,0,8)
)
fit <- lm(sbp ~ wt, data=dat)
summary(fit); confint(fit)

📌 R结果解释标准模板

🛠️ 常见报错排查(R运行失败时怎么改)

🖱️ SPSS 最短复现片段

分析 > 回归 > 线性;勾选系数与置信区间输出。

REGRESSION
/DEPENDENT sbp
/METHOD=ENTER wt
/STATISTICS COEFF CI(95).

🧾 论文/汇报可直接套用

结果写作句:'在调整年龄、性别及基线指标后,暴露变量与结局呈正向关联(β=0.42,95%CI 0.18~0.66)。'

⚠️ 本章高发误区

✅ 本章实操清单

📝 课后思考题