← 返回白话统计学目录
第2章 / 共16章

第2章 变异:统计学存在的基础

没有变异就不需要统计;有变异就必须学统计。

📘 原书正文提炼(OCR页 21-23)

原书把“变异”放在统计学起点:个体差异与抽样波动客观存在,所以我们无法靠单个观察直接推出总体结论,必须借助统计推断。

“随机变量”不是说已经观测到的数值会乱跳,而是说如果重新抽样,得到的样本统计量会变化。一次调查的结果只是众多可能结果中的一个实现。

统计工作的本质,是在随机与波动中识别稳定模式:多数人层面的规律,而非少数个案的偶然巧合。

🔍 深入讲解(第三次扩写)

从方法论上看,变异主要来自两类:随机误差与系统偏差。前者可通过扩大样本、优化测量降低影响;后者则要靠设计环节控制,如随机化、盲法、统一流程。

很多“神奇疗法”传播快,是因为个体改善案例天然更吸睛。但统计要求把镜头拉到总体:若绝大多数人无获益,个案就不能上升为规律。

抽样调查之所以可行,前提是代表性。原书给出的历史案例说明:样本再大,如果抽样框架错了,结论一样会严重偏离现实。

医学上常见的“这批病人看起来都有效”,需要回到变异框架:比较组间差异是否超过组内波动,并排除选择偏倚和信息偏倚。

🧩 概念拆解与方法边界

🏥 医学科研落地场景

🧪 小例题(本章最短实战)

比较某药物前后收缩压变化时,先看“个体波动”再看“组均值变化”,用可视化确认并非少数极端值驱动结论。

💻 R 最短复现片段

set.seed(102)
df <- data.frame(
  id=1:60,
  pre=rnorm(60, 148, 12),
  post=rnorm(60, 140, 12)
)
df$delta <- df$post - df$pre
summary(df$delta)
sd(df$delta)
t.test(df$post, df$pre, paired = TRUE)

📌 R结果解释标准模板

🛠️ 常见报错排查(R运行失败时怎么改)

🖱️ SPSS 最短复现片段

转换 > 计算变量(delta=post-pre);分析 > 描述统计 > 描述。

COMPUTE delta = post - pre.
DESCRIPTIVES VARIABLES=delta /STATISTICS=MEAN STDDEV MIN MAX.

🧾 论文/汇报可直接套用

方法学写作句:'考虑到个体差异与抽样误差,本研究采用代表性抽样并通过统计推断估计目标总体参数。'

⚠️ 本章高发误区

✅ 本章实操清单

📝 课后思考题