← 返回白话统计学目录
第1章 / 共16章

第1章 为什么要学统计

统计学不是背公式,而是把噪声变成可决策的信息。

📘 原书正文提炼(OCR页 17-19)

原书开篇强调:统计学的价值不在“定义有多漂亮”,而在它能不能把杂乱数据转成有方向的判断。21世纪是数字社会,读不懂数据,就像只会看字却看不懂新闻背后的逻辑。

书里还反复提醒“不要把大数据神化”。数据量再大,如果采集偏、解释偏、方法选错,挖出来的可能是闪光玻璃而不是金子;统计思维的任务就是识别这层错觉。

从生活到科研,统计都在处理同一件事:不确定。我们并不是追求“绝对真理”,而是在已知证据下做风险更低、可复核的选择。

🔍 深入讲解(第三次扩写)

很多同学学统计时容易卡在“公式太多”。但真正的学习顺序应当是:先问问题,再看数据,再选方法,最后才是公式。公式只是表达工具,问题意识才是发动机。

在医学研究里,统计不是写论文最后一晚才加的“方法学装饰”。研究设计、样本量估算、结局指标定义、亚组分析边界,全部都属于统计决策链的一部分。

原书用新闻阅读举例很典型:同一条新闻,用“比例”“均值”“同比”“环比”不同口径都能讲出不同故事。统计训练的核心能力,就是在这些口径里追问可比性与边界条件。

你会统计之后,最大的变化不是会做更多检验,而是更少被情绪标题带节奏:看到结论先问样本来源、抽样方式、对照策略、不确定性表达,这就是理性思维的具体动作。

🧩 概念拆解与方法边界

🏥 医学科研落地场景

🧪 小例题(本章最短实战)

随机抽取两组各40人,比较干预前后健康宣教后的“统计素养测试得分”差异,目标是判断宣教是否带来实际提升,而不是只看单次高分个案。

💻 R 最短复现片段

set.seed(101)
group <- rep(c("control","intervention"), each = 40)
score <- c(rnorm(40, 62, 8), rnorm(40, 69, 8))
dat <- data.frame(group, score)
res <- t.test(score ~ group, data = dat)
res

📌 R结果解释标准模板

🛠️ 常见报错排查(R运行失败时怎么改)

🖱️ SPSS 最短复现片段

分析 > 比较均值 > 独立样本T检验;检验变量=score,分组变量=group(定义两组)。

T-TEST GROUPS=group('control' 'intervention')
/VARIABLES=score
/CRITERIA=CI(.95).

🧾 论文/汇报可直接套用

可直接用于论文背景句:'在数字化临床场景下,仅有数据规模并不足以支撑可靠结论,仍需基于统计学框架完成偏倚识别、效应估计与不确定性量化。'

⚠️ 本章高发误区

✅ 本章实操清单

📝 课后思考题