← 返回白话统计学目录
第5章 / 共16章

第5章 如何正确展示你的数据

展示方式决定读者第一眼能否看见真实结构。

📘 原书正文提炼(OCR页 68-70)

原书用“被平均”案例说明:均值相同的两组数据,分布和中位数可能完全不同。只报均值会掩盖结构差异。

方差与标准差不是可有可无的附属项,而是解释不确定性的核心指标。没有离散度信息,中心值几乎无法正确解读。

图表的责任不是“好看”,而是让读者快速识别分布形态、异常值和组间可比性。

🔍 深入讲解(第三次扩写)

均值适合近似对称分布;明显偏态时,中位数与四分位数更能代表“典型个体”。临床费用、住院时长、炎症指标常见偏态,若只报均值易误导决策。

离均差平方和、方差、标准差本质是一条链:先衡量偏离,再标准化到可比较尺度。方差常用于模型推断,标准差更便于日常解释。

展示时应做到“图表与统计口径一致”:如果采用非参数检验,配图也应优先展示中位数和分位分布,而不是只给柱状图均值±误差条。

研究汇报中建议至少包含:样本规模、中心趋势、离散度、异常值处理策略。四项齐全,读者才有能力复核结果可信度。

🧩 概念拆解与方法边界

🏥 医学科研落地场景

🧪 小例题(本章最短实战)

同一均值可能对应完全不同结构:比较两组实验室指标时,先同时报告均值±SD与中位数(IQR)。

💻 R 最短复现片段

set.seed(105)
x <- c(rnorm(90,10,2), 35)
mean(x); sd(x)
median(x); IQR(x)

📌 R结果解释标准模板

🛠️ 常见报错排查(R运行失败时怎么改)

🖱️ SPSS 最短复现片段

分析 > 描述统计 > 探索(同时输出均值、中位数、箱线图)。

EXAMINE VARIABLES=x
/STATISTICS=DESCRIPTIVES
/PLOT=BOXPLOT HISTOGRAM.

🧾 论文/汇报可直接套用

结果句:'该指标呈右偏分布,故采用中位数(IQR)描述;组间比较使用Wilcoxon秩和检验。'

⚠️ 本章高发误区

✅ 本章实操清单

📝 课后思考题