← 返回白话统计学目录
第15章 / 共16章

第15章 相关与一致性分析

相关不等于因果;高相关也不等于可互换。

📘 原书正文提炼(OCR页 215-216)

原书从协方差推到相关系数,核心直觉是:看两个变量偏离各自均值时是否“同向移动”。同向越一致,线性相关越强。

相关分析回答的是“是否同向变化”,而一致性分析回答的是“测量值是否可互换”。两者问题不同,方法不能混用。

书中提到伪相关案例,提醒我们:看见高r值并不代表存在真实机制,更不代表因果关系成立。

🔍 深入讲解(第三次扩写)

Pearson相关适合线性、近似正态且受离群点影响明显;Spearman相关对秩次更稳健。先看散点图,再决定相关系数类型,是基本流程。

新旧检测方法比较时,仅报告r值远远不够。即使r很高,也可能存在系统偏倚,因此需补充Bland-Altman或Kappa等一致性指标。

临床预测研究里,变量相关性高可能引发多重共线性,影响回归系数稳定性,需结合VIF或降维方法处理。

相关分析应同时报告方向、强度、区间和图形证据,避免把一个数字当成完整故事。

🧩 概念拆解与方法边界

🏥 医学科研落地场景

🧪 小例题(本章最短实战)

比较新旧检测法时先做相关,再做一致性(Bland-Altman)评估是否可互换。

💻 R 最短复现片段

set.seed(115)
x <- rnorm(120, 85, 11)
y <- x + rnorm(120, 0.8, 5)
cor.test(x, y, method="pearson")
mean_diff <- mean(y-x); sd_diff <- sd(y-x)
loa <- c(mean_diff - 1.96*sd_diff, mean_diff + 1.96*sd_diff)
c(mean_diff = mean_diff, loa_low = loa[1], loa_high = loa[2])

📌 R结果解释标准模板

🛠️ 常见报错排查(R运行失败时怎么改)

🖱️ SPSS 最短复现片段

相关分析输出Pearson;再计算差值变量并做均值±1.96SD界限。

CORRELATIONS /VARIABLES=x y /PRINT=TWOTAIL.
COMPUTE diff = y - x.
DESCRIPTIVES VARIABLES=diff.

🧾 论文/汇报可直接套用

结果句:'两指标呈中等正相关(r=0.56,95%CI 0.42~0.67),但一致性分析显示仍存在系统偏差。'

⚠️ 本章高发误区

✅ 本章实操清单

📝 课后思考题