逻辑回归交互项详解

📊

在临床研究中，逻辑回归常用于评估治疗或暴露对健康结果的影响。添加 交互项 时应基于理论支持、生物学机制或临床经验，而非盲目测试。

1. 何时考虑添加交互项？

场景	示例
药物效果因年龄而异	年轻患者 vs 年长患者对降压药的反应不同
治疗效果因性别而异	某种疗法在男性和女性中的效果差异
基因-环境交互	某基因突变只在特定环境暴露下有影响

理论支持来源

📚

先前研究

文献提示可能存在交互作用

🧬

生物学机制

生理/病理机制支持差异效应

🏥

临床经验

临床观察到的现象

⚠️ 重要：通过理论或实际支持来指导交互项测试，可以增强研究的解释力，避免无目的的"数据挖掘"。

2. 交互项模型实现

基础模型（无交互项）

basic_model <- glm(
  effect ~ drugA + age + gender,
  family = binomial(link = "logit"),
  data = data
)

交互项模型

# 包含交互项（drugA与年龄的交互）
interaction_model <- glm(
  effect ~ drugA * age + gender,
  family = binomial(link = "logit"),
  data = data
)

# 等价写法
# effect ~ drugA + age + drugA:age + gender

结果解释

drugA

当 age=0 时的药物效果

age

当未使用药物时年龄的影响

drugA:age

药物效果随年龄变化的大小

3. 交互项 vs 分层分析

特性	交互项模型	分层分析
变量类型	年龄作为连续或分类变量	年龄分组为类别变量
模型数量	单一模型	多个模型（每层一个）
统计效能	较高（充分利用数据）	较低（样本被分割）
结果解释	趋势性变化	组间直接比较
适用场景	探索连续变化趋势	比较特定组间差异

4. 分层分析实现

步骤1：创建分组变量

# 按四分位数分组
data$age_group <- cut(
  data$age,
  breaks = quantile(data$age, probs = c(0, 0.25, 0.5, 0.75, 1)),
  include.lowest = TRUE,
  labels = c("Q1", "Q2", "Q3", "Q4")
)

步骤2：分层建模

# 对每个年龄组分别建模
model_q1 <- glm(
  y ~ treatment,
  family = binomial(link = "logit"),
  data = subset(data, age_group == "Q1")
)

# 重复其他组...

💡 建议：如果样本量足够，优先使用交互项模型；如果需要直观展示组间差异，可以补充分层分析结果。

逻辑回归交互项详解

1. 何时考虑添加交互项？

理论支持来源

2. 交互项模型实现

基础模型（无交互项）

交互项模型

结果解释

3. 交互项 vs 分层分析

4. 分层分析实现

步骤1：创建分组变量

步骤2：分层建模

📝 总结

✅ 交互项要点

🔄 策略选择