🇬🇧 PHESANT
UK Biobank 官方
高级
PHESANT (Phenome-Scan ANalysis Tool) 是英国 Biobank 官方提供的 PheWAS 分析工具,专门用于处理 UK Biobank 的丰富表型数据。
主要特点
- ✓ 支持连续变量、分类变量、Ordered categorical 变量
- ✓ 自动表型编码和数据预处理
- ✓ 提供逆正态变换处理非正态分布
- ✓ 支持 Logistic 和线性回归
- ✓ 多重检验校正
安装
# 从 GitHub 安装
devtools::install_github("phenoscanner/PHESANT")
# 或下载源码
# https://github.com/phenoscanner/PHESANT
基本用法
library(PHESANT)
# 准备数据(需要包含 SNP 和表型数据)
# data: data.frame,包含 SNP 和表型列
# variable: 表型变量名
# typeOfVariable: 变量类型
# - "continuous": 连续变量
# - "binary": 二分类变量
# - "categorical": 无序分类
# - "ordinal": 有序分类
# 运行 PheWAS
result <- phenomeScan(
data = your_data,
variable = "your_phenotype",
typeOfVariable = "continuous",
snp = "your_snp",
noiseVar = NULL
)
📖 文档:GitHub PHESANT
📊 Phewas R Package
Phewas 是另一个常用的 R 包,专注于 PheWAS 分析,提供简洁的接口和可视化功能。
安装
# 安装稳定版本
install.packages("Phewas")
# 或从 GitHub 安装开发版
devtools::install_github("PhewasMan/Phewas")
基本用法
library(Phewas)
# 准备数据
# 需要 SNPs x Phenotypes 的矩阵
# 快速 PheWAS 分析
phewas_result <- phewas(
y = phenotype_data, # 表型数据(矩阵或数据框)
x = snp_data, # SNP 数据(矩阵)
cores = 4 # 并行核心数
)
# 可视化
manhattan_plot(phewas_result)
⚡ PLINK 命令行方法
对于大规模 PheWAS,可以使用 PLINK 命令行工具进行高效分析。
基本命令
# 连续表型的线性回归
plink --bfile your_data \
--pheno continuous_pheno.txt \
--linear \
--out phewas_continuous
# 二分类表型的 Logistic 回归
plink --bfile your_data \
--pheno binary_pheno.txt \
--logistic \
--out phewas_binary
# 批量处理多个表型
for pheno in *.phen; do
plink --bfile your_data \
--pheno $pheno \
--linear \
--out results/$(basename $pheno .phen)
done
💡 提示:PLINK 适合大规模批量分析,但需要较强的计算资源。建议使用集群或高性能服务器。
🔬 其他在线工具
📊 工具对比
| 工具 | 适用场景 | 优点 | 缺点 |
|---|---|---|---|
| mrasst | IEU 数据库用户 | 集成 MR 分析 | 依赖网络 |
| ieugwasr | API 调用 | 灵活、覆盖广 | 需要网络 |
| PHESANT | UK Biobank | 官方认可、功能全 | 仅 UKB |
| Phewas 包 | 本地分析 | 轻量、可视化 | 功能有限 |
| PLINK | 大规模批量 | 高效、命令行 | 门槛高 |