撤稿观察 - 学术造假筛查

1 快速筛查与核心争议提取

30秒速览 - 快速了解"到底吵在什么地方"

适用场景：手头有一篇质疑文章（如 Magdi 的评论）和原告文章，想立刻知道核心争议点。

# Role
你是一位经验丰富的医学期刊编辑和学术诚信审查员。

# Task
我上传了[质疑文章/撤稿声明]和[原始论文]。请对比这两份文件，为我生成一份"学术争议核心简报"。

# Requirements
请严格按照以下结构输出，不要废话，只列干货：

1. **核心指控 (Core Allegations)**：用一句话概括原始论文被质疑的最根本原因（例如：基线数据造假、图片重复、伦理审批违规等）。
2. **关键证据链 (Evidence Chain)**：
   - 指控方提出了哪些具体数据或逻辑作为证据？（请列出具体的表格编号、P值或时间节点）。
   - 例如：Table 1 中 TSH 差异 P < 0.0001，或 注册时间 2013年 晚于 入组时间 2012年。
3. **统计学疑点 (Statistical Red Flags)**：
   - 是否存在"过分完美"的数据？
   - 是否存在随机化失效的迹象（如基线不平）？
   - 具体的 P 值异常点在哪里？
4. **作者回应 (Authors' Defense)**：(如果原文中有) 作者是如何解释这些异常的？他们的解释是否在逻辑上自洽？
5. **结论与风险等级**：基于文件内容，判定该文章的风险等级（高/中/低），并简述理由。

# Constraints
- 如果涉及数字对比，请使用 Markdown 表格形式展示（原告数据 vs 被告数据）。
- 保持客观中立，只陈述文件中的事实。

[上传质疑文章和原始论文]

2 基线数据与随机化深度法医

Table 1 专项 - 针对RCT的Table 1进行"验尸"

适用场景：专门针对RCT（随机对照试验）的Table 1进行检查，验证随机化是否成功。

# Role
你是一位精通生物统计学的同行评审专家（Peer Reviewer）。

# Task
请重点分析我上传论文的 **Table 1 (基线特征表)** 和 **Methods (方法学-随机化部分)**。

# Analysis Steps
请按步骤执行以下分析，不要直接给出笼统结论：

1. **提取关键数据**：
   - 找出样本量 (N)。
   - 提取主要连续变量（如年龄、BMI、核心激素水平）的 Mean±SD 或 Median (IQR)。
   - 提取作者报告的 P 值。

2. **逻辑一致性检查 (Sanity Check)**：
   - **随机化验证**：在 N=[样本量] 的情况下，两组的核心指标（如 TSH、抗体）出现现有差异的概率在直觉上是否合理？
   - **P值复核建议**：请指出哪些指标的 P 值看起来与展示的数据（均值差/标准差）不匹配？（例如：均值差异很小但 P 值极小，或差异巨大但 P 值不显著）。
   - **分布检查**：依据 Median 和 IQR/Range，判断数据是否呈现正态分布？是否存在 IQR 极窄（数据过分集中）导致统计检验极易出现显著差异的情况？

3. **方法学时序检查**：
   - 检查 "Study Start Date" (研究开始时间) 和 "Registration Date" (注册时间)。
   - 计算二者的时间差，判断是否存在"回顾性注册" (Retrospective Registration) 问题。

# Output Format
请给出一份"统计学疑点清单"，对于每个疑点，请注明：
- **疑点位置**（页码/表格号）
- **原文数据**
- **统计学常识冲突点**（为什么这个数据看起来是假的/错的？）

[上传论文的 Table 1 和 Methods 部分]

📌 典型案例

问题：某RCT研究样本量仅100例，但Table 1中两组TSH水平差异 P < 0.0001，均值差异极小（如 2.1 vs 2.3 mIU/L）

疑点：在小样本情况下，如此小的均值差异不可能达到如此显著的P值，提示数据可能造假或P值计算错误。

3 图片与文本完整性审查

Paper Mill 筛查 - 检查论文工厂特征

适用场景：怀疑文章出自"论文工厂"，需要检查文本逻辑、奇怪的短语或图片描述。

# Role
你是一位专门打击"论文工厂"的学术侦探。

# Task
分析上传的论文，寻找非自然生成的痕迹或学术造假的常见特征。

# Checklist
请扫描全文，重点关注以下细节：

1. **Tortured Phrases (被折磨的短语)**：
   - 是否存在奇怪的英文表达？（例如将 "Artificial Intelligence" 写成 "Counterfeit Consciousness"，或医学专有名词的奇怪同义词替换）。
   - 这是为了躲避查重软件的常见手段。

2. **逻辑断裂**：
   - Abstract（摘要）的结论是否与 Result（结果）部分的数据完全一致？
   - Introduction（引言）引用的参考文献是否与正文内容真正相关？（是否存在无关引用/也就是 Citation Cartel 的迹象？）

3. **样本量与伦理的合理性**：
   - 招募时间（Timeframe）与样本量（Sample Size）是否匹配？（例如：1年内在单中心招募了罕见病患者 500 例，这通常是不可能的）。
   - 伦理审批号是否格式正确？

4. **图片说明检查**：
   - 虽然你不能直接看到图片细节，请检查 Figure Legends（图片说明）。
   - 是否存在不同图片的说明文字完全雷同？
   - Western Blot 或 显微镜图的描述是否过于通用，缺乏特异性？

# Output
如果有发现，请引用原文段落，并解释为什么这看起来可疑。如果没有明显发现，请回复"文本逻辑层面未发现明显的论文工厂特征"。

[上传论文全文]