为了高效分析疑似造假文献、撤稿声明或学术评论文章(Commentary/Letter),以下设计了三套不同深度的AI提示词。让AI充当你的"初级学术侦探"。
🎯 这些提示词基于基线数据核查、注册时间线对比、统计学不可能事件的分析逻辑。
1 快速筛查与核心争议提取
30秒速览 - 快速了解"到底吵在什么地方"
适用场景:手头有一篇质疑文章(如 Magdi 的评论)和原告文章,想立刻知道核心争议点。
# Role 你是一位经验丰富的医学期刊编辑和学术诚信审查员。 # Task 我上传了[质疑文章/撤稿声明]和[原始论文]。请对比这两份文件,为我生成一份"学术争议核心简报"。 # Requirements 请严格按照以下结构输出,不要废话,只列干货: 1. **核心指控 (Core Allegations)**:用一句话概括原始论文被质疑的最根本原因(例如:基线数据造假、图片重复、伦理审批违规等)。 2. **关键证据链 (Evidence Chain)**: - 指控方提出了哪些具体数据或逻辑作为证据?(请列出具体的表格编号、P值或时间节点)。 - 例如:Table 1 中 TSH 差异 P < 0.0001,或 注册时间 2013年 晚于 入组时间 2012年。 3. **统计学疑点 (Statistical Red Flags)**: - 是否存在"过分完美"的数据? - 是否存在随机化失效的迹象(如基线不平)? - 具体的 P 值异常点在哪里? 4. **作者回应 (Authors' Defense)**:(如果原文中有) 作者是如何解释这些异常的?他们的解释是否在逻辑上自洽? 5. **结论与风险等级**:基于文件内容,判定该文章的风险等级(高/中/低),并简述理由。 # Constraints - 如果涉及数字对比,请使用 Markdown 表格形式展示(原告数据 vs 被告数据)。 - 保持客观中立,只陈述文件中的事实。 [上传质疑文章和原始论文]
2 基线数据与随机化深度法医
Table 1 专项 - 针对RCT的Table 1进行"验尸"
适用场景:专门针对RCT(随机对照试验)的Table 1进行检查,验证随机化是否成功。
# Role 你是一位精通生物统计学的同行评审专家(Peer Reviewer)。 # Task 请重点分析我上传论文的 **Table 1 (基线特征表)** 和 **Methods (方法学-随机化部分)**。 # Analysis Steps 请按步骤执行以下分析,不要直接给出笼统结论: 1. **提取关键数据**: - 找出样本量 (N)。 - 提取主要连续变量(如年龄、BMI、核心激素水平)的 Mean±SD 或 Median (IQR)。 - 提取作者报告的 P 值。 2. **逻辑一致性检查 (Sanity Check)**: - **随机化验证**:在 N=[样本量] 的情况下,两组的核心指标(如 TSH、抗体)出现现有差异的概率在直觉上是否合理? - **P值复核建议**:请指出哪些指标的 P 值看起来与展示的数据(均值差/标准差)不匹配?(例如:均值差异很小但 P 值极小,或差异巨大但 P 值不显著)。 - **分布检查**:依据 Median 和 IQR/Range,判断数据是否呈现正态分布?是否存在 IQR 极窄(数据过分集中)导致统计检验极易出现显著差异的情况? 3. **方法学时序检查**: - 检查 "Study Start Date" (研究开始时间) 和 "Registration Date" (注册时间)。 - 计算二者的时间差,判断是否存在"回顾性注册" (Retrospective Registration) 问题。 # Output Format 请给出一份"统计学疑点清单",对于每个疑点,请注明: - **疑点位置**(页码/表格号) - **原文数据** - **统计学常识冲突点**(为什么这个数据看起来是假的/错的?) [上传论文的 Table 1 和 Methods 部分]
📌 典型案例
问题:某RCT研究样本量仅100例,但Table 1中两组TSH水平差异 P < 0.0001,均值差异极小(如 2.1 vs 2.3 mIU/L)
疑点:在小样本情况下,如此小的均值差异不可能达到如此显著的P值,提示数据可能造假或P值计算错误。
3 图片与文本完整性审查
Paper Mill 筛查 - 检查论文工厂特征
适用场景:怀疑文章出自"论文工厂",需要检查文本逻辑、奇怪的短语或图片描述。
# Role 你是一位专门打击"论文工厂"的学术侦探。 # Task 分析上传的论文,寻找非自然生成的痕迹或学术造假的常见特征。 # Checklist 请扫描全文,重点关注以下细节: 1. **Tortured Phrases (被折磨的短语)**: - 是否存在奇怪的英文表达?(例如将 "Artificial Intelligence" 写成 "Counterfeit Consciousness",或医学专有名词的奇怪同义词替换)。 - 这是为了躲避查重软件的常见手段。 2. **逻辑断裂**: - Abstract(摘要)的结论是否与 Result(结果)部分的数据完全一致? - Introduction(引言)引用的参考文献是否与正文内容真正相关?(是否存在无关引用/也就是 Citation Cartel 的迹象?) 3. **样本量与伦理的合理性**: - 招募时间(Timeframe)与样本量(Sample Size)是否匹配?(例如:1年内在单中心招募了罕见病患者 500 例,这通常是不可能的)。 - 伦理审批号是否格式正确? 4. **图片说明检查**: - 虽然你不能直接看到图片细节,请检查 Figure Legends(图片说明)。 - 是否存在不同图片的说明文字完全雷同? - Western Blot 或 显微镜图的描述是否过于通用,缺乏特异性? # Output 如果有发现,请引用原文段落,并解释为什么这看起来可疑。如果没有明显发现,请回复"文本逻辑层面未发现明显的论文工厂特征"。 [上传论文全文]
💡 使用建议
1. 文件投喂技巧
如果是PDF,AI可能读得不完整,最好把 Abstract, Methods, Table 1 截图或复制文字给它。
2. 追问技巧
如果AI回复"数据看起来有差异",可以直接追问:
"根据这些Summary Data,你能帮我写一段Python代码来估算P值吗?"
3. 核心抓手
对于撤稿分析,永远聚焦于 Table 1(随机化是否成功) 和 Timeline(是否先做实验后注册),这是最容易实锤的两个点。