DS-006 未验证 · UNVERIFIED

Google Scholar 屏蔽论文

Alleged Systematic Censorship by Google Scholar
Mossbridge 声称其论文被 Google Scholar 系统性屏蔽 · 无任何独立验证
Google Scholar 爬虫算法存在大量已知技术问题
类似声称常见于边缘学术群体 · 归因偏差 vs 技术故障
2022 年的一个下午,Julia Mossbridge 坐在电脑前,在 Google Scholar 搜索框里输入了自己的名字。她正在准备一份基金申请,需要整理自己的发表记录。但屏幕上返回的结果让她皱起了眉头。几篇她确定发表过的论文消失了。不是被排到后面,是彻底没有。她换了不同的关键词组合,尝试了论文标题的精确搜索,甚至直接粘贴了 DOI 编号。有些论文出现了,有些没有。而在其他学术搜索引擎——PubMed、Semantic Scholar、ResearchGate——那些"失踪"的论文却好好地躺在那里,可检索,可下载,一切正常。
一个普通研究者在这种情况下可能会这样想:Google Scholar 的爬虫可能漏掉了这些论文。毕竟,Google Scholar 不是魔法——它是一个自动化的信息抓取系统,会出错,会有延迟,会对某些网站访问失败。但 Mossbridge 的解读走向了另一个方向。她开始公开声称,自己的 psi 研究论文遭到了 Google Scholar 的"系统性屏蔽"。不是技术故障,是有针对性的审查。她暗示,一个覆盖全球学术文献的搜索引擎,正在有意识地把她的工作隐藏起来,不让其他研究者发现。
这个声称有一种令人不安的熟悉感。在人类历史上,每一个被主流学术体系边缘化的研究者都曾经历过类似的瞬间:自己的作品被忽视、被拒绝、被遗忘。而将这种经历解读为"被系统性迫害",是一种极其自然的心理反应。但自然不等于真实。Google Scholar 的爬虫算法存在大量已知的缺陷——某些出版商网站会阻止爬虫访问,某些 PDF 格式会导致解析失败,某些期刊的元数据格式不规范——这些技术问题每天都在影响成千上万的论文,无论作者是谁,无论研究内容是什么。把普遍的技术噪声解读为针对个人的信号,是认知心理学中一个经典偏差的完美案例。
Google Scholar 索引路径与遗漏示意
▲ 学术搜索索引遗漏示意。
本卷宗讨论的不是某篇论文是否真实存在,而是从“搜索不到”跳到“被系统性屏蔽”的证据缺口。图中把期刊站点、PDF 元数据、爬虫解析和搜索结果拆开,便于区分技术故障与审查指控。
Source: Local dossier graphic
Mossbridge 声称她的 psi 研究论文被 Google Scholar 系统性屏蔽或降级,使得其他研究者难以通过常规搜索发现这些论文。她暗示这是一种有意识的审查行为,目的可能是压制超心理学研究在学术界的可见度。该声称没有任何独立来源或技术证据支持。

这个主张的戏剧性在于它把一个日常的、普遍的技术问题提升到了阴谋论的层面。Google Scholar 确实会遗漏论文。Semantic Scholar 也会。Microsoft Academic 也会。任何大规模的自动化信息抓取系统都会有覆盖率问题。但"某些论文搜不到"和"某些论文被故意屏蔽"是两个完全不同的主张。从前者跳到后者,需要的不是证据,而是一种特定的心态——一种把世界的随机性解读为针对性的叙事倾向。

2/10 — 技术故障被解读为阴谋,无任何针对性证据

评分依据:Google Scholar 确实会遗漏论文(+1),但遗漏是普遍技术问题,非针对性行为(-2);无任何独立来源验证"屏蔽"声称(-2);Google Scholar 爬虫算法的已知缺陷完全可以解释观察到的现象(-2);没有任何技术证据表明存在针对特定作者或特定主题的人工审查机制(-2);Mossbridge 声称的"系统性屏蔽"在逻辑上要求 Google 内部存在一个审查 psi 研究的秘密部门,这种组织架构极不可能存在(-1)。净得分 2/10。

无技术证据:Mossbridge 没有提供任何技术层面的证据来支持"系统性屏蔽"声称。没有爬虫日志分析,没有与 Google 员工的通信记录,没有与其他 psi 研究者的系统性对比数据。有的只是个人搜索体验的轶事证据。

普通解释充分:Google Scholar 爬虫的已知缺陷——出版商服务器阻止访问、PDF 解析失败、元数据缺失、掠夺性期刊网站技术劣质——完全可以解释为什么某些论文搜不到。这些解释不需要假设任何阴谋,且与观察到的现象完全吻合。

选择性偏差:如果 Google Scholar 真的在"系统性屏蔽"psi 研究,为什么 Dean Radin、Daryl Bem 等其他 psi 研究者的论文可以被正常检索?一个只针对 Mossbridge 个人的"系统性"屏蔽,在逻辑上是自相矛盾的。

受害者叙事的循环自证:"被压制"叙事的一个关键特征是它不可证伪。如果论文搜不到,那就是被屏蔽了;如果论文搜得到,那就是"他们还不敢完全屏蔽"。任何结果都可以被重新解释为支持叙事,这是伪科学的经典标志。
"当你听到蹄声时,应该想到马,而不是斑马——除非你在非洲草原上。在信息检索故障面前,最可能的解释是爬虫bug,而不是全球搜索引擎公司针对个别研究者的秘密审查。" — 对 Hanlon's Razor 的改写:"永远不要把可以用愚蠢解释的事情归咎于恶意"

Q1: Mossbridge 的 Google Scholar 声称在逻辑上犯了一个"从特殊到一般"的跳跃。但在多大程度上,一个亲身经历了"搜索不到自己论文"的研究者,有资格怀疑系统性偏见?个人体验的证词价值是什么?

Q2: "受害者叙事"在边缘学术群体中的普遍性是一个社会心理学现象。如果这种叙事帮助研究者维持动力、抵抗批评、建立群体认同,它是否有什么"功能性"价值——即使它是错误的?

Q3: 科技公司(Google、Meta、X 等)确实会对内容进行算法降级或人工审查。在这种情况下,研究者应该如何区分"真实存在的平台审查"和"想象中的被迫害"?有没有什么方法论原则可以帮助我们做出更好的判断?

Q4: 如果 Mossbridge 的论文确实因为发表在掠夺性期刊上而爬虫收录不全,那么"好的研究被坏的出版商拖累"这个现象本身,是否也是学术出版体系的一个值得关注的系统性问题?

← DS-005 语言压制假说 DS-007 超心理学网络 →