返回顶部
b

blind-review-sanitizer盲审匿名器

One-click removal of author names, affiliations, acknowledgments, and excessive self-citations from manuscripts to meet double-blind peer review requirements. Preserves document structure while anonymizing sensitive information.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
252
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

blind-review-sanitizer

盲审匿名化工具

自动对学术稿件进行匿名化处理,以用于双盲同行评审,通过移除作者标识符、机构隶属关系、致谢部分以及过多的自引,同时保留文档格式和学术内容的完整性。

核心功能:

  • - 作者身份移除:使用模式匹配和可自定义规则自动检测并删除作者姓名、机构隶属关系和联系信息
  • 致谢部分清理:识别并移除或标记可能通过资金来源或个人感谢泄露作者身份的致谢部分
  • 自引检测与中和:识别第一人称引用和可能暴露投稿者身份的过多自引
  • 多格式文档支持:处理DOCX、Markdown和纯文本文件,采用格式感知的匿名化策略
  • 审计追踪生成:创建所有编辑操作的详细日志,用于验证和透明度

参数

参数类型必填默认值描述
--inputstr-输入稿件文件路径(DOCX、MD或TXT)
--output
str | 是 | - | 匿名化输出文件路径 | | --authors | list[str] | 否 | - | 需要删除的作者姓名列表 | | --keep-acknowledgments | bool | 否 | false | 是否保留致谢部分 | | --highlight-self-cites | bool | 否 | false | 仅高亮自引而不替换 |

使用场景

✅ 使用此技能的场景:

  • - 准备向要求作者匿名的期刊提交双盲同行评审稿件
  • 有匿名化要求的会议投稿(如NeurIPS、ICML、ACL、主要医学期刊)
  • 在提交前进行最终合规性检查,确保没有遗留任何身份信息
  • 对之前被拒的稿件进行重新匿名化,以提交给具有不同匿名化标准的新期刊
  • 为公开预印本创建匿名版本,同时保持引文完整性
  • 处理合作稿件,其中部分作者需要在特定投稿中保持匿名

❌ 不要使用此技能的场景:

  • - 准备开放同行评审或采用透明评审流程的期刊 → 改用 cover-letter-drafter
  • 稿件包含正在申请专利的创新,需要作者身份标识 → 先咨询法律顾问
  • 需要添加作者信息而非移除 → 使用 citation-formatter 进行文献管理
  • 处理需要HIPAA合规的高度敏感临床数据 → 使用 hipaa-compliance-auditor 处理医疗数据
  • 文档使用包含嵌入作者宏的复杂LaTeX格式 → 需要人工审核

相关技能:

  • - 上游:cover-letter-drafter、citation-formatter、conflict-of-interest-checker
  • 下游:journal-club-presenter、conference-abstract-adaptor



与其他技能的集成

上游技能:

  • - cover-letter-drafter:在稿件匿名化之后生成投稿信,避免在通信中包含已匿名化的内容
  • citation-formatter:在匿名化之前格式化引文,确保正确的编号和格式
  • conflict-of-interest-checker:在匿名化之前检查合著者利益冲突,保持披露准确性

下游技能:

  • - journal-club-presenter:使用匿名化版本创建演示材料,用于外部评审
  • conference-abstract-adaptor:为可能有不同匿名化要求的会议改编摘要

完整工作流:

稿件撰写 → citation-formatter → conflict-of-interest-checker → blind-review-sanitizer → cover-letter-drafter → 提交



核心功能

1. 作者身份检测与移除

使用模式识别和用户指定规则,系统性地识别并从稿件中移除作者姓名、机构隶属关系和联系信息。

python
from scripts.main import BlindReviewSanitizer

使用已知作者姓名初始化匿名化工具

sanitizer = BlindReviewSanitizer( authors=[张三, 李四, 王五], keep_acknowledgments=False, highlightselfcites=False )

处理文本内容

text = 张三¹, 李四² ¹清华大学计算机科学系 ²北京大学信息学院

邮箱: zhangsan@tsinghua.edu.cn

sanitized = sanitizer.sanitize_text(text)
print(sanitized)

参数:

参数类型必填描述默认值
authorsList[str]需要删除的作者姓名列表。指定后可提高准确性。None
case_sensitive
bool | 否 | 作者姓名匹配是否区分大小写 | False |
| partial_match | bool | 否 | 允许部分姓名匹配(例如,张匹配张三) | True |

最佳实践:

  • - ✅ 始终提供明确的作者姓名(如已知),以提高检测准确性并减少误报
  • 在处理重要稿件前先用样本文档测试,以验证删除模式
  • 在作者列表中包含所有姓名变体(全名、首字母缩写、英文版本)
  • 仔细检查输出,注意可能出现在图表、表格或补充材料中的作者姓名

常见问题及解决方案:

问题:常见词汇被标记为作者姓名

  • - 症状:文本中出现的如王(意为国王)或常见英文名字等词汇被错误删除
  • 解决方案:使用包含全名的明确作者列表;对包含许多常见名字词汇的文档禁用部分匹配

问题:引文中的作者姓名未被检测到

  • - 症状:如Smith等人(2023)所示...在Smith是作者时保留了作者姓名
  • 解决方案:使用自引检测模式,该模式专门针对引文上下文中的作者姓名

2. 机构隶属关系屏蔽

自动检测并用通用占位符替换机构标识符,包括大学、研究所、院系和实验室。

python
from scripts.main import BlindReviewSanitizer

sanitizer = BlindReviewSanitizer()

机构检测使用模式匹配

textwithinstitutions = 斯坦福大学计算机科学系 马克斯·普朗克信息学研究所 MIT CSAIL实验室

处理机构信息

result = sanitizer.removeinstitutions(textwithinstitutions) print(result)

输出:[INSTITUTION], [INSTITUTION], [INSTITUTION]

参数:

参数类型必填描述默认值
institutionkeywordsList[str]用于机构检测的自定义关键词预定义列表
strictmode
bool | 否 | 仅匹配明确的机构模式,减少误报 | False |

最佳实践:

  • - ✅ 为专业领域添加自定义机构关键词(例如联盟、网络),如果不在默认列表中
  • 对误报较多的文档使用严格模式(例如,频繁提到医院的医学文本)
  • 检查机构缩写,全名模式可能无法捕获(例如,JHU代表约翰霍普金斯大学)
  • 验证地理引用,有些可能间接揭示机构信息(例如,硅谷校区)

常见问题及解决方案:

问题:通用词汇被标记为机构

  • - 症状:通用语境中的研究组或技术研究所被替换
  • 解决方案:启用严格模式或添加否定上下文模式以排除通用用法

问题:多校区机构未完全屏蔽

  • - 症状:加州大学伯克利分校被部分屏蔽为[INSTITUTION],伯克利
  • 解决方案:在匿名化前预处理,合并多部分机构名称

3. 致谢部分管理

智能识别并处理可能泄露作者身份或机构隶属关系的致谢部分、资金披露和个人感谢。

python
from scripts.main import BlindReviewSanitizer

初始化为不保留致谢部分

sanitizer = BlindReviewSanitizer(keep_acknowledgments=False)

示例致谢部分

acknowledgment_text = 致谢

我们感谢Johnson教授的有益讨论以及NSF Grant #12345的资助。
本工作是在先进计算中心完成的。

参考文献

lines = acknowledgment_text.split(\n)
processedlines = sanitizer.removeacknowledgments(lines)

print(\n.join(processed_lines))

输出:[致谢已移除] 后跟参考文献部分

参数:

参数类型必填描述默认值
keepacknowledgmentsbool保留致谢部分而非移除False
acknowledgmenttitles
List[str] | 否 | 要识别的自定义章节标题 | 预定义列表 |

最佳实践:

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 blind-review-sanitizer-1775874721 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 blind-review-sanitizer-1775874721 技能

通过命令行安装

skillhub install blind-review-sanitizer-1775874721

下载

⬇ 下载 blind-review-sanitizer v0.1.0(免费)

文件大小: 15.47 KB | 发布时间: 2026-4-12 09:11

v0.1.0 最新 2026-4-12 09:11
Initial release of blind-review-sanitizer: an automated tool for anonymizing academic manuscripts for double-blind peer review.

- Removes author names, institutional affiliations, emails, and acknowledgments that could reveal identity.
- Detects and neutralizes excessive self-citations while preserving document structure and content integrity.
- Supports DOCX, Markdown, and plain text formats; provides redaction logs for transparency.
- Allows customization of redaction targets and acknowledgment handling via parameters.
- Designed for compatibility and workflow integration with other academic writing automation skills.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部