返回顶部
c

clinical-data-cleaner临床数据清洗

Use when cleaning clinical trial data, preparing data for FDA/EMA submission, standardizing SDTM datasets, handling missing values in clinical studies, detecting outliers in lab results, or converting raw CRF data to CDISC format. Cleans and standardizes clinical trial data for regulatory compliance with audit trails.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.1
安全检测
已通过
364
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

clinical-data-cleaner

临床数据清洗器

清理、验证并标准化临床试验数据,使其符合CDISC SDTM标准,以便向FDA或EMA提交监管申请。

快速开始

python
from scripts.main import ClinicalDataCleaner

初始化人口学领域

cleaner = ClinicalDataCleaner(domain=DM)

使用默认设置清洗数据

cleaned = cleaner.clean(raw_data)

保存并附带审计追踪

cleaner.save_report(output.csv)

核心功能

1. SDTM领域验证

python
cleaner = ClinicalDataCleaner(domain=DM) # 或 LB, VS
isvalid, missing = cleaner.validatedomain(data)

必填字段:

  • - DM:STUDYID、USUBJID、SUBJID、RFSTDTC、RFENDTC、SITEID、AGE、SEX、RACE
  • LB:STUDYID、USUBJID、LBTESTCD、LBCAT、LBORRES、LBORRESU、LBSTRESC、LBDTC
  • VS:STUDYID、USUBJID、VSTESTCD、VSORRES、VSORRESU、VSSTRESC、VSDTC

2. 缺失值处理

python
cleaner = ClinicalDataCleaner(
domain=DM,
missing_strategy=median # mean、median、mode、forward、drop
)
cleaned = cleaner.handlemissingvalues(data)

3. 异常值检测

python
cleaner = ClinicalDataCleaner(
domain=LB,
outlier_method=domain, # iqr、zscore、domain
outlier_action=flag # flag、remove、cap
)
flagged = cleaner.detect_outliers(data)

临床阈值:

参数范围单位
血糖50-500mg/dL
血红蛋白
5-20 | g/dL |
| 收缩压 | 70-220 | mmHg |

4. 日期标准化

python
standardized = cleaner.standardize_dates(data)

转换为ISO 8601格式:2023-01-15T09:30:00

5. 完整流程

python
cleaner = ClinicalDataCleaner(
domain=DM,
missing_strategy=median,
outlier_method=iqr,
outlier_action=flag
)
cleaned_data = cleaner.clean(data)
cleaner.save_report(output.csv)

输出文件:

  • - output.csv - 清洗后的SDTM数据
  • output.report.json - 用于监管提交的审计追踪

命令行使用

bash

清洗人口学数据


python scripts/main.py \
--input dm_raw.csv \
--domain DM \
--output dm_clean.csv \
--missing-strategy median \
--outlier-method iqr \
--outlier-action flag

使用临床阈值清洗实验室数据

python scripts/main.py \ --input lb_raw.csv \ --domain LB \ --output lb_clean.csv \ --outlier-method domain

常见模式

参见 references/common-patterns.md 获取详细示例:

  • - 监管申报准备
  • 中期分析数据准备
  • 数据库迁移清理
  • 外部实验室数据整合

故障排除

参见 references/troubleshooting.md 获取以下问题的解决方案:

  • - 验证失败
  • 日期解析错误
  • 大数据集内存错误
  • 异常值检测问题

质量检查清单

清洗前:

  • - [ ] 获得IACUC批准(动物研究)
  • [ ] 样本量具有足够统计效力
  • [ ] 随机化方法已记录

清洗后:

  • - [ ] 对照CDISC SDTM IG进行验证
  • [ ] 在审计追踪中审查所有清洗操作
  • [ ] 测试导入分析软件

参考资料

  • - references/sdtmigguide.md - CDISC SDTM实施指南
  • references/domainspecs.json - 领域特定字段要求
  • references/outlierthresholds.json - 临床异常值阈值
  • references/common-patterns.md - 详细使用模式
  • references/troubleshooting.md - 问题解决指南

技能ID:189 | 版本:2.0 | 许可证:MIT

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 clinical-data-cleaner-1775873342 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 clinical-data-cleaner-1775873342 技能

通过命令行安装

skillhub install clinical-data-cleaner-1775873342

下载

⬇ 下载 clinical-data-cleaner v0.1.1(免费)

文件大小: 14.92 KB | 发布时间: 2026-4-12 09:29

v0.1.1 最新 2026-4-12 09:29
No changes detected in this version.

- No file or documentation updates since the previous release.
- Functionality and usage remain unchanged.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部