返回顶部
e

ehr-semantic-compressorEHR语义压缩

AI-powered EHR summarization using Transformer architecture to extract

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
163
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

ehr-semantic-compressor

EHR 语义压缩器

概述

基于人工智能的EHR摘要生成工具,采用Transformer架构从冗长医疗记录中提取关键临床信息。该技能可处理长篇电子健康记录(EHR)文档,并生成结构化、临床准确的摘要。

技术难度:高

使用场景

  • - 输入包含需要摘要的长篇EHR文档(1600字以上)
  • 需要结构化提取临床记录中的关键信息
  • 需要快速查阅患者病史、用药、过敏史或诊断信息
  • 需要在保持准确性的同时压缩医疗文档

核心功能

  1. 1. 快速处理:10-20秒内处理长篇EHR文档(1600字以上)
  2. 结构化摘要:生成要点式摘要(200-300字)
  3. 关键信息提取
- 患者过敏史及不良反应 - 家族病史 - 当前及既往用药 - 诊断与病症 - 生命体征与实验室检查结果 - 手术与操作
  1. 4. 临床准确性:保持医疗信息的完整性

使用方法

基本用法

bash
python scripts/main.py --input ehr_document.txt --output summary.json

输入格式

json
{
ehr_text: 完整EHR文档文本...,
max_length: 300,
extractsections: [allergies, medications, diagnoses, familyhistory]
}

输出格式

json
{
status: success,
data: {
summary: 结构化要点摘要...,
extracted_sections: {
allergies: [...],
medications: [...],
diagnoses: [...],
family_history: [...]
},
metadata: {
original_length: 2500,
summary_length: 280,
compression_ratio: 0.89
}
}
}

参数说明

参数类型默认值必填描述
--input, -istring-输入EHR文档文本文件路径
--output, -o
string | - | 否 | 输出JSON文件路径 | | --max-length | int | 300 | 否 | 摘要最大字数 | | --extract-sections | string | all | 否 | 需提取的章节(逗号分隔) | | --format | string | json | 否 | 输出格式(json、markdown、text) |

技术细节

架构

  • - 基础模型:基于Transformer的编码器-解码器架构
  • 医学领域适配:在临床文本语料库上进行微调
  • 章节提取:规则+机器学习混合方法处理结构化数据
  • 处理流程:文本分割 -> 摘要生成 -> 章节提取 -> 输出格式化

依赖项

完整列表请参见 references/requirements.txt。

主要依赖项:

  • - transformers >= 4.30.0
  • torch >= 2.0.0
  • spacy >= 3.6.0
  • scispacy >= 0.5.3

性能指标

  • - 处理时间:1600字以上文档需10-20秒
  • 内存:约需2GB RAM
  • 输出长度:200-300字(可配置)
  • 压缩率:约85-90%

参考资料

  • - references/requirements.txt - Python依赖项
  • references/guidelines.md - 临床摘要指南
  • references/sampleinput.json - 输入格式示例
  • references/sampleoutput.json - 输出格式示例

安全与合规

  • - 无外部API调用或服务依赖
  • 所有处理均在本地完成
  • 无患者数据传输至系统外
  • 错误信息为语义化,不暴露技术细节

测试

运行单元测试:
bash
cd scripts
python test_main.py

错误处理

所有错误均返回语义化信息:

json
{
status: error,
error: {
type: inputvalidationerror,
message: EHR文本为空或过短,
suggestion: 请提供至少100字的EHR文本
}
}

风险评估

风险指标评估等级
代码执行Python/R脚本本地执行
网络访问
无外部API调用 | 低 | | 文件系统访问 | 读取输入文件,写入输出文件 | 中 | | 指令篡改 | 标准提示指南 | 低 | | 数据泄露 | 输出文件保存至工作区 | 低 |

安全检查清单

  • - [ ] 无硬编码凭据或API密钥
  • [ ] 无未授权文件系统访问(../)
  • [ ] 输出不暴露敏感信息
  • [ ] 已实施提示注入防护
  • [ ] 输入文件路径已验证(无../遍历)
  • [ ] 输出目录限制在工作区
  • [ ] 脚本在沙盒环境中执行
  • [ ] 错误信息已清理(不暴露堆栈跟踪)
  • [ ] 依赖项已审计

前置条件

bash

Python依赖项


pip install -r requirements.txt

评估标准

成功指标

  • - [ ] 成功执行主要功能
  • [ ] 输出符合质量标准
  • [ ] 优雅处理边缘情况
  • [ ] 性能可接受

测试用例

  1. 1. 基本功能:标准输入 → 预期输出
  2. 边缘情况:无效输入 → 优雅错误处理
  3. 性能:大数据集 → 可接受处理时间

生命周期状态

  • - 当前阶段:草稿
  • 下次审核日期:2026-03-06
  • 已知问题:无
  • 计划改进
- 性能优化 - 新增功能支持

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ehr-semantic-compressor-1776122702 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ehr-semantic-compressor-1776122702 技能

通过命令行安装

skillhub install ehr-semantic-compressor-1776122702

下载

⬇ 下载 ehr-semantic-compressor v0.1.0(免费)

文件大小: 11.77 KB | 发布时间: 2026-4-17 14:44

v0.1.0 最新 2026-4-17 14:44
Initial release of ehr-semantic-compressor—an AI-powered tool for generating structured summaries from lengthy EHRs.

- Summarizes 1600+ word EHR documents in 10–20 seconds with Transformer-based models
- Extracts key clinical information: allergies, medications, diagnoses, family history, lab results, and more
- Outputs 200–300 word bullet summaries with detailed section extraction
- Supports JSON, Markdown, and text output formats; configurable via command-line arguments
- Emphasizes clinical accuracy, local processing (no external API calls), and strict security controls
- Provides comprehensive error handling and test coverage for robust usage

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部