返回顶部
l

low-resource-ai-researcher低资源AI研究员

Train high-performance medical LLMs on consumer GPUs using parameter-efficient

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
93
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

low-resource-ai-researcher

技能:低资源AI研究员

ID: 215
类别: AI/ML研究
语言: Python
框架: PyTorch + PEFT (LoRA/QLoRA) + Transformers

概述

基于参数高效微调(PEFT)技术,在消费级GPU或单张A100上训练高性能医学领域大语言模型。支持LoRA、QLoRA等先进微调方法,针对医学文本理解和生成任务进行了优化。

特性

  • - 🚀 参数高效微调:支持LoRA、QLoRA、DoRA
  • 🏥 医学领域优化:为医学问答、诊断、临床记录预配置
  • 💻 低资源就绪:针对消费级GPU(RTX 3090/4090)和单张A100优化
  • 📊 量化:使用bitsandbytes实现4位/8位量化
  • 🔄 多任务:支持SFT、DPO和医学指令微调
  • 📝 医学数据集:内置支持PubMedQA、MedQA、MIMIC-III

安装

bash

核心依赖


pip install torch transformers datasets accelerate peft bitsandbytes

训练优化可选

pip install flash-attn --no-build-isolation pip install wandb tensorboard

医学NLP工具

pip install scispacy scikit-learn

快速开始

python
from skills.lowresourceai_researcher.scripts.main import MedicalPEFTTrainer

初始化训练器

trainer = MedicalPEFTTrainer( model_name=meta-llama/Llama-2-7b-hf, task=medical_qa )

使用LoRA训练

trainer.train( outputdir=./medicallora_model, num_epochs=3, batch_size=4, use_qlora=True # 4位量化 )

配置

硬件配置

配置GPU内存量化方式最大模型规模批大小
consumer-24g24GB (RTX 3090/4090)QLoRA 4位70B1-2
a100-40g
40GB (A100) | LoRA 8位 | 70B | 4-8 | | a100-80g | 80GB (A100) | LoRA 16位 | 70B | 8-16 | | multi-gpu | 2x A100 | LoRA 16位 | 70B+ | 16+ |

LoRA配置

yaml
lora:
r: 64 # LoRA秩
lora_alpha: 128 # 缩放因子
target_modules: # 应用LoRA的模块
- q_proj
- v_proj
- k_proj
- o_proj
- gate_proj
- up_proj
- down_proj
lora_dropout: 0.05
bias: none
tasktype: CAUSALLM

CLI使用

bash

基础训练


python scripts/main.py \
--modelnameor_path meta-llama/Llama-2-7b-hf \
--dataset medical_qa \
--output_dir ./output \
--use_qlora \
--perdevicetrainbatchsize 4

使用自定义配置

python scripts/main.py --config configs/medical_qlora.yaml

恢复训练

python scripts/main.py --resumefromcheckpoint ./output/checkpoint-1000

API参考

MedicalPEFTTrainer

python
trainer = MedicalPEFTTrainer(
model_name: str, # 基础模型名称/路径
task: str, # 任务类型:medicalqa, diagnosis, clinicalnote
lora_r: int = 64, # LoRA秩
lora_alpha: int = 128, # LoRA alpha
use_qlora: bool = False, # 使用4位量化
target_modules: List[str] = None,
device_map: str = auto,
trustremotecode: bool = True
)

方法

方法描述
train()使用配置参数开始微调
evaluate()
在医学基准数据集上评估 | | mergeandsave() | 合并LoRA权重并保存完整模型 | | load_model() | 加载训练好的模型进行推理 | | generate() | 生成医学文本/回答 |

支持的模型

  • - LLaMA 2/3 (7B, 13B, 70B)
  • Mistral (7B, 8x7B)
  • Yi (6B, 34B)
  • Qwen (7B, 14B, 72B)
  • Baichuan (7B, 13B)
  • ChatGLM (6B)

医学数据集

数据集描述规模
PubMedQA生物医学问答1k问答对
MedQA
USMLE风格问题 | 61k | | MedMCQA | 医学入学考试问答 | 194k | | MIMIC-III | 临床记录 | 去标识化 | | CMeEE | 中文医学命名实体识别 | 15k | | Huatuo-26M | 中文医学语料库 | 2600万样本 |

性能基准

模型方法GPU训练时间MedQA准确率
LLaMA-2-7BLoRAA100-40G2小时58.2%
LLaMA-2-7B
QLoRA | RTX 4090 | 3小时 | 57.8% | | LLaMA-2-13B | QLoRA | A100-40G | 4小时 | 62.5% | | Mistral-7B | LoRA | A100-40G | 2.5小时 | 61.3% |

最佳实践

  1. 1. 梯度累积:用于实现有效的更大批大小
  2. 学习率:LoRA从2e-4开始,全参数微调从1e-4开始
  3. 预热步数:医学领域适应100步
  4. 最大长度:临床记录2048-4096,问答512-1024
  5. 数据质量:仔细过滤低质量医学数据

故障排除

内存不足

python

启用梯度检查点

trainer.train(gradient_checkpointing=True)

减少序列长度

trainer.train(maxseqlength=1024)

对大模型使用DeepSpeed ZeRO-3

训练缓慢

python

启用Flash Attention

trainer.train(useflashattention=True)

在Ampere GPU上使用bf16

trainer.train(bf16=True)

许可证

本技能遵循所使用基础模型的许可证。医学应用需遵守HIPAA/GDPR法规。

参考文献

  1. 1. Hu等人(2021) - LoRA:大语言模型的低秩适应
  2. Dettmers等人(2023) - QLoRA:量化LLM的高效微调
  3. Singhal等人(2023) - 大语言模型编码临床知识

风险评估

风险指标评估级别
代码执行Python/R脚本本地执行
网络访问
无外部API调用 | 低 | | 文件系统访问 | 读取输入文件,写入输出文件 | 中 | | 指令篡改 | 标准提示指南 | 低 | | 数据暴露 | 输出文件保存到工作空间 | 低 |

安全检查清单

  • - [ ] 无硬编码凭据或API密钥
  • [ ] 无未经授权的文件系统访问(../)
  • [ ] 输出不暴露敏感信息
  • [ ] 已实施提示注入保护
  • [ ] 输入文件路径已验证(无../遍历)
  • [ ] 输出目录限制在工作空间内
  • [ ] 脚本在沙盒环境中执行
  • [ ] 错误消息已清理(不暴露堆栈跟踪)
  • [ ] 依赖项已审计

先决条件

bash

Python依赖


pip install -r requirements.txt

评估标准

成功指标

  • - [ ] 成功执行主要功能
  • [ ] 输出达到质量标准
  • [ ] 优雅处理边缘情况
  • [ ] 性能可接受

测试用例

  1. 1. 基本功能:标准输入

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 low-resource-ai-researcher-1776013515 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 low-resource-ai-researcher-1776013515 技能

通过命令行安装

skillhub install low-resource-ai-researcher-1776013515

下载

⬇ 下载 low-resource-ai-researcher v1.0.0(免费)

文件大小: 11.47 KB | 发布时间: 2026-4-13 10:54

v1.0.0 最新 2026-4-13 10:54
- Initial release of Low-Resource AI Researcher skill (v1.0.0)
- Enables training of high-performance medical large language models on consumer GPUs using parameter-efficient fine-tuning (LoRA, QLoRA)
- Supports popular medical datasets (PubMedQA, MedQA, MIMIC-III) and multiple LLM architectures (LLaMA, Mistral, Yi, Qwen, Baichuan, ChatGLM)
- Provides configurable hardware profiles, quantization options, and CLI/API usage for flexible training and evaluation
- Includes security, troubleshooting, and best practice guidelines for safe and efficient usage

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部