BioinfoAI-Assistant v4.0.0 🧬
AI驱动的生物信息学智能分析平台
AI-Powered Bioinformatics Analysis Platform
核心理念 / Core Philosophy
"一键分析,全程自动,智能整理,中文报告"
📥 安装方法 / Installation
方法1:通过 ClawHub 安装(推荐)
CODEBLOCK0
方法2:通过 OpenClaw CLI 安装
CODEBLOCK1
方法3:手动安装
- 1. 下载技能文件夹
- 复制到 OpenClaw 工作目录的
skills/ 文件夹下 - 运行
openclaw skills check 验证安装
系统要求
- - R: 版本 ≥ 4.0.0
- RStudio: 版本 ≥ 2022.07.1
- 必需R包: Seurat, DESeq2, clusterProfiler, ggplot2, rmarkdown
👥 作者信息 / Authors
主要作者 / Primary Author
- - 姓名: (孟令章 教授)
- 全称: Prof. Dr. rer. nat. Lingzhang Meng
- 单位: 广西壮族自治区人民医院(广西医学科学院)
- 邮箱: lzmeng@gxams.org.cn
合作作者 / Co-Author
- - 姓名: 赵净洁
- 邮箱: 87611218@qq.com
🎯 功能概述 / Overview
本技能是一个AI驱动的生物信息学智能分析平台,能够:
- 1. 自动检测测序数据类型(单细胞、普通转录组等)
- 智能推荐生物信息学分析策略
- 自动生成R分析脚本
- 自动整理所有输出文件到结构化子文件夹
- 自动生成详细的中文分析报告
📁 智能自动整理系统 / Intelligent Auto-Organization
自动创建的文件夹结构 / Auto-Created Folder Structure
CODEBLOCK2
📊 中文分析报告 / Chinese Analysis Report
报告内容 / Report Contents
生成的中文分析报告包含:
1. 分析概述 / Analysis Overview
- - 数据类型和基本信息
- 样本数量和细胞数量
- 分析流程概览
2. 质控分析 / Quality Control
-
nFeature_RNA_violin.png: 每个细胞的基因数分布,反映细胞质量
-
nCount_RNA_violin.png: 每个细胞的UMI数分布,反映测序深度
-
percent_MT_violin.png: 线粒体基因比例,高比例可能表示死细胞
-
QC_correlation.png: 基因数与UMI数的相关性
-
cell_QC_stats.csv: 每个细胞的质控统计信息
-
gene_QC_stats.csv: 每个基因的检测频率
3. 降维和聚类 / Dimensionality Reduction & Clustering
-
ElbowPlot.png: 肘部图,帮助选择最佳主成分数
-
PCA_heatmap.png: 主成分热图,显示主要变异来源
-
UMAP_res0.8.png: UMAP降维聚类图,显示细胞群体结构
-
tSNE_res0.8.png: tSNE降维聚类图,另一种可视化
-
cluster_cell_counts.csv: 每个聚类的细胞数量
-
cluster_markers_all.csv: 所有聚类的标记基因
4. 细胞注释 / Cell Annotation
-
DotPlot_top10.png: 点图显示各细胞类型的Top10标记基因
-
Heatmap_all_markers.png: 热图显示所有标记基因表达
-
cell_type_predictions.csv: 每个细胞的类型预测
-
annotation_confidence.csv: 注释置信度评分
5. 差异表达分析 / Differential Expression
-
Volcano_cluster0_vs_others.png: 火山图显示差异基因
-
Heatmap_topDEGs.png: 热图显示Top差异基因
-
DEG_cluster0_vs_all.csv: 聚类0与其他聚类的差异基因
-
DEG_summary_statistics.csv: 差异表达统计汇总
6. 通路分析 / Pathway Analysis
-
GO_enrichment_results.csv: GO富集分析结果
-
KEGG_enrichment_results.csv: KEGG通路富集结果
🤖 AI工作流程 / AI Workflow
步骤1: 数据输入 / Data Input
CODEBLOCK3
步骤2: 项目创建 / Project Creation
CODEBLOCK4
步骤3: 策略选择 / Strategy Selection
CODEBLOCK5
步骤4: 智能脚本生成 / Intelligent Script Generation
CODEBLOCK6
步骤5: 自动执行与文件跟踪 / Auto-Execution with File Tracking
CODEBLOCK7
步骤6: 生成中文分析报告 / Generate Chinese Report
CODEBLOCK8
步骤7: 最终整理报告 / Final Organization Report
AI: 📊 分析完成!
📁 项目: HCC_scRNAseq_20260329/
📈 生成的文件:
├── 02_R脚本/: 8个R脚本
├── 03_结果图片/: 47张图(7个子文件夹)
├── 04_结果表格/: 23个CSV/TXT文件
├── 05_分析报告/: 4个HTML/PDF报告 ⭐
├── 06_R对象/: 5个RDS文件
└── 07_运行日志/: 8个日志文件
📊 总计: 98个文件自动整理!
📖 中文报告: 已生成详细说明文档
✅ 准备发表!
💡 使用示例 / Usage Examples
示例1: 全自动分析 / Full Auto Analysis
CODEBLOCK10
示例2: 分步进行 / Step-by-Step
用户: "为我的数据创建整理好的项目"
AI: ✅ 已创建: MyProject_20260329/ 含8个子文件夹
用户: "生成质控脚本"
AI: ✅ 已保存: 02_R脚本/02_质控分析.R
用户: "运行并保存结果"
AI: ▶️ 运行中... 保存图片到 03_结果图片/01_质控图/
AI: ✅ 已保存6张质控图 + 2个CSV文件 + 1个RDS对象
用户: "生成中文报告"
AI: ✅ 已生成: 05_分析报告/完整分析报告.html
🐛 问题报告 / Issue Reporting
联系作者 / Contact Authors:
主要联系人 / Primary Contact:
- - 姓名: (孟令章 教授)
- 邮箱: lzmeng@gxams.org.cn
- 单位: 广西壮族自治区人民医院(广西医学科学院)
合作作者 / Co-Author:
- - 姓名: 赵净洁
- 邮箱: 87611218@qq.com
🔄 版本历史 / Version History
| 版本 | 日期 | 更新内容 |
|---|
| v4.0.0 | 2026-03-29 | 重大更新: 添加中文分析报告生成功能 |
| v3.0.0 |
2026-03-29 | 智能自动整理系统 |
| v2.0.0 | 2026-03-29 | AI驱动的生物信息学平台 |
| v1.0.0 | 2026-03-29 | 初始版本 |
🙏 使命 / Mission
"一键分析,全程自动,智能整理,中文报告"
让生物信息学分析变得强大、有序、轻松,通过AI自动化实现。
每个文件都有归属。每个分析都可重复。 🧬✨
技能名称: BioinfoAI-Assistant
详细描述:
BioinfoAI-Assistant v4.0.0 🧬
AI驱动的生物信息学智能分析平台
AI-Powered Bioinformatics Analysis Platform
核心理念 / Core Philosophy
一键分析,全程自动,智能整理,中文报告
📥 安装方法 / Installation
方法1:通过 ClawHub 安装(推荐)
bash
clawhub install rstudio-runner
方法2:通过 OpenClaw CLI 安装
bash
openclaw skills install rstudio-runner
方法3:手动安装
- 1. 下载技能文件夹
- 复制到 OpenClaw 工作目录的 skills/ 文件夹下
- 运行 openclaw skills check 验证安装
系统要求
- - R: 版本 ≥ 4.0.0
- RStudio: 版本 ≥ 2022.07.1
- 必需R包: Seurat, DESeq2, clusterProfiler, ggplot2, rmarkdown
👥 作者信息 / Authors
主要作者 / Primary Author
- - 姓名: (孟令章 教授)
- 全称: Prof. Dr. rer. nat. Lingzhang Meng
- 单位: 广西壮族自治区人民医院(广西医学科学院)
- 邮箱: lzmeng@gxams.org.cn
合作作者 / Co-Author
- - 姓名: 赵净洁
- 邮箱: 87611218@qq.com
🎯 功能概述 / Overview
本技能是一个AI驱动的生物信息学智能分析平台,能够:
- 1. 自动检测测序数据类型(单细胞、普通转录组等)
- 智能推荐生物信息学分析策略
- 自动生成R分析脚本
- 自动整理所有输出文件到结构化子文件夹
- 自动生成详细的中文分析报告
📁 智能自动整理系统 / Intelligent Auto-Organization
自动创建的文件夹结构 / Auto-Created Folder Structure
项目名_YYYYMMDD/
│
├── 📂 01_原始数据/ # 原始输入数据(只读)
│ ├── 表达矩阵/
│ ├── 样本信息/
│ └── 元数据/
│
├── 📂 02_R脚本/ # 生成的R脚本
│ ├── 01_数据加载.R
│ ├── 02_质控分析.R
│ ├── 03_数据标准化.R
│ ├── 04_细胞聚类.R
│ ├── 05_细胞注释.R
│ ├── 06_差异表达分析.R
│ ├── 07_拟时序分析.R
│ └── 08_细胞通讯分析.R
│
├── 📂 03_结果图片/ # 所有可视化图片
│ ├── 01_质控图/
│ ├── 02_降维图/
│ ├── 03_聚类图/
│ ├── 04_标记基因图/
│ ├── 05_差异表达图/
│ ├── 06_拟时序图/
│ └── 07_细胞通讯图/
│
├── 📂 04_结果表格/ # 所有CSV/TXT结果文件
│ ├── 01_质控统计/
│ ├── 02_聚类信息/
│ ├── 03_细胞注释/
│ ├── 04_差异表达结果/
│ ├── 05_通路分析/
│ └── 06_元数据/
│
├── 📂 05_分析报告/ # 中文分析报告
│ ├── 完整分析报告.html
│ ├── 质控报告.html
│ ├── 聚类分析报告.html
│ └── 方法学说明.pdf
│
├── 📂 06_R对象/ # 保存的R数据对象
│ ├── seurat_QC后.rds
│ ├── seurat_聚类后.rds
│ └── seurat_注释后.rds
│
├── 📂 07_运行日志/ # 执行日志
│ └── 执行记录.log
│
└── 📂 08_会话信息/ # 可重复性信息
├── R版本信息.txt
└── 包版本记录.csv
📊 中文分析报告 / Chinese Analysis Report
报告内容 / Report Contents
生成的中文分析报告包含:
1. 分析概述 / Analysis Overview
- - 数据类型和基本信息
- 样本数量和细胞数量
- 分析流程概览
2. 质控分析 / Quality Control
- nFeature
RNAviolin.png: 每个细胞的基因数分布,反映细胞质量
- nCount
RNAviolin.png: 每个细胞的UMI数分布,反映测序深度
- percent
MTviolin.png: 线粒体基因比例,高比例可能表示死细胞
- QC_correlation.png: 基因数与UMI数的相关性
- cell
QCstats.csv: 每个细胞的质控统计信息
- gene
QCstats.csv: 每个基因的检测频率
3. 降维和聚类 / Dimensionality Reduction & Clustering
- ElbowPlot.png: 肘部图,帮助选择最佳主成分数
- PCA_heatmap.png: 主成分热图,显示主要变异来源
- UMAP_res0.8.png: UMAP降维聚类图,显示细胞群体结构
- tSNE_res0.8.png: tSNE降维聚类图,另一种可视化
- cluster
cellcounts.csv: 每个聚类的细胞数量
- cluster
markersall.csv: 所有聚类的标记基因
4. 细胞注释 / Cell Annotation
- DotPlot_top10.png: 点图显示各细胞类型的Top10标记基因
- Heatmap
allmarkers.png: 热图显示所有标记基因表达
- cell
typepredictions.csv: 每个细胞的类型预测
- annotation_confidence.csv: 注释置信度评分
5. 差异表达分析 / Differential Expression
- Volcano
cluster0vs_others.png: 火山图显示差异基因
- Heatmap_topDEGs.png: 热图显示Top差异基因
- DEG
cluster0vs_all.csv: 聚类0与其他聚类的差异基因
- DEG
summarystatistics.csv: 差异表达统计汇总
6. 通路分析 / Pathway Analysis
- GO
enrichmentresults.csv: GO富集分析结果
- KEGG
enrichmentresults.csv: KEGG通路富集结果
🤖 AI工作流程 / AI Workflow
步骤1: 数据输入 / Data Input
用户: 分析我的测序数据 F:\\HCC_Xiuli\\0. Datasets\\GSE242889
AI: 🔍 正在分析输入数据...
✅ 检测到: 10X Genomics单细胞RNA测序
✅ 物种: 人类 (Homo sapiens, hg38)
✅ 样本数: 6个HCC样本
✅ 估计细胞数: ~15,000个
步骤2: 项目创建 / Project Creation
AI: 📁 创建组织化的项目结构...
✅ 创建: HCCscRNAseq20260329/
✅ 子文件夹: 8个主要目录
✅ 准备进行分析
步骤3: 策略选择 / Strategy Selection
AI: 🎯 推荐的分析策略:
[1] 🔬 标准单细胞分析流程
• 质控 → 过滤 → 标准化 → 聚类 → 注释
• 输出: ~25个文件
• 预计时间: 45分钟
[2] 🧬 高级整合分析流程
• 批次校正 → 整合 → 亚聚类
• 输出: ~40个文件
• 预计时间: 90分钟
[3] 📊 差异表达重点分析
• 质控 → 聚类 → 找标记基因 → 差异分析
• 输出: ~30个文件
• 预计时间: 60分钟
请选择策略 (1/2/3): 1
步骤4: 智能脚本生成 / Intelligent Script Generation
AI: ✍️ 编写R脚本并设置