返回顶部
i

in-silico-perturbation-oracle虚拟基因敲除预测

Virtual gene knockout simulation using foundation models to predict transcriptional

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
228
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

in-silico-perturbation-oracle

计算机模拟扰动预测器

ID: 207
类别: 生物信息学 / 基因组学 / AI驱动药物发现
状态: ✅ 生产就绪
版本: 1.0.0

⚠️ 注意:本工具提供计算机模拟扰动分析框架。实际预测需要与生物基础模型(Geneformer、scGPT等)及湿实验验证数据集成。



概述

计算机模拟扰动预测器是一种基于生物基础模型(Geneformer、scGPT等)的计算生物学工具,用于执行虚拟基因敲除(Virtual KO),预测特定基因删除后的细胞转录组状态变化。

该工具为湿实验前的靶点筛选提供AI驱动的决策支持,显著降低药物开发时间和成本。



功能特性


功能模块描述状态
🧬 基因敲除模拟基于预训练模型的计算机模拟KO预测
📊 差异表达分析
预测敲除后的差异表达基因(DEGs) | ✅ |
| 🔄 通路富集分析 | GO/KEGG通路变化预测 | ✅ |
| 🎯 靶点评分 | 多维度靶点评分与排序 | ✅ |
| 📈 可视化报告 | 生成可解释的图表和报告 | ✅ |
| 🔗 湿实验接口 | 导出湿实验验证建议 | ✅ |


支持的模型


模型描述适用场景
Geneformer基于Transformer的基因表达基础模型通用基因调控网络推断
scGPT
单细胞多组学基础模型 | 单细胞水平扰动预测 |
| scFoundation | 大规模单细胞基础模型 | 跨细胞类型泛化预测 |
| 自定义 | 用户自定义模型 | 特定疾病/组织定制 |


安装

bash

基础依赖


pip install torch transformers scanpy scvi-tools

生物信息学工具

pip install gseapy enrichrpy

模型特定依赖

pip install geneformer scgpt

使用方法

快速开始

bash

单基因敲除预测


python scripts/main.py \
--model geneformer \
--genes TP53,BRCA1,EGFR \
--cell-type lung_adenocarcinoma \
--output ./results/

批量靶点筛选

python scripts/main.py \ --model scgpt \ --genes-file ./target_genes.txt \ --cell-type hepatocyte \ --top-k 20 \ --pathways KEGG,GO_BP \ --output ./results/

Python API

python
from insilicoperturbation_oracle import PerturbationOracle

初始化Oracle

oracle = PerturbationOracle( model_name=geneformer, cell_type=cardiomyocyte )

执行虚拟敲除

results = oracle.predict_knockout( genes=[MYC, KRAS, BCL2], perturbationtype=completeko, # 完全敲除 n_permutations=100 )

获取差异表达基因

degs = results.getdifferentialexpression( pval_threshold=0.05, logfc_threshold=1.0 )

通路富集分析

pathways = results.enrich_pathways( database=[KEGG, GO_BP], top_n=10 )

靶点评分

targetscores = results.scoretargets() print(target_scores.head(10))

输入规范

必需参数

参数类型描述示例
geneslist/str待敲除基因列表[TP53, BRCA1]
cell_type
str | 目标细胞类型 | fibroblast | | model | str | 使用的基础模型 | geneformer |

可选参数

参数类型默认值描述
perturbationtypestrcompleteko敲除类型:completeko/kd/crispr
npermutations
int | 100 | 置换检验次数 | | pathways | list | [KEGG] | 富集分析数据库 | | top_k | int | 50 | 输出Top K靶点 | | control_genes | list | [] | 对照基因列表 | | batch_size | int | 32 | 推理批次大小 |

细胞类型标准命名

yaml

推荐命名格式


epithelial_cells:
- lung_epithelial
- intestinal_epithelial
- mammary_epithelial

immune_cells:
- tcellcd4
- tcellcd8
- b_cell
- macrophage
- dendritic_cell

specialized_cells:
- cardiomyocyte
- hepatocyte
- neuron_excitatory
- fibroblast
- endothelial_cell



输出规范

1. 差异表达结果(deg_results.csv)

列名描述
genesymbol基因符号
log2fold_change
表达变化的Log2倍数 | | p_value | 统计显著性 | | adjustedpvalue | 校正后p值 | | perturbed_gene | 被敲除的基因 | | cell_type | 细胞类型 |

2. 通路富集结果(pathway_enrichment.json)

json
{
KEGG: {
pathways: [
{
name: p53signalingpathway,
p_value: 0.001,
enrichment_ratio: 3.5,
genes: [CDKN1A, GADD45A, MDM2]
}
]
}
}

3. 靶点评分报告(target_scores.csv)

列名描述
targetgene靶点基因
efficacyscore
敲除效果评分(0-1) | | safety_score | 安全性评分(0-1) | | druggability_score | 可药性评分 | | novelty_score | 新颖性评分 | | overall_score | 综合评分 | | recommendation | 湿实验建议 |

4. 可视化报告

  • - volcanoplot.png - 差异表达基因火山图
  • heatmapdegs.png - 差异表达基因热图
  • pathwaynetwork.png - 通路网络图
  • targetranking.png - 靶点排序图

架构

in-silico-perturbation-oracle/
├── configs/
│ ├── geneformer_config.yaml # Geneformer模型配置
│ ├── scgpt_config.yaml # scGPT模型配置
│ └── celltypemapping.yaml # 细胞类型映射
├── data/
│ ├── reference_expression/ # 参考表达谱
│ └── gene_annotations/ # 基因注释文件
├── models/
│ ├── geneformer_adapter.py # Geneformer接口
│ ├── scgpt_adapter.py # scGPT接口
│ └── base_model.py # 基础模型抽象类
├── scripts/
│ └── main.py # 主入口脚本
├── utils/
│ ├── differential_expression.py # 差异表达分析
│ ├── pathway_enrichment.py # 通路富集
│ ├── target_scoring.py # 靶点评分
│ └── visualization.py # 可视化工具
└── examples/
├── singleknockoutexample.py
├── batchscreeningexample.py
└── cancertargetsexample.py



靶点评分算法

靶点评分采用多维度加权评分系统:

综合评分 = w₁ × 效果 + w₂ × 安全性 + w₃ × 可药性 + w₄ × 新颖性

其中:

  • - 效果:基于DEG数量和通路变化幅度
  • 安全性:基于必需基因数据库和毒性预测
  • 可药性:基于可药性和结构可及性
  • 新颖性:基于文献和专利新颖性
  • 权重:w₁=0.35, w₂=0.25, w₃=0.25, w₄=0.15(可配置)



验证与基准测试

已验证数据集

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 in-silico-perturbation-oracle-1775873304 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 in-silico-perturbation-oracle-1775873304 技能

通过命令行安装

skillhub install in-silico-perturbation-oracle-1775873304

下载

⬇ 下载 in-silico-perturbation-oracle v0.1.0(免费)

文件大小: 19.6 KB | 发布时间: 2026-4-12 10:16

v0.1.0 最新 2026-4-12 10:16
Initial public release of In Silico Perturbation Oracle — a virtual gene knockout simulation tool powered by biological foundation models.

- Simulates in silico gene knockouts to predict transcriptomic changes using models like Geneformer and scGPT.
- Provides modules for gene knockout prediction, differential expression analysis, pathway enrichment, target scoring, and visualization reports.
- Supports command-line and Python API usage, with flexible input specification for custom analysis.
- Outputs include DEGs, pathway enrichment, target scoring reports, and interpretable visualization files.
- Reference architecture and clear input/output schemas included for straightforward integration.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部