返回顶部
c

crispr-screen-analyzerCRISPR筛选分析器

Process CRISPR screening data to identify essential genes and hit candidates. Performs quality control, statistical analysis (RRA), and hit calling for pooled CRISPR screens including viability screens and drug resistance/sensitivity studies.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
156
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

crispr-screen-analyzer

CRISPR Screen Analyzer

分析混合型CRISPR筛选数据,以鉴定必需基因、耐药/敏感候选基因以及筛选质量指标。支持稳健秩聚合(RRA)分析、质量控制评估和功能基因组学研究的命中基因鉴定。

关键能力:

  • - 质量控制评估:计算基尼指数、测序深度和丢失指标以评估筛选质量
  • 对数倍数变化计算:计算处理组和对照组之间sgRNA水平的倍数变化
  • 统计分析:执行稳健秩聚合(RRA)以鉴定显著富集或缺失的sgRNA
  • 命中基因鉴定:应用FDR和倍数变化阈值鉴定候选基因
  • 多样本支持:同时处理多个重复和处理条件



使用时机

✅ 在以下情况下使用此技能:

  • - 分析全基因组活力筛选以鉴定细胞存活所需的必需基因
  • 执行耐药筛选以发现敲除后赋予耐药性的基因
  • 进行药物敏感性筛选以鉴定合成致死相互作用
  • 在下游分析前对CRISPR筛选数据进行质量控制评估
  • 比较多个处理条件(例如,药物 vs DMSO,缺氧 vs 常氧)
  • 在发表或进一步实验验证前验证筛选质量
  • 为二次筛选或验证实验生成命中基因列表

❌ 在以下情况下不要使用:

  • - 分析单细胞CRISPR数据(Perturb-seq、CROP-seq)→ 使用专门的单细胞分析工具
  • 处理阵列式CRISPR筛选(逐孔格式)→ 使用标准的差异表达分析
  • 执行CRISPR激活(CRISPRa)或干扰(CRISPRi)筛选 → 可能需要调整归一化方法
  • 需要贝叶斯或MAGeCK统计分析 → 此工具使用RRA;如需其他算法请使用MAGeCK
  • 分析小型定制文库(<1000个sgRNA)→ 统计效力可能不足
  • 时间序列CRISPR筛选 → 需要专门的轨迹分析方法

相关技能:

  • - 上游:crispr-grna-designer、fastqc-report-interpreter
  • 下游:go-kegg-enrichment、pathway-visualization、hit-validation-planner



与其他技能的集成

上游技能:

  • - crispr-grna-designer:在筛选前设计sgRNA文库;验证文库组成
  • fastqc-report-interpreter:在CRISPR筛选分析前评估测序质量
  • alignment-quality-checker:验证sgRNA比对率和比对质量

下游技能:

  • - go-kegg-enrichment:对鉴定的命中基因进行通路富集分析
  • pathway-visualization:在通路背景下可视化命中基因
  • hit-validation-planner:为候选基因设计后续实验
  • gene-essentiality-predictor:将筛选结果与已知必需基因数据库进行比较

完整工作流程:

文库设计(crispr-grna-designer)→ 转导 → 测序 → fastqc-report-interpreter → crispr-screen-analyzer → go-kegg-enrichment → 命中基因验证



核心功能

1. 质量控制指标计算

使用既定指标评估CRISPR筛选质量,包括基尼指数、测序深度和sgRNA丢失率。

python
from scripts.main import CRISPRScreenAnalyzer

使用计数矩阵和样本注释初始化分析器

analyzer = CRISPRScreenAnalyzer( countsfile=sgrnacounts.txt, samplesheet=samples.csv )

计算QC指标

qcresults = analyzer.qcmetrics()

查看关键指标

print(质量控制指标:) print(每个样本的总读数:) for sample, reads in qcresults[totalreads].items(): print(f {sample}: {reads:,} 个读数)

print(f\n基尼指数(文库代表性):)
for sample, gini in qcresults[giniindex].items():
status = ✅ 良好 if gini < 0.3 else ⚠️ 需检查 if gini < 0.4 else ❌ 差
print(f {sample}: {gini:.3f} {status})

print(f\n零计数sgRNA(潜在丢失):)
for sample, zeros in qcresults[zerocount_sgrnas].items():
pct = (zeros / len(analyzer.counts)) * 100
print(f {sample}: {zeros} ({pct:.1f}%))

QC指标说明:

指标目标范围解释
基尼指数<0.3衡量文库均匀性;越低表示越均匀
总读数
每个样本>10M | 足够的深度以获得统计效力 |
| 零计数sgRNA | <5% | 可接受的丢失率;更高表示文库损失 |
| 读数分布 | 对数正态 | 应遵循预期分布 |

最佳实践:

  • - ✅ 首先检查基尼指数:值>0.4表示潜在的文库偏差或瓶颈
  • 比较重复样本:QC指标应在重复样本间保持一致
  • 评估时间点:较晚的时间点通常显示更高的丢失率
  • 早期验证:QC差可能需要重复筛选

常见问题及解决方案:

问题:基尼指数高(>0.4)

  • - 症状:sgRNA代表性不均匀,表明文库瓶颈
  • 解决方案:检查MOI(感染复数);验证嘌呤霉素筛选;考虑重复筛选

问题:零计数sgRNA过多(>10%)

  • - 症状:最终样本中许多sgRNA未被检测到
  • 原因:测序深度低、文库降解或强选择压力
  • 解决方案:增加测序深度;在转导时验证文库质量

2. 对数倍数变化计算

计算处理组和对照组之间的log2倍数变化,以鉴定富集或缺失的sgRNA。

python
from scripts.main import CRISPRScreenAnalyzer

analyzer = CRISPRScreenAnalyzer(counts.txt, samples.csv)

定义样本组

controlsamples = [Control1, Control2, Control3] treatmentsamples = [Drug1, Drug2, Drug3]

计算对数倍数变化

lfc = analyzer.calculatelfc(controlsamples, treatment_samples)

分析分布

print(对数倍数变化统计:) print(f 均值:{lfc.mean():.3f}) print(f 标准差:{lfc.std():.3f}) print(f 最大值:{lfc.max():.3f}) print(f 最小值:{lfc.min():.3f})

鉴定极端变化

strong_depletion = lfc[lfc < -2] # 强负向选择 strong_enrichment = lfc[lfc > 2] # 强正向选择

print(f\n强缺失sgRNA:{len(strong_depletion)})
print(f强富集sgRNA:{len(strong_enrichment)})

LFC计算:

lfc = log2((处理组均值 + 1) / (对照组均值 + 1))

解释:

LFC范围解释生物学意义
LFC < -2强缺失必需基因或药物敏感性
LFC -2 至 -1
中度缺失 | 中度效应 |
| LFC -1 至 1 | 无变化 | 无显著效应 |
| LFC 1 至 2 | 中度富集 | 中度耐药性 |
| LFC > 2 | 强富集 | 耐药基因或抑制因子 |

最佳实践:

  • - ✅ 使用伪计数1以避免log(0)问题
  • 平均重复样本以减少技术变异
  • 可视化分布以鉴定批次效应或异常值
  • 检查阳性对照(已知必需基因应具有负LFC)

常见问题及解决方案:

问题:LFC分布偏斜

  • - 症状:均值LFC显著偏离0
  • 原因:文库大小差异、批次效应或强选择压力
  • 解决方案:应用TMM或DESeq2归一化;检查批次效应

问题:极端异常值

  • - 症状:少数sgRNA具有非常大的LFC值
  • 解决方案:对极端值进行缩尾处理;验证这些不是技术伪影

3. 稳健秩聚合(RRA)统计分析

使用z分数和FDR校正进行统计分析,以鉴定显著富集或缺失的sgRNA。

python
from scripts.main import CRISPRScreenAnalyzer

analyzer = CRISPRScreenAnalyzer(counts.txt, samples.csv)

首先计算LFC

lfc = analyzer.calculate_lfc( controlsamples=[Ctrl1, Ctrl_

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 crispr-screen-analyzer-1776259204 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 crispr-screen-analyzer-1776259204 技能

通过命令行安装

skillhub install crispr-screen-analyzer-1776259204

下载

⬇ 下载 crispr-screen-analyzer v0.1.0(免费)

文件大小: 14.16 KB | 发布时间: 2026-4-17 14:31

v0.1.0 最新 2026-4-17 14:31
crispr-screen-analyzer 0.1.0 – Initial release

- Analyze pooled CRISPR screening data for essential gene and hit candidate identification.
- Provides quality control metrics (Gini index, read depth, dropout rates).
- Supports Robust Rank Aggregation (RRA) for statistical analysis of sgRNA enrichment/depletion.
- Calculates log2 fold changes and applies FDR/fold-change thresholds for hit calling.
- Compatible with multiple treatment/control groups and replicates.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部