返回顶部
c

cnv-caller-plotterCNV检测绘图

Detect copy number variations from whole genome sequencing data and generate publication-quality genome-wide CNV plots. Supports CNV calling, segmentation, and visualization for cancer genomics and rare disease analysis.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
157
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

cnv-caller-plotter

CNV 检测与绘图工具

从全基因组测序(WGS)数据中检测拷贝数变异(CNV),并生成适用于癌症基因组学、罕见病分析和群体遗传学研究的全基因组可视化图谱。提供CNV检测、分段分析以及可直接用于发表的图表。

核心功能:

  • - 基于WGS的CNV检测:从比对后的测序数据中识别拷贝数增加和缺失
  • 基因组分段:将基因组划分为区间/窗口以进行拷贝数估算
  • 灵活的输入支持:处理BAM、VCF及其他标准基因组学格式
  • 出版级图表:生成PNG、PDF或SVG格式的全基因组CNV图谱
  • 标准输出格式:以BED格式导出CNV检测结果,便于下游分析



使用场景

✅ 适用场景:

  • - 分析癌症基因组以识别体细胞拷贝数改变(SCNA)
  • 研究疑似由拷贝数变异引起的罕见病
  • 进行群体遗传学研究,比较不同群体间的CNV频率
  • 为出版物或报告生成全基因组CNV可视化图谱
  • 创建BED格式的CNV检测结果,以便与其他分析流程整合
  • 对肿瘤和正常样本进行CNV比较分析
  • 使用测序数据验证SNP芯片的CNV检测结果

❌ 不适用场景:

  • - 处理靶向测序panel(全外显子组/靶向捕获)→ 请使用CNVkit或ExomeDepth等专用工具
  • 检测涉及易位或倒位的结构变异 → 请使用structural-variant-caller
  • 分析单细胞RNA-seq数据 → 请使用单细胞特异性CNV工具(如inferCNV)
  • 检测小片段插入缺失(<50bp)→ 请使用variant-caller进行小变异检测
  • 需要用于诊断目的的临床级CNV检测 → 请使用经过验证的临床流程并配合适当的质量控制
  • 处理低覆盖度数据(<10x)→ 结果可能不可靠;请考虑基于SNP芯片的方法

相关技能:

  • - 上游:fastqc-report-interpreter、alignment-quality-checker、variant-caller
  • 下游:circos-plot-generator、go-kegg-enrichment、heatmap-beautifier



与其他技能的整合

上游技能:

  • - fastqc-report-interpreter:在CNV检测前评估测序质量;低质量数据可能产生不可靠的CNV
  • alignment-quality-checker:验证BAM文件质量和覆盖度均匀性;不均匀覆盖会导致CNV假象
  • variant-caller:生成SNV/插入缺失检测结果,用于癌症样本中的CNV-SNV联合分析

下游技能:

  • - circos-plot-generator:创建整合CNV与其他基因组特征的圆形基因组图谱
  • go-kegg-enrichment:对CNV区域内的基因进行通路富集分析
  • heatmap-beautifier:可视化多个样本的CNV图谱

完整工作流程:

原始WGS数据 → fastqc-report-interpreter → alignment-quality-checker → cnv-caller-plotter → circos-plot-generator → 出版级图表



核心功能

1. 拷贝数变异检测

通过分析读段深度模式,从WGS数据中识别拷贝数增加(扩增)或缺失(缺失)的基因组区域。

python
from scripts.main import CNVCaller

使用指定bin大小初始化CNV检测器

caller = CNVCaller(bin_size=1000)

从BAM文件中检测CNV

cnvcalls = caller.callcnvs( input_file=sample.bam, reference=hg38.fa )

查看检测到的CNV

for cnv in cnv_calls: print(f{cnv[chrom]}:{cnv[start]}-{cnv[end]}) print(f 拷贝数: {cnv[cn]}) if cnv[cn] > 2: print(f 类型: 扩增(增加)) elif cnv[cn] < 2: print(f 类型: 缺失(丢失))

参数:

参数类型必需描述默认值
input_filestr输入BAM或VCF文件的路径
reference
str | 是 | 参考基因组FASTA文件的路径 | 无 |
| bin_size | int | 否 | 用于分段的基因组bin大小(bp) | 1000 |

CNV检测策略:

方法最适合灵敏度特异性
读段深度分析大CNV(>10kb)中等
双端比对
中等CNV(1-10kb) | 中等 | 高 |
| 分裂读段分析 | 小CNV(<1kb) | 中等 | 高 |
| 组合方法 | 全面检测 | 高 | 高 |

最佳实践:

  • - ✅ 使用合适的bin大小:WGS使用1000bp,靶向分析使用更小的bin
  • 确保足够的覆盖度:可靠的CNV检测至少需要15-20x覆盖度
  • 匹配参考基因组:使用与比对相同的参考基因组(hg19 vs hg38)
  • 检查覆盖度均匀性:GC偏好可能导致假阳性CNV

常见问题及解决方案:

问题:重复区域的假阳性CNV

  • - 症状:着丝粒、端粒或节段性重复区域出现大量CNV检测结果
  • 解决方案:过滤与已知问题区域重叠的CNV;使用可作图性过滤器

问题:对小CNV的灵敏度低

  • - 症状:尽管覆盖度足够,但未能检测到<5kb的CNV
  • 解决方案:减小bin大小;除深度外,同时使用分裂读段或双端信号

2. 基因组分段与分箱

将基因组划分为窗口/区间以进行拷贝数估算,从而实现对全基因组的系统性分析。

python
from scripts.main import CNVCaller

不同应用场景使用不同的bin大小

bin_configs = { 高分辨率: 100, # 用于小CNV检测 标准: 1000, # WGS默认值 低分辨率: 10000 # 用于大规模改变 }

for configname, binsize in bin_configs.items():
caller = CNVCaller(binsize=binsize)
print(f\n{configname} (binsize={bin_size}bp):)

# 估算人类基因组的近似bin数量
genomesize = 3000000000 # 3 Gb
numbins = genomesize // bin_size
print(f 估算bin数: ~{num_bins:,})
print(f 分辨率: {bin_size}bp)

Bin大小选择指南:

Bin大小分辨率使用场景所需覆盖度
100 bp小CNV(<5kb)>30x
1000 bp
标准 | 常规WGS分析 | >15x |
| 10000 bp | 低 | 大染色体改变 | >5x |
| 可变 | 自适应 | 混合分辨率 | >20x |

最佳实践:

  • - ✅ 将bin大小与预期CNV大小匹配:检测小CNV时使用更小的bin
  • 考虑覆盖深度:更高的覆盖度允许使用更小的bin
  • 排除不可作图区域:过滤可作图性为零或极低的bin
  • 针对GC含量进行归一化:GC富集区域具有不同的覆盖模式

常见问题及解决方案:

问题:小bin导致的分段噪声大

  • - 症状:拷贝数估算不稳定,方差高
  • 解决方案:增大bin大小;应用平滑算法;使用更大的bin作为基线

问题:大bin导致遗漏大CNV

  • - 症状:跨越多个bin的大缺失/扩增未被检测到
  • 解决方案:使用统计分段方法(CBS、PSCBS)连接相邻的改变bin

3. 全基因组可视化

生成出版级图表,显示所有染色体的拷贝数图谱,用于视觉解释和展示。

python
from scripts.main import CNVCaller

caller = CNVCaller(bin_size=1000)

用于绘图的示例CNV检测结果

cnv_calls = [ {chrom: chr1, start: 1000000, end: 200

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 cnv-caller-plotter-1776259263 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 cnv-caller-plotter-1776259263 技能

通过命令行安装

skillhub install cnv-caller-plotter-1776259263

下载

⬇ 下载 cnv-caller-plotter v0.1.0(免费)

文件大小: 13.27 KB | 发布时间: 2026-4-17 14:26

v0.1.0 最新 2026-4-17 14:26
Initial release of cnv-caller-plotter, enabling CNV detection and visualization from WGS data:

- Detects copy number variations (CNVs) from whole genome sequencing (WGS) data for cancer, rare disease, and population genomics.
- Supports input formats including BAM and VCF, with genomic segmentation and customizable bin sizes.
- Exports CNV calls in standard BED format for downstream analysis.
- Generates publication-quality genome-wide CNV visualization plots in PNG, PDF, or SVG.
- Integrates with other bioinformatics skills for upstream QC and downstream analysis/visualization.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部