GATK joint calling的逻辑、原理与优势

news/2024/10/6 21:53:58

GATK(Genome Analysis Toolkit)中的joint calling是一种变异检测策略,它允许同时对多个样本进行变异位点的分析,以提高变异检测的准确性和效率。

图片

图片

以下是joint calling的一些关键原理和优势:

  1. 数据共享:在joint calling过程中,信息在所有样本间共享。这意味着如果一个样本在某个位点的测序覆盖度较低,其他样本中相同位点的高置信度变异可以辅助调用,从而提高低频变异的检测能力。

  2. 区分能力:joint calling能够更清晰地区分纯合参照位点和缺失数据位点。这是因为在joint calling中,只要调用集中的任何一个个体在某个位点有变异证据,就会在该位点输出基因型调用。

  3. 减少假阳性:joint calling通过使用统计模型对大量数据进行变异过滤,提高了过滤假阳性的能力。这种过滤通常比单独分析每个样本更有效,因为它可以在整个样本集上应用统一的过滤标准。

  4. 灵活性和扩展性:GATK 3.0及以上版本引入了增量joint calling的概念,即先对每个样本单独调用变异(生成GVCF文件),然后对所有样本的GVCF文件进行joint genotyping。这种方法解决了传统joint calling在计算资源和时间上的不足,同时保持了joint calling的优势。

  5. 处理大规模样本集:joint calling通过GenomicsDBImport工具和GenotypeGVCFs工具,可以高效地处理大规模样本集,使得对大型队列的研究成为可能。

  6. 解决N+1问题:在传统的joint calling中,每当有新的样本加入时,需要重新对所有样本进行分析。而增量joint calling允许对新样本进行单独分析,然后将其添加到现有的GVCF数据集中,无需重新分析所有旧样本。

总的来说,joint calling通过在多个样本间共享信息和统计数据,提高了变异检测的准确性,尤其是在检测低频变异和处理大规模样本集时。这种方法在基因组研究中被广泛应用,尤其是在寻找与疾病相关的稀有变异时。

参考自:https://gatk.broadinstitute.org/hc/en-us/articles/360035890431-The-logic-of-joint-calling-for-germline-short-variants

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/68457.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

深入理解异常和中断(Cortex-M3)

异常和中断的深入了解对于调试很有用,也非常有助于对RTOS的理解,本文是阅读Cortex-M3权威指南和ST、ARM的技术文档,总结出比较精炼的文档。中断一般是由硬件(如外设和外部输入引脚)产生的事件。异常一般指CPU内部产生的打断。但是,也可以把中断称为一种异常我们一般称为系…

ch被动扫描学习

在渗透测试中,被动扫描就像斥候一样担任前驱搜查的任务,帮助后续的渗透攻击等的深入推进提供十分重要的信息。当然,正如一双锐利的眼和好的侦查工具是一名优秀侦察兵的标配,在进行渗透测试的时候,优秀的搜索引擎就是信息收集者的”夜行衣”和“望远镜”。借助它们我们可以…

Nuxt.js 应用中的 app:suspense:resolve 钩子详解

title: Nuxt.js 应用中的 app:suspense:resolve 钩子详解 date: 2024/10/6 updated: 2024/10/6 author: cmdragon excerpt: app:suspense:resolve 是一个强大的钩子,允许开发者在异步数据解析完成后的最后一步执行必要的处理。通过合理使用该钩子,我们可以优化组件的渲染…

多校A层冲刺NOIP2024模拟赛02 csp-s模拟9

多校A层冲刺NOIP2024模拟赛02 四道题因为暑假被拉去当模拟赛 暑假集训CSP提高模拟22 了,遂直接把赛后代码交了上去,然后就被通知换题了。 原 \(100+100+100+20\) 被在 accoders NOI 上被卡成了 \(100+100+90+10\) ,更改 long long 和 int 后达到了 \(100+100+100+30\) 。 \(…

败者树、置换选择排序、最佳归并树

败者树败者树用一个数组即可实现,而且,上图中的那些方块所代表的结点是不存储在败者树中的置换选择排序 置换选择排序的目的是构造出比工作区更长的初始归并段,而更长就意味着初始归并段会更少,可能会减少归并的趟数,进而减少读写磁盘次数来优化排序时间。 置换选择排序的…

Codeforces Rund 977 div2 个人题解(A~E1)

Codeforces Rund 977 div2 个人题解(A,B,C1,C2,E1) Dashboard - Codeforces Round 977 (Div. 2, based on COMPFEST 16 - Final Round) - Codeforces 火车头 #define _CRT_SECURE_NO_WARNINGS 1​#include <algorithm>#include <array>#include <bitset>#inc…

ide启动多个实例

ide启动多个实例 方法一: ide 2022.X及之后 Run=> Edit Configurations=> 选中项目=> “Build and run”栏=> Modify Options=> 选中“Allow multiple instances”然后就可以run多次项目了 但是要主要改端口 方法二: 先把项目打包,然后启动多个terminal,每个…

周鸿祎:用这10条打造你的完美的商业计划书(附详细讲解)

转载:周鸿祎:用这10条打造你的完美的商业计划书(附详细讲解)_产品 (sohu.com) 江湖上流传着一篇“360大佬周鸿祎版10页商业计划书PPT”,高屋建瓴的讲述了BP制作框架,很有价值。诚然,一个形式上外观精美,具有上有吸引力的BP让人赏心悦目,但更重要的还是有实实在在的内容…