本篇内容主要讲解“GATK BQSR的作用 香港云主机是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“GATK BQSR的作用是什么”吧!BQSR 全称叫做 Base Quality Score Recalibration, 可以理解为碱基质量校正。对于变异位点的鉴定,碱基质量是非常重要的。比如测序识别到的一个位点,其碱基和参考基因组上的碱基不同,但是其质量值特别低,此时可以认为是一个测序错误,而不是一个SNP位点。在测序的原始数据中,本身就提供了每个碱基对应的质量值,但是GATK官方认为测序仪提供的碱基质量值,是不准确的,存在误差的。某个位点前后的碱基的种类,称之为上下文环境,会对这个碱基的质量值产生影响。对于A,T,C,G 4种碱基,共有4 x 4 =16 种上下文环境,左侧的图是利用fastq文件中测序仪给出的碱基质量值做的图,可以看到,对于不同的上下文环境,碱基质量值分布不同;右图为经过BQSR校正之后,不同上下文环境中碱基质量的分布。可以看到,校正之后,不同的上下文环境的碱基质量分布基本相同。也就是说,BQSR消除了上下文环境对碱基质量的影响。在碱基质量校正时,主要考虑下列3个因素:碱基在reads中的位置碱基的上下文环境碱基原始的质量值
根据这3这个因素,首先计算出原始碱基质量中错误的分布模型,然后利用这个模型对碱基质量校正,生成新的碱基质量值。执行BQSR分析包含以下三步命令如下在计算的过程中, 不考虑已知的变异位点的碱基质量,--known-sites
指定已知变异位点对应的vcf文件。这一步对单个样本进行操作,每个样本生成一个错误模型文件。命令如下命令如下:BQSR会对输入的bam文件中的碱基质量值进行替换,替换为校正之后的质量值,而原先的质量值保存在OQ
tag 中,示意图如下到此,相信大家对“GATK BQSR的作用是什么”有了更深的了解,不妨来实际操作一番吧!这里是开发云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
怎么理解大数据中x的n次幂函数,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。1题目描述编辑一个函数,计算x的n次幂。如:输入2.00000,10,输出9.26100。2题解看完上述…
免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。