bcftools csq怎样分析基因突变对蛋白水平的影响


bcftools csq怎样分析基因突变对蛋白水平的影响,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将 香港云主机为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。csq命令可以分析SNP位点在基因组上的位置,同时还会预测基因突变对编码蛋白的影响。和其他预测基因突变对蛋白质影响的软件不同,bcftools 将基因组划分为不同的独立区域(和单倍型区域概念类似),在分析蛋白质变化时,会综合考虑该区域内的所有突变位点,示意图如下在A图中,该区域包含两个SNP位点,如果单独考虑每个位点,只能预测到氨基酸替换,由精氨酸替换为色氨酸或者谷氨酰胺, 综合考虑两个SNP位点时,对应的DNA序列变成了一个终止密码子,蛋白质长度都发生了变化。在B图中,该区域包含了2个indel 位点,单独考虑每个indel位点时,都是发生了移码突变,氨基酸长度发生了变化,综合考虑两个SNP位点时,氨基酸变化和单独分析一个位点时,又大不一样。在C图中,两个SNP位点发生在剪切位点两侧,单独考虑每个SNP位点,氨基酸由天冬氨酸替换为天冬酰胺或者谷氨酸,综合考虑两个突变位点时,氨基酸由天冬酰胺替换成赖氨酸。从示意图可以发现,单独考虑每个SNP位点对于蛋白质的影响,其结果是有偏差的,只有综合考虑邻近范围内所有的突变位点,预测到的蛋白质变化结果才更加可靠。csq 运行命令如下-f参数指定参考基因组的fasta文件,-g参数指定参考基因组的gff3文件,csq.vcf为输入的VCF文件,csq.out为输出文件。输出文件的格式也是VCF格式,会在INFO列中新增一个BCSQ字段,用来描述突变位点在基因组上的位置和蛋白质序列的变化,示例如下BCSQ的信息由多个字段构成,中间用|连接,包含以下字段consequence type
基因突变对蛋白影响的类型,包括synonymous, missense, inframe_deletion等类型gene
基因名称transcript
转录本名称biotype
基因类型strand
正负链信息amino acid positon
氨基酸的位置variants list
预测氨基酸变化时,考虑的突变位点的集合
由于bcftools是综合考虑多个突变位点对蛋白质的共同作用,在实际分析时,应该尽可能的过滤掉假阳性的突变位点,然后再分析蛋白水平的影响,这样的分析结果,可信度会更高。看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注开发云行业资讯频道,感谢您对开发云的支持。

相关推荐: Power BI软件如何安装

这篇文章给大家分享的是有关Power BI软件如何安装的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。BI工具推送一款实用的BI工具,Power Bl是软件服务、应用和连接器的集合,它们协同工作以将相关数据来源转换为连贯的视觉逼真的交…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

Like (0)
Donate 微信扫一扫 微信扫一扫
Previous 09/22 10:46
Next 09/22 10:46

相关推荐