这篇文章主要讲解了“Docker怎么实现Samtools截取基因组序列”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Docker怎么实现Samtools截取基因组序列”吧!Samtools是一个用于操作sam和bam文件的工具软件,能够对比对文件进行二进制查看、格式转换、排序及合并等,结合sam格式中的flag、tag等信息,还可以完成比对结果的统计汇总,是处理sam和bam文件(例如:转录组Tophat分析软件输出的比对结果为.bam文件,而重测序中BWA、bowtie等比对软件则主要输出为.sam文件)不可或缺的神器!下载镜像并运行
安装好Docker后,搜索我们百云主机提供的docker镜像,其中便有安装好samtools软件的镜像。
下载镜像。
下载完成后可以检查一下。
之后在电脑的D盘创建samtools文件夹,并粘贴需要的染色体fasta文件。如果docker是windows Toolbox版本,需要挂载D盘到虚拟机,具体操作可参考 Docker 工具安装(windows Toolbox版本)详解版!进入虚拟机。
查看工作目录。
samtools faidx 能够对fasta序列建立一个后免费云主机域名缀为.fai 的文件,根据这个.fai 文件和原始的fasta文件,能够快速的提取任意区域的序列。用法:该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外,其他行的长度必须相同。最后生成的.fai文件如下, 共5列,t分隔;第一列 NAME:序列的名称,只保留“>”后,第一个空白之前的内容;
第二列 LENGTH:序列的长度,单位为bp;
第三列 OFFSET:第一个碱基的偏移量,从0开始计数,换行符也统计进行;
第四列 LINEBASES:除了最后一行外,其他代表序列的行的碱基数,单位为bp;
第五列 LINEWIDTH : 行宽,除了最后一行外,其他代表序列的行的长度,包括换行符,在windows系统中换行符为rn, 要在序列长度的基础上加2;最后指定要提取的序列或序列在染色体上的位置,即可提取出需要的序列:感谢各位的阅读,以上就是“Docker怎么实现Samtools截取基因组序列”的内容了,经过本文的学习后,相信大家对Docker怎么实现Samtools截取基因组序列这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是百云主机,小编将为大家推送更多相关知识点的文章,欢迎关注!
这篇文章主要介绍“怎么找到适合的Python库”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“怎么找到适合的Python库”文章能帮助大家解决问题。 明确自己的需求,用Python来干什么,力求简短明了。比如定位“数据分…
免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。