QUAST有什么用

这篇文章给大家分享的是有关QUAST有什么用的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

创新互联是一家集网站建设,安次企业网站建设,安次品牌网站建设,网站定制,安次网站建设报价,网络营销,网络优化,安次网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。

对于不同kmer或者不同软件的基因组组装结果,我们通常会通过N50等指标来进行评估。

对于一个组装出来的序列,不论是contig还是scaffold, 首先将各个序列根据长度从大到小排序,然后从第一个序列开始,将长度进行累加,直到累加的长度超过了总长度的50%,此时,最后一个累加的contig的长度就是N50的长度。示意图如下

QUAST有什么用

上图中N50的长度就是60,和N50的概念类似,还有N75, N90等说法,这些指标可以统称为Nx。Nx越大,说明组装出来的片段长度越长一定程度上,证实了组装结果越好。

除了Nx指标外,还有Lx指标,比如L50,指的是累加的contig的个数,示意图如下

QUAST有什么用

上图中L50的值是3。在实际分析中,我们可以通过现有软件来计算N50, L50等指标,quast就是最常用的软件之一。该软件有在线服务,链接如下

http://quast.bioinf.spbau.ru/

QUAST有什么用

只需要上传fasta格式的contig或者scaffold序列,然后提交即可。在线服务虽然方便,但是也是有限制的,上传的fasta文件大小不能够超过100Mb,对于实际的基因组项目而言,当是不能满足要求。此时,可以下载软件到本地服务器,然后运行。

安装过程如下

wget https://sourceforge.net/projects/quast/files/quast-4.6.3.tar.gz
tar xzvf quast-4.6.3.tar.gz
cd quast-4.6.3/

quast基于python开发,以来matplotlib库进行绘图,保证python和matplotlib安装好,然后直接下载源代码,解压缩就可以使用了。

用法如下

python quast.py -t 10 -o test1_out contigs.fasta

-t参数指定线程数,-o参数指定输出结果的目录。运行完成后,输出目录会生成如下文件

├── basic_stats
├── icarus.html
├── icarus_viewers
├── quast.log
├── report.html
├── report.tex
├── report.tsv
├── report.txt
├── transposed_report.tex
├── transposed_report.tsv
└── transposed_report.txt

直接看report.html文件就就可以了。

1. contig基本信息统计表

quast 会统计不同长度的contig的个数,以及N50,L50等指标,示例结果如下

QUAST有什么用

2. Nx 长度分布曲线

横坐标为Nx,纵坐标为Nx的值,示意图如下

QUAST有什么用

3. contig长度累计曲线

横坐标为contig个数,纵坐标为累加的长度,示意图如下

QUAST有什么用

4. GC含量分布图

窗口的GC含量分布图,quast将每个contig划分为长度100bp的窗口,统计每个窗口的GC含量, 横坐标为GC含量,纵坐标为窗口个数, 示意图如下

QUAST有什么用

contig GC含量分布图,对于每个contig,统计GC含量,横坐标为GC含量,纵坐标为contig个数,示意图如下

QUAST有什么用

感谢各位的阅读!关于“QUAST有什么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!


分享名称:QUAST有什么用
文章出自:http://cdiso.cn/article/ijspip.html

其他资讯