细菌基因组测序解决方案

时间:2017-01-10 13:29:32 点击: 【字体: 收藏

一、 介绍

细菌基因DNA测序de novo 测序,不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。利用全基因组从头测序技术,可以获得全基因组序列,从而推进该物种的研究。全基因组序列图谱完成后,可以构建该物种的基因组数据库,为该物种的后基因组学研究搭建一个高效的平台;为后续的基因挖掘、功能验证提供DNA序列信息。

二、 技术方案

三代测序平台PacBio RS II具有读长较长的优势(10 kb SMRT bell 文库不低于100×测序深度),能够在序列上通过重复序列区及高GC区,从而达到更好的拼接效果,我们推荐用该平台进行100X覆盖的测序;同时,利用第二代测序平台Illumina HiSeq对小插入片段基因组文库进行双末端(Paired-End)测序,按照基因组5M计算,测序数据量不少于2G,能够达到约400X覆盖。利用PacBio RS IIIllumina HiSeq相结合,构建细菌基因组的精细图。

Ø 分析流程

图片1.png 

备注:

1需提供涉及系统发育分析的物种,并且16S rDNA序列信息已知;

2:需样本数量大于10

3:功能蛋白预测包括:致病菌毒力因子(VFDB)分析、抗生素抗性(ARDB)分析、碳水化合物活性酶(CAZy)分析等。

三、 部分分析内容展示

Ø COG注释

图片2.png 

Ø 基因在基因组分布展示 circos图)

图片3.png 

其中,从里到外,每个环分别为GC-skewGC ratiorRNA基因,负正链基因,其中蛋白编码基因的颜色来源与COG注释。除此之外,可以添加展示的定制的数据。

Ø 碱基修饰检测及修饰位点Motif预测

图片4.png 

左图:横坐标为每个碱基的测序单向深度,纵坐标为碱基的修饰打分

右图:不同修饰QVQV与碱基数目的图形

Ø 修饰信号及motif在基因组上的分布

图片5.png 

其中最外面和最里面为碱基修饰信号,两者之间为motif在基因组上的分布。

Ø 比较基因组分析

图片6.png 

横坐标为参考基因组的坐标,纵坐标为contig,斜率为1线表示正向匹配,斜率为-1线条表示反向contig与参考序列之间存在inversion变化。正向用红色表示,反向用绿色表示。

Ø 进化分析

图片7.png

四、 案例解析

研究人员利用二代测序仪Illumina MiSeq和三代测序仪PacBio RS II,成功完成Clostridium carboxidivorans P7T的全基因组测序及拼接工作,并进行了全基因组注释。拼接及注释结果表明:C. carboxidivoransP7全基因组总大小为5.73 Mbp,包含5,732,880 bp的环形染色体和19,902 bp的大质粒,GC含量29.9%;利用NCBI PGAP预测共有4973个基因编码序列,11rRNA71tRNA(1)(该研究中PacBio RS II测序服务由上海伯豪生物技术有限公司提供)

1 C. carboxidivoransP7全基因组与已报道草图比较结果

图片8.png 

图片9.png 

C. carboxidivoransP7基因组circos

原文出处:

Li N,Yang J,Chai C,et al. Complete genome sequence of Clostridium carboxidivorans P7(T), a syngas-fermenting bacterium capable of producing long-chain alcohols.J Biotechnol.2015.