新一代测序服务解决方案-DNA水平研究

时间:2016-12-19 09:18:42 点击: 【字体: 收藏


基因De novo测序

De novo 测序也称为头测序,它的特点是在测序前无需该物种的基因序列信息便可完成全基因组的拼接和组装。在获得全基因组序列图谱后,不但可以解析未知物种的进化历史,更重要的是可为该物种的后续研究提供一个方便高效的平台,使基因挖掘、功能验证等工作更加方便和快速,也为更深层次的组学研究提供了参考数据基础。上海伯豪利用下一代高通量测序技术(Next Generation Sequencing,NGS)及PacBio公司的单分子实时(Single-molecule real-time,SMRT)测序技术,不仅能进行全基因组从头测序,得到物种的完整基因组序列信息,而且能够借助PacBio平台得到碱基的修饰信息,帮您完成物种基因组序列图谱及碱基修饰图谱。

技术路线



注1:功能蛋白预测包括:基因岛预测、信号肽预测、跨膜螺旋预测、致病菌毒力因子(VFDB)分析、抗生素抗性(CARD)分析、碳水化合物活性酶(CAZy)分析;
注2:需提供涉及系统发育分析的物种,并且16s rDNA序列信息已知;
注3:需样本数量大于10个。


样本要求
样本类型:total DNA
样本总量:Illumina平台测序样本 ≥ 2 µg,Pacbio平台测序样本 ≥ 10 µg
样本浓度:≥ 50 ng/µl
推荐测序深度:Illumina平台测序样本 ≥ 200X,Pacbio平台测序样本 ≥ 100X

案例解析
案例一 哈维氏弧菌Vibrio harveyi全基因组测序
哈维氏弧菌是一种嗜盐的革兰氏阴性菌,是危害水产养殖业的重要病原菌之一。在2013年底,伯豪协助客户完成了E385菌株的全基因组测序,使用了Illumina平台产生测序数据,并使用CLC Genomics Workbench平台和Seq-Man软件进行了de novo拼接,得到了94个scaffolds共6.35Mbp序列,GC含量为44.8%,并对这些序列进行了功能注释,找到了85个毒素基因。

原文出处:Yu M, Ren C, Qiu J, et al. Draft Genome Sequence of the Opportunistic Marine Pathogen Vibrio harveyi Strain E385. Genome Announcements. 2013, 1(6).

案例二 SMRT测序技术用于赤豆Vigna angularis全基因组de novo测序
该研究使用了Roche 454, Illumina和PacBio三种平台对赤豆Vigna angularis进行了全基因组测序,并分别使用三种de novo拼接方法。它们分别是:Assembly_1:对Roche 454得到的reads进行拼接,使用Illumina平台得到的数据修正错误,并使用SMRT测序得到的序列填补gaps;Assembly_2:仅使用Illumina平台得到的数据进行de novo拼接;Assembly_3:对SMRT测序得到的reads进行拼接,然后使用Illumina的序列来纠错。研究对比了三种方法,结果显示使用SMRT测序技术后可得到100倍于二代测序(Next Generation Sequencing, NGS)读长的contigs,而gaps仅有NGS百分之一。因此基于SMRT测序得到的基因组可得到更高的拼接质量和更全面的基因注释信息,但仍需要二代测序数据的辅助。



原文出处:Sakai H, Naito K, Ogiso-Tanaka E, et al. The power of single molecule real-time sequencing technology in the de novo assembly of a eukaryotic genome. Sci Rep. 2015, 5.

数据分析展示



全基因组重测序服务

全基因组重测序是对已有参考基因组序列的物种的个体或群体进行重新测序,通过与原有基因组进行比较,得出丰富的全基因组变异信息。由于不需要重新从头拼接,因此仅需要相对较小的数据量,便可在个基因组的尺度上来研究问题。随着测序成本的降低和分析技术的成熟,目前全基因组重测序在不同物种、不同应用和研究领域均已有广泛应用。


技术路线


样品要求
样本类型:total DNA
样本总量:≥ 2 µg
样本浓度:≥ 50 ng/µl
推荐测序深度:≥30X

案例解析
案例一 基因变异位点检测——全基因组重测序解开自闭症之谜
自闭症谱系障碍(Autism Spectrum Disorder,ASD)是一种由于神经系统失调而导致的发育障碍,很大程度上由遗传造成,目前已有大量研究致力于寻找“自闭基因”。这篇2015年2月发表在Nature Medicine的文章是迄今为止规模最大的自闭症基因组研究,共对85个四成员家庭(一对父母和两个患有自闭症谱系障碍的孩子)共340人进行了全基因组重测序。结果表明,在69.4%的家庭中,两个孩子携带了不同的ASD相关基因突变,这说明ASD的致病原因是多样化的,仅凭借寻找单一的致病基因来制定疾病风险或治疗方案并不可靠。


已阐明的ASD病因。a. SCN2A基因同时发生外显子缺失;b. SCN2A基因外显子18缺失;c. STXBP1移码突变以及UBE3A提前终止突变;d. THRA错义突变以及KATNAL2无义突变

原文出处:Yuen R K C, Bhooma T, Daniele M, et al. Whole-genome sequencing of quartet families with autism spectrum disorder. Nat Med. 2015, 21(2):185-91.

案例二 BSA性状定位——快速定位水稻的数量性状
研究者采用群组分离分析(Bulk Segregant Approach,BSA)策略,使用了抗稻瘟病和易感稻瘟病品系杂交构建了RILs群体,并对直链淀粉低含量和高含量品系、稻苗低活力和高活力品系杂交构建了F2群体。随后,这些性状在RILs和F2群体中出现了性状分离,作者挑选了具有极端表型(极抗病/极易感病,极高/极低淀粉含量,以及极高/极低活力)的个体分别混为两个DNA池并进行建库,并进行全基因组重测序,通过群体间SNP频率的差异来进行基因定位。结果表明,QTL-seq与传统QTL方法得到的QTLs位点相符,是一种可靠,稳定,性价比高的数量性状定位方法。

在水稻RILs群体中用QTL-seq寻找抗稻瘟病位点。a. 抗稻瘟病品系Nortai和易感病品系Hitomebore在2周真菌处理后的情况;b. 对RILs不同个体抗病表型进行分级;c. 4和5级作为抗病组,8 – 10 级作为易感组进行混样建库;d. 绿色和黄色分别代表抗病和易感组SNP频率,蓝色代表两者SNP频率差异,底部图为传统QTL分析结果。

原文出处:Takagi H, Abe A, Yoshida K, et al. QTL‐seq: rapid mapping of quantitative trait loci in rice by whole genome resequencing of DNA from two bulked populations. Plant Journal for Cell & Molecular Biology. 2013, 74(1):174–183.

案例三 全基因组关联分析——谷子(Setaria italica)的单倍型图谱和农艺性状GWAS
作者对来自5个不同地理环境的916种不同的谷子品种分别以0.7×的覆盖度进行了测序,绘制出了单倍型图谱。结果显示,来自北方的春播品种和来自南方的夏播品种清晰地分为两个分化群体,并且不同品种仅按地理区域聚类,暗示了谷子是经历了单一的野生驯化历史后进而扩散至世界各地的。接下来,作者对47个农艺性状(包括株型、产量、抽穗期、抗病性等)进行了全基因组关联分析,找到了512个与性状相关的遗传位点。该研究还通过检测基因组杂合度来判断遗传位点是否受到选择性清除(selective sweep),发现一个控制落粒性的已知基因qSH1在驯化中受到了选择。另外,作者还对野生近缘种S. viridis进行了深度测序,并与谷子基因组作了比较,为研究谷子的驯化提供了基础。

上左:916种谷子单倍型NJ(Neighbor-Joining)树;上中右:与农艺性状相关的遗传位点(部分);下:谷子在现代驯化过程中发生选择性清除(selective sweeps)的位点

原文出处:Guanqing J, Xuehui H, Hui Z, et al. A haplotype map of genomic variations and genome-wide association studies of agronomic traits in foxtail millet (Setaria italica). Nat Genet. 2013, 45(8):957-961.

案例四 群体基因组学——全基因组重测序揭示黄瓜的驯化选择机制
黄瓜是一种重要的模式植物和经济作物,其基因组已于2009年发表,方便了使用全基因组重测序手段对多个样本进行研究。本研究对115个来自印度、欧亚、东亚和西双版纳的四大类黄瓜品系进行了深度全基因组重测序,并对一种黄瓜野生品种进行了de novo测序,试图通过揭示黄瓜在驯化过程中基因组的变化,为作物改良提供理论基础。测序共获得了360多万个变异位点,其中印度品种拥有最高的遗传多样性,证明黄瓜可能起源于印度。通过与三种谷物(大米、玉米和大豆)比较,果蔬类作物(黄瓜、西瓜和番茄)在驯化过程中受到了更为强烈的瓶颈效应,因此基因多样性更小。黄瓜基因组共有约112个区域受到了选择性清除作用。经过QTL定位,发现与果实长度相关的QTLs位点与受选择区域相符;另外,一个苦味相关基因区域受到了选择,导致栽培黄瓜丢失了苦味的性状;最后,编码β-胡萝卜素羟化酶的基因在西双版纳品系中发生了突变,导致β-胡萝卜素可以在该品种中积累,使得西双版纳品系具有更高的营养价值。



选择性清除位点的检测和注释。a. 黄瓜7条染色体上的选择性清除候选位点(紫色);b. 选择性清除区域位于与果长相关QTLs fl3.1内;c. 选择性清除位点与果长相关QTL位点fl6.1相符;d. 苦味相关基因区域Bt在三个栽培品系上受到选择性清除(几乎无核苷酸多态性)

原文出处:Qi J, Liu X, Shen D, et al. A genomic variation map provides insights into the genetic basis of cucumber domestication and diversity. Nat Genet. 2013, 45(12):1510-5.




外显子组测序服务

外显子组测序,是利用序列捕获技术,将全基因组外显子区域的DNA捕捉并富集后,进行高通量测序的基因组分析方法。在同样的测序通量下,外显子组测序针对目标区段的测序深度以及覆盖度都高于全基因组重测序,因此该技术对于发生在外显子区的常见和罕见的染色体变异具有很高的检测灵敏度。其简便、经济、高效等特点,使其成为近年的热门技术。


Agilent液相探针杂交捕获技术,由Agilent公司与麻省理工学院-哈佛大学博德研究所共同开发,研究成果刊登于2009年8月的《自然—生物技术》杂志上。至今,该技术已经被数千篇权威学术论文引用。Agilent SureSelect Human All Exon V6人全外显子捕获系统,依托上述的液相捕获系统,采用120-mer的RNA作为“诱饵”探针,能够高效地捕获带有SNV,InDel等突变的基因组序列。目前,该技术广泛应用于癌症等复杂疾病相关的遗传变异研究中,并获得了国际癌症协会(ICGC)的鉴定认可。


Agilent SureSelect Human All Exon V6人全外显子捕获系统高度优化的捕获探针设计结合严格的捕获工作流程,获得的高在靶效率能够确保读出序列对靶标的特异性映射,从而实现深度覆盖。此外显子组靶向包括难捕获区域的相关数据库的更新内容,可实现蛋白质编码区域的全面分析

Agilent SureSelect Human All Exon V6相对其他外显子捕获有明显的技术优势:第一,外显子捕获全面,包含相关数据库的最新核心内容,可靶向捕获其他技术难捕获的区域,轻松添加用于转化研究的UTR、用于癌症研究的COSMIC以及其他定制内容。第二,覆盖率高,可准确的检测出疾病相关的稀有变异。

样品要求
样本类型:total DNA
样本总量:≥ 2 µg
样本浓度:≥ 50 ng/µl

技术路线


研究方案
方案1基于全外显子组测序的孟德尔遗传疾病研究方案


孟德尔遗传病,也称单基因遗传病,是指受一对等位基因(主效基因)控制的遗传性疾病。孟德尔遗传病是新生儿出生缺陷的重要原因之一,目前全球已知的单基因遗传病大约7000多种,而且其中大部分的潜在疾病基因还尚未研究清楚。

传统孟德尔疾病基因的识别主要是通过对候选基因实施Sanger测序而确定。候选基因的确定主要是通过一些基因组区域的位置映射方法,如核型分析,连锁分析等。然而,这种方法不能确定疾病是由某个单核苷酸突变导致还是基因组结构变异导致。随着二代测序技术的发展,尤其是外显子测序技术的出现,使得基因组以及基因组蛋白质编码区的常见及罕见变异都能被准确检测到,极大地促进疾病基因的识别。

研究目的
鉴定孟德尔遗传疾病中的致病位点

技术平台
Agilent SureSelect捕获系统+Illumina测序平台

样本准备
家系样本:患病个体及核心家系成员(系谱图、临床表型、年龄)
测序深度建议:≥ 80X
遗传模式:常染色体显性遗传(AD);常染色体隐性遗传(AR);伴性遗传

生物信息分析路线


经典案例

案例一 全外显子测序揭示神经系统孟德尔遗传疾病
本研究使用了全外显子测序对250个神经系统疾病的儿童进行遗传变异的鉴定,以确定其患病的遗传机制。研究采集了病人及其家属外周血进行全外显子高通量测序,并开发了临床测序实验的数据分析、结果解读及验证的流程。结果显示,在250个样本中,有62个样本(25%)鉴定出了86个致病位点。其中,33个病人为常条染色体显性遗传,16个病人为常染色体隐性遗传,9个病人为X染色体遗传,4个病人被诊断出同时携带两种不同疾病的致病变异,由此判断传统的通过家族病史、体检的诊断结果可能存在错误。该成功率意味着外显子组测序技术能够常规应用于临床诊断一系列罕见的遗传疾病

原文出处:Yang YP, Muzny DM, Reid JG, et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. N Engl J Med. 2013, 369(16):1502-11.

方案2 基于全外显子组测序的复杂疾病研究方案
由多个基因及环境因素相互作用所致的疾病,如心血管疾病、二型糖尿病、原发性高血压、银屑病等,称为复杂疾病(complex disease)或多基因病(polygenic disease)。这类疾病发病率一般都超过0.001,在临床或流行病学方面具有一定程度的家族倾向,但又不表现典型的孟德尔遗传方式。复杂疾病是一种受多基因、多因子影响的疾病,包括遗传因素、环境因素与其它因素。一般认为微效作用模式在复杂疾病的发生机制中起主要作用,即来自多个位点的大多数风险基因在群体中的发生频率都很低,它们之间有相互作用,通过数量性状的剂量效应关系,达到疾病发生的临界域值,而共同决定了复杂疾病的遗传易感性。

研究目的
探索复杂疾病的致病机制,寻找与疾病显著相关的致病和易感位点。

研究方法
进行复杂疾病的研究需要具备两个条件,一是要有遗传背景一致或相似的资源群体;二是要有覆盖全基因组的高密度的标记。利用和全外显子组测序,我们可在全外显子组范围内获取大量的准确性高的变异位点。
复杂疾病遗传变异的研究依据研究对象不同的遗传背景来源,分为基于家系和基于散发人群两种研究策略。目前常规的分析方法如下图所示:



技术平台
Agilent SureSelect捕获系统+Illumina测序平台

样本准备
 Case-control散发样本:疾病患者与正常对照样本的外周血DNA。Case样本数建议>200; control样本数建议>200。样本来源保持地域一致,例如:少数名族与汉族的分开。疾病分组若按亚型来分,每种亚型建议样本数>100。
 家系样本:患病个体及核心家系成员(系谱图、个体表型、年龄)
 测序深度建议:≥ 80X

生物信息分析路线



案例一 代谢综合征与DYRK1B基因突变相关
代谢综合征指人体的蛋白质、脂肪、碳水化合物等物质发生代谢紊乱而出现的症状,可能与基因突变有关。为了寻找易感基因,本研究收集了家族型或继承型向心性肥胖、早发性冠状动脉疾病、高血压和糖尿病的三个大家族,采集血液样本抽提DNA,利用全外显子测序及家系连锁分析鉴定致病基因。研究在患病个体中发现DYRK1B基因在102位氨基酸发生突变(R102C),并且该突变在所有家系患病成员中呈现共分离现象,Dyrk1B是调控肌肉脂肪平衡以及通过控制信号通路稳定血糖水平的蛋白激酶。当突变发生时,Dyrk1B抑制了保持血糖水平稳定的途径,而开启了促进脂肪产生的途径。

原文出处:Keramati AR, Mohsen F, Gwang-Woong G, et al. A form of the metabolic syndrome associated with mutations in DYRK1B. N Engl J Med. 2014, 370(5):1909-19.

案例二 低频突变对早发性心肌梗死的风险影响
心肌梗死(myocardial infarction,MI)是全世界范围内致死率非常高的一种疾病,具有复杂的遗传模式。对于早发性MI,基因遗传是一个主要的风险因素。本文基于case-control设计(1027个早发性MI患者与946个正常人对照),进行外显子测序,随后采用定制芯片、靶向捕获及放大样本的外显子测序进行验证。研究发现了两个基因中的罕见突变在MI早发病人与正常对照间显示了显著性差异。携带了罕见错义突变的LDLR基因能够增加4.2倍MI患病风险,携带无义突变的LDLR基因可增加更高倍数的患病风险。另外,携带了罕见错义突变的APOA5基因能够增加2.2倍患病风险。这些发现表明脂蛋白-甘油三酯以及LDL-胆固醇代谢紊乱会增加MI患病风险,对临床预测MI患病风险以及开发针对性治疗方法具有重要意义。

原文出处:Do R, Stitziel NO, Won HH, et al. Exome sequencing identifies rare LDLR and APOA5 alleles conferring risk for myocardial infarction. Nature.2015, 518(7537):102-6.

方案3 基于全外显子组测序的肿瘤驱动基因(driver mutation)研究方案
为什么会产生癌症?我们需要提到一个名词:驱动基因,它可以说是决定癌症的最主要原因。如何找到驱动基因,是制定癌症治疗措施的关键所在。根据目前的发现,驱动基因包括:突变的EGFR、ALK融合基因、突变的KRAS、突变的HER2等的一大类都是驱动基因。例如,肺癌可按照驱动基因分为许多类,这是近年来非常重要的一个发现。由此可以根据不同的驱动基因,采用合适的药物进行治疗。如果找到驱动基因,治疗就事半功倍,如果没有找到驱动基因而盲目治疗,靶向治疗效果较差,可能连安慰剂都不如。
全外显子组测序是用于分析基因组蛋白质编码区域的一种功能强大的技术。这种大规模并行式分析结合了新一代测序的单分子分辨率,凭借能够分析约含 20,000 个基因的外显子基因组的高性价比单反应方法,已经在加速疾病基因发现中发挥了重要作用

研究目的
利用配对的肿瘤样本进行高通量测序,检测导致肿瘤发生的Driver mutation。

技术平台
Agilent SureSelect捕获系统+Illumina测序平台

样本准备
血液样本:EDTA抗凝,2ml,-20℃冰箱保存。
新鲜冰冻组织:液氮冷却、-80℃冰箱保存。
FFPE样本:FFPE切片(10片左右,切片厚度在10μm左右)
测序深度建议
肿瘤样本 ≥ 150X
血液及正常组织样本≥ 100X

案例一 使用外显子组测序揭示黑色素瘤驱动基因
黑色素瘤是一种能产生黑色素的高度恶性肿瘤,目前已发现部分基因突变能够促使黑色素瘤产生,其中就包括BRAF和NRAS突变。然而,这些突变大多并不是由紫外线照射诱导出的。本文对121个黑色素瘤样品进行全外显子组测序,并与正常DNA样本进行了比对,使用相关统计量检测体细胞突变,并在此基础上检测处于正选择下的含有驱动突变(driver mutation)的基因。研究成功鉴定出了6个包含驱动突变的新基因,其中3个基因由于紫外线照射造成损伤,因而产生频发性热点突变(recurrent hotspot mutation)。本文首次表明了紫外线造成的损伤与黑素瘤产生直接关联。这些突变基因将为开发新的治疗方法提供潜在的靶标。

原文出处:Hodis E, Watson IR, Kryukov GV, et al. A landscape of driver mutations in melanoma. Cell .2012 ,150(2):251-63.

数据分析展示

a) 突变频数分布图

图中展示了其中一个样本在24条染色体上每兆(Mbp)区域内突变频数的分布,可以直观看出该样本在染色体上哪些区域突变较为集中。红色和绿色分别代表1M区域里,target区域小于500bp和大于等于500bp的全部突变;蓝色表示的是exonic上的突变频数。

b) 突变功能分布图:


图中展示了其中一个样本突变功能分布情况。上方的饼图表示在基因不同区域上(intron, exon, etc.)的变异所占的百分比;下方的饼图表示在exon位置上不同变异类型所占的百分比。

c) 样本拷贝数变异区间图

其中右上角标注样本名,图中灰色的线条横坐标是染色体位置坐标,纵坐标是平覆盖度的z-score归一化值。每个折点是一个小的捕获区间。灰色线条是参考对照样本的归一化值变化情况,红色(或绿色)代表该样本的归一化值变化情况,其中红色表示DEL,绿色表示DUP。


d) 体细胞突变频数及突变频谱图

图形上方展示每对样本体细胞突变数目,下图展示每对样本体细胞突变不同突变类型所占的比例。


e) 样本体细胞突变heatmap图


f) 体细胞突变富集分析图


纵坐标表示Go term,横坐标是富集因子(Rich Factor = Gene number/Total Gene Number of the term)。每个圆圈的大小与在这个Go Term上的基因成正比,颜色与根据q-value的log值从红到绿渐变。颜色越红,则q-value值越低,富集越显著。

g) 家系连锁分析LOD连锁图及单倍型图


左图为LOD连锁图,通常,LOD值≥3被认为是两个基因连锁得确定证据(因为LOD值是以10为底的对数计算的,LOD值为3表明1000:1的机会,即所观察到的连锁不是偶然发生的);LOD值≥2时,可能连锁;-2<LOD值<2时,需要更多地家系资料,尚不能判别是否连锁;LOD值<-2时,为不连锁;右图为致病位点单倍型图,可以根据此图判断致病位点是否在家系患病成员中处于共分离状态。


h) 曼哈顿图(Manhattan Plot)


X-轴为基因组坐标,Y-轴为每个单核苷酸多态性的关联P-值的负对数。


目标区域捕获测序服务


目标区域捕获测序是利用特制的探针对客户感兴趣的基因组区域进行富集后再进行测序的研究方法。通过该方法能够获得特定区域的遗传信息,极大地提高了基因组中特定区域的研究效率,显著降低了研究成本。从而帮助广大科研工作者筛选变异位点、识别和研究与疾病、种群进化相关的编码区域内的结构变异。您只需提供样本和候选区域,上海伯豪即可为您提供从探针定制、杂交、测序到生物信息分析的全面解决方案

基于AmpliSeqTM 技术的序列捕获解决方案

Ampliseq捕获系统 + Ion Torrent PGM测序平台
Ion Torrent是最新一代的测序技术,它的问世给测序技术的应用带来了激动人心的进展。它采用了半导体技术和简单的化学试剂进行DNA测序,而不是使用光作为媒介。在半导体芯片的微孔中固定DNA链,随后依次掺入ATCG。随着每个碱基的掺入,释放出氢离子,在它们穿过每个孔底部时能被检测到,通过对H+的检测,实时判读碱基。


序列捕获测序能对基因组上某些特定的区域进行分析,但是传统的序列捕获测序技术操作复杂,实验时间长,且对DNA样品的数量要求较高。结合Ion Torrent测序仪, AmpliSeqTM技术通过超高多重PCR,只需低起始量样品,能够在一管中同时扩增几千种PCR片段,科学家们能够快速完成某些疾病相关基因的突变筛察。同时,本系统可还可以为有需要的科学家定制目标序列的多重PCR体系,快速完成检测流程。


产品介绍
Ion AmpliSeqTM Ready-to-Use Panels
Ion AmpliSeqTM Cancer Hotspot Panel v2
针对50个肿瘤相关基因的207个常见突变区域设计了引物,在同一个EP管中进行多重PCR扩增。随后纯化扩增产物,利用Ion Torrent进行测序分析。

Ion AmpliSeqTM Comprehensive Cancer Panel
经过精心设计获得Ion AmpliSeqTM Comprehensive Cancer Panel,可同时检测多个基因家族中的编码DNA序列(CDS)和剪接变异体。这种基于通路的基因选择描绘出了癌症驱动基因的突变谱和药物靶点,以及信号级联、凋亡基因、DNA修复基因、转录调节因子、炎症反应基因和生长因子基因等。此外,它还包含了Ion AmpliSeqTM Cancer Hotspot Panel v2聚焦的全部50个基因。


Ion AmpliSeqTM Custom DNA Panels

 


该产品是专为科学家设计的定制产品,目标序列可以为人类或者是动植物的DNA。上海伯豪可协助您通过Ion AmpliSeqTM Designer创建或者订购您的panel。


经典案例解析

案例一 使用基于Ampliseq定制的基因panel检测骨髓癌患者基因变异和拷贝数变异
该研究使用了一种称为M3P v2.0的定制基因panel对142个未经治疗的骨髓癌患者进行了基因变异和拷贝数变异检测。M3P v2.0可以检测77个骨髓癌相关基因,这些基因被选中的原因有以下:a. 根据以往研究,这些基因发生突变的病例超过2%;b. 这些基因在疾病相关通路上,例如MAPK,NFkappaB,IL6,Cell cycle,MYC;c. 规范靶标基因(actionable targets)例如BRAF,IDH1,FGFR3等;d. 在常用靶标药物相关基因通路上。研究结果显示,49%的病人在规范靶标基因上发现了突变位点。其中,STAT3上发生的突变可以显著缩短病人的总生存期(Overall survival,OS)和无进展生存期(Progression-Free Survival,PFS)。通过与另一篇使用外显子测序的文章作比较,结果显示M3P v2.0可检测到更多变异,尤其是低克隆的变异。这篇文章用实验数据论证了M3P v2.0在骨髓癌患者临床检测领域的实用性。

常见突变基因的克隆异质性。在10%以内存在变异的reads中,这些基因的变异占所有变异的14% - 31%。因此基于ampliseq定制的M3P v2.0 panel相对于全外显子测序存在优势,通过增加测序深度可将这些低频率克隆检测出来

原文出处:Kortuem K M, Braggio E, Bruins L, et al. Panel sequencing for clinically oriented variant screening and copy number detection in 142 untreated multiple myeloma patients. Blood Cancer J. 2016, 6(4):274-279.

基于Agilent HaloPlex技术的序列捕获解决方案

HaloPlex 技术完美融合了聚合酶链反应系统的速度和特异性以及基于液相杂交体系的可扩展性和捕获片段大小的灵活性(捕获区域大小为1Kb-5Mb,推荐<500Kb区段设计)。该实验方案无需文库构建,利用单管操作,从而解决了多重 PCR 由于存在交叉杂交问题而使靶向序列数量受限的问题。


Agilent HaloPlex技术流程
除了客户自己定制序列,HaloPlex还针对特定的疾病提供设计好的解决方案,目前有以下几种,如果研究者需要研究其他疾病,可以通过SureDesign来查看。

HaloPlex Panels:

目录研究试剂盒:
HaloPlex Cancer Research Panel
HaloPlex Cardiomyopathy panel

已定制研究试剂盒:
HaloPlex Arrhythmia
HaloPlex Noonan Syndrome
HaloPlex ICCG
HaloPlex Connective Tissue Disorder
HaloPlex X Chromosome

经典案例解析
案例一 基于HaloPlex检测体细胞嵌合导致的DICER1综合征
DICER1综合征,或称家族性肺母细胞瘤(PPB)和发育异常综合征,通常是由于DICER1基因发生了种系突变(germline mutations)导致的。但另一种可能也会引起DICER1综合征:如DICER1在发育早期发生了体细胞突变(somatic mutations),则会导致体细胞嵌合(somatic mosaicism),从而表现出DICER1综合征。使用传统方法检测以低频率存在的体细胞嵌合是十分困难的,需要使用高效率和高敏感的检测方法。本文研究对象为四例具有DICER1综合征临床表现的儿童,并且不存在DICER1基因种系突变。研究使用了HaloPlexHS技术设计捕获了499kb序列,其中包括DICER1,DROSHA,AGOII,TRBP2和DGCR8的全长,以及所有miRNA加工相关的基因,并进行了深度测序,成功鉴定出了低频体细胞DICER1基因变异。研究结果表明,在DICER1 RNase IIIb结构域发生的错义突变可导致以多发性原生癌为特点的DICER1综合征,但癌症的发展通常会伴随着该结构域以外的体细胞突变或者杂合子丢失事件(loss of heterozygosity,LOH)。


2号病例的碱基突变频率(原Figure4部分)。左图:红色代表突变基因型C,灰色代表野生基因型G,9个柱形图代表来自不同组织的样本,绿色背景和蓝色背景分别代表不同检测方法(绿色HaloPlex Standard或Fluidigm Access Array,蓝色HaloPlexHS),星号代表发生了其它体细胞突变;右图:癌细胞组织杂合度相对种系(germ-line)降低细胞。

原文出处:De K L, Wang Y C, Revil T, et al. High-sensitivity sequencing reveals multi-organ somatic mosaicism causing DICER1 syndrome. J Med Genet. 2015, 53(1).

基于Agilent SureSelect技术的序列捕获解决方案

Agilent SureSelect定制捕获可针对基因组的一小部分区段进行探针设计,从而大大降低测序及分析流程的复杂性。灵活的设计方式以及与各种高通量测序平台良好的对接能力,使得Agilent SureSelect定制捕获能够有效地满足科学家的各种定制要求。

SureSelect定制捕获技术流程


产品介绍
Agilent SureSelect DNA panels
SureSelect Human Kinome panel:靶序列为一系列激酶及与激酶相关的基因,靶目标超过500种激酶,612个基因。
SureSelect X-Chromosome panel:靶向X染色体的基因。

Agilent SureSelect Custom DNA
技术特点:
1) 灵活的靶向序列:1Kb-24Mb。
2) 便捷的操作
研究者可以通过Sure Design software 或者Agilent’s Design Service轻松设计程序。
3) 有效的工作流程
整个流程包括post-capture (XT) 以及 pre-capture (XT2) pooling。

经典案例
案例一 基于SureSelect捕获技术研究循环肿瘤DNA在肿瘤临床检测中的应用
近年来,越来越多的研究致力于将血浆游离DNA(cell-free DNA,cfDNA)应用于各类癌症的临床检测和病情监控。本文对259例胰腺导管腺癌病人进行了相关研究。首先,研究者使用了微滴式数字PCR(ddPCR)进行了预筛选,用来检测KRAS基因的G12D, G12R, G12V和G13D这四个常见的突变,结果在259例中有83例包含基因突变。随后,研究者选择了包含有大于1%(考虑到SureSelect的检测能力)的KRAS突变的患者,以及5例没有KRAS基因突变但发生了远处器官转移的患者,使用SureSelect定制的60个胰腺导管腺癌相关基因的panel进行cfDNA的深度测序。结果发现,48例病人中的14例包含了体细胞突变,还有1例检测到了拷贝数变异。本研究为cfDNA在胰腺导管腺癌的临床应用提供了一个ddPCR和NGS联合使用的方案,即使用前者作为诊断筛查,并使用后者监控体细胞突变,为病人提出个性化治疗方案。

原文出处:Takai E, Totoki Y, Nakamura H, et al. Clinical utility of circulating tumor DNA for molecular assessment in pancreatic cancer. Sci Rep. 2015, 5.

基于NimbleGen技术的序列捕获解决方案

NimbleGen SeqCap捕获系统采用advanced repeat masking方法设计探针,并在此基础上,利用实际测序数据再次进行平衡筛选,保证了很好的均一性(uniformity)和覆盖率(coverage),可以有效捕捉到每个靶向序列,从而对目标区域进行精确细致的分析,有效监测SNP突变。SeqCap可使用多至2.1M数量的探针进行捕获设计,产生可靠数据,降低成本,节约时间。

案例一 使用SeqCap EZ技术捕获小麦外显子区域
小麦是全世界最为重要的主粮农作物之一,随着人口不断增长,如何进一步提高小麦产量一直是研究的热点问题。小麦早在2010年就完成了全基因组测序,但由于小麦的基因组是六倍体,对其进行全基因组重测序来进行相关研究成本较高。实际上,小麦高达17Gb的基因组90%左右为重复序列,研究者关心的基因序列仅占10%。通过与基因组仅300Mb的二倍体近缘种二穗短柄草(Brachypodium distachyon)对比,研究者使用了NimbleGen SeqCap EZ技术设计了六倍体小麦110Mb大小的基因捕获区域,可覆盖小麦的大多数基因,有效降低了检测成本,为小麦育种提供了一种更快更便宜的方法[4]。

原文出处:Gardiner L J, Piotr Gawronski, Olohan L, et al. Using genic sequence capture in combination with a syntenic pseudo genome to map a deletion mutant in a wheat species. Plant J. 2014, 80(5):895-904.

单细胞(微量)DNA测序

单细胞DNA测序是指全基因组扩增技术与高通量测序技术相结合对单个细胞的基因组或目标区域进行序列测定的一项技术。以往的大多数癌症基因组学研究采用的对象均为少量的组织或细胞群体,得到的数据当然也是这些肿瘤共同的基因组。但科学家更希望从独立的单细胞水平,来研究在肿瘤生长过程中每个细胞如何发生突变以产生异质性。单细胞测序能够有效解决微量样本(如胚胎细胞、干细胞等)无法进行常规高通量测序,以及组织样本无法破解的细胞异质性(如神经细胞、肿瘤细胞)难题。单细胞DNA测序主要应用于肿瘤发生、细胞异质性及胚胎干细胞的研究。


技术参数
样本类型:单个细胞,微量细胞(<100 cells)
推荐测序深度:重测序>30X;全外显子测序>100X



案例解析

案例一 单细胞测序技术在肾透明细胞癌研究中的应用

肾透明细胞癌(Clear cell renal cell carcinoma,ccRCC)是肾癌中最为常见的一种。不同的ccRCC患者极少共享疾病相关的位点突变。为了探索疾病遗传因素,本研究使用了单细胞测序技术对一例59岁中国男性患者的25个肿瘤细胞和6个癌旁正常组织细胞进行了测序。结果显示,本例患者可能并非由两个常见的肾癌相关基因VHL和PBRM1 导致,因为VHL不包含任何基因突变,而PBRM1的三个体细胞突变的频率极低,而且没有发现杂合体丢失。定量和聚类分析显示该患者不存在明显的细胞亚克隆群体,并且不同的肿瘤细胞个体存在明显的碱基突变谱差异,这可能和肿瘤细胞发展过程中存在选择作用有关。最后,通过与98例病人中存在的基因突变频率做比较,发现了两个与肾癌相关的功能基因AHNAK和SRGAP3。本文使用单细胞测序技术展示了肾透明细胞癌的复杂性,为将来的研究和个性化治疗提供了新的思路。


左:上图和下图分别为肿瘤细胞群体和患者群体的碱基突变谱;右:在大多数细胞都存在的突变基因(Mountain Gene)和只在少数细胞中存在的突变基因(Hill Gene)在染色体上的分布位置。在患者群体中常见的突变基因标为红色和蓝色。峰高代表相对突变频率。

原文出处:Xu X, Hou Y, Yin X, et al. Single-Cell Exome Sequencing Reveals Single-Nucleotide Mutation Characteristics of a Kidney Tumor. Cell.2012, 148(5):886-895.

案例二 使用单细胞测序检测人脑中体细胞拷贝数变异
在婴幼儿时期发生体细胞单碱基突变(SNVs)或拷贝数变异(CNVs)可导致半侧巨脑症(Hemimegalencephaly,HMG)。之前的研究已发现了体细胞非整倍性变异(Somatic aneuploidy)是形成神经元细胞遗传多样性的机制之一。本文使用单细胞测序技术对HMG组织细胞、正常人脑细胞和淋巴母细胞进行了测序,敏感地检测到了18号染色体发生了体细胞非整倍性变异,但非常罕见(少于5%)。体细胞拷贝数变异在正常脑细胞和HMG细胞中均存在,其中15号染色体长臂的一个2.9Mb的CNV变异会导致疾病的发生。

原文出处:Cai X, Evrony G, Lehmann H, et al. Single-Cell, Genome-wide Sequencing Identifies Clonal Somatic Copy-Number Variation in the Human Brain. Cell Rep.2014, 8(5):1280–1289.