PacBio第三代测序开启Medical Grade Human Genome时代-技术前沿-资讯-生物在线

PacBio第三代测序开启Medical Grade Human Genome时代

作者:天津生物芯片技术有限责任公司 2014-11-06T13:53 (访问量:3817)

高品质亚洲人类参考基因项目准备采用美国Pacific Biosciences公司的PacBio RSII单分子实时(Single-Molecule Real-Time, SMRT)测序系统产生的序列来进行从头基因组组装(de novo genome assembly)。组装好的序列配合Illumina HiSeq X Ten BAC clone reads。最终达到医疗级“Medical Grade”基因组序列,该级别的基因组序列拥有超高的精确度,可作为科研和临床参考。
“该计划的基因组DNA来自于2009年Nature上发表的韩国人序列。目前基于该名男子(阿尔泰语族,代号“AK1”)的细胞系产生的BAC克隆已经达到约10万个。”该研究的带头人接受采访时说道。
在拥有原始亚洲基因组序列以及来自该团队成员随后进行的拷贝数研究后,研究人员越来越意识到亚洲人群个体基因组中存在的变量序列和结构特征。Macrogen和GMI的研究人员正在寻求怎样建立一个更完整的亚洲人参考基因组,以便在亚洲人群中进行更详细的分析。
“我们的目标是为未来的医疗实践提供一个完整的亚洲人类参考基因组,”并指出团队奉行的是“医疗级”("medical grade")的基因组序列,该级别的基因组序列拥有超高的精确度,可作为科研和临床参考。
“之所以需要医疗级基因组序列,是因为基因分型错误在试图将亚洲血统的短读长序列map到标准人类参考基因组的过程中非常容易发生,这种错误主要基于在一个或几个高加索人的序列间进行比对时。”Kim解释道。

毫无疑问,上述情况如果在进行更大规模的亚洲基因组计划试点工作时,将会导致更大的困难。在该计划的第一阶段,研究人员把目光投向产生1000个健康亚洲人的全基因组和外显子组序列这一目标上。
Yang,Kim和Seo指出,“在早期,亚洲基因组计划的成员们已经使用Agilent的目标序列捕获试剂盒和Illumina的测序仪进行了500左右亚洲人份的低覆盖率和高覆盖率的外显子组测序,产生了覆盖率100倍以上的外显子组数据。”但该组遇到了研究基因组臂(genome arms)的技术问题,那就是没有一个适当的参考序列用于把新产生成的短读长序列数据拼接在一起。
研究人员解释,“问题可能出现在当试图充分考虑那些无参考序列人群的结构变化,而等位基因频率又存在人与人之间的差异时,就可能会混淆针对特定个人的已有基因组序列的解释。
该团队还考虑到了现有人类参考序列中存在的Gaps(基因组漏洞),并且将兴趣点投入到使用长读长技术来建立即将开展的全新亚洲基因组参考序列计划。
为此,研究人员将主要依赖于PacBio长读长技术用于亚洲参考基因组的初始从头组装组,他们计划的预期平均深度为60倍。
与此同时,作为该计划大规模研究的第一阶段,亚洲基因组计划的成员将继续开展来自韩国,蒙古和亚洲其他样本来源的人类基因组测序。这些数据进而有助于对亚洲等位基因频率,拷贝数变化曲线和结构变异进行更精确的计算,从而生成泛亚洲基因组参考序列。
伴随着对北亚及其他区域的人口统计以及人口历史的研究,研究人员同时希望能够了解那些常见和罕见的基因变异到底怎样导致该地区的疾病风险。
后期的工作是该项目第二阶段的重点:那就是对10000个来自于韩国,蒙古,中亚,日本,中国以及其他区域的亚洲人进行基因测序,致力于寻找与大脑有关的疾病,癌症以及与其他遗传性疾病相关的新的遗传信息。尤其是亚洲北部人群,如阿尔泰语族。在这个阶段的研究中,该小组开创了与医院和其他组织的合作,预计在2015年至2017年间进行,同时该项目也有可能很快扩大到其他区域。
比如,Yang, Kim和Seo就曾指出,研究人员计划在不久的将来与专注于肌肉萎缩症的协会合作。此外,作为亚洲基因组计划的一部分,他们还开展了一个在韩国寻找针对自闭症谱系障碍的遗传贡献者计划。
目前,在项目的一期二期阶段,该团队预计对个人基因组测序的平均深度约为30倍。
以癌症为中心的分析将涉及从参与者至少选择3000份样本,对肿瘤及匹配的正常样本进行测序。
“我们希望得到医疗级的参考序列[亚洲参考基因组计划],”Yang说。“然后,我们会将此扩大到整个亚洲疾病基因组。”
研究人员积极地认为他们在未来即将产生的大量数据是有益的,这些数据不仅能够帮助寻找人群特异性疾病的贡献者,同时也能为未来以基因组学为基础的诊断和治疗方法提出依据。

目前PacBio平台的平均读长已达到8.5K,其长度大大超过一般转录组中典型基因的长度(如人转录本平均长度为2.5kb,鸡为1.2kb),天津生物芯片率先利用第三代PacBio RS II测序平台进行转录组学的研究,可以直接得到从5’端到3’端的高质量全长转录本信息,转录组不再需要组装,所测即所得!我们称之“全长转录组”。
2014年天津生物芯片投入大量精力开发“全长转录组测序”,目前正式投入市场,目前已积累了很多经验。

天津生物芯片技术有限责任公司 商家主页

地 址: 天津经济技术开发区宏达街23号

联系人: 王小姐

电 话: 022-66229515

传 真: 022-66226985

Email:tjbiochipmk@126.com

相关咨询
ADVERTISEMENT