人类基因组(人体的基因有多少个)

35小吃技术网 推荐阅读 2022年12月08日11时10分47秒 199 0

人类基因组(人体内有多少基因)

如果说人类基因组是一部书写生命的“天书”,那么阅读组成DNA的A、C、G、T的测序技术就是使我们能够阅读这部“天书”的工具。在其出现之初,基因组测序技术对生物医学研究的重要性就受到了广泛关注。

20年前,人类基因组计划发布了第一版人类基因组图谱,这标志着人类基因组测序领域的突破性里程碑。此后,基因组测序领域持续突飞猛进,各种技术创新使基因组测序更加高效、准确和普及。在第一版人类基因组序列图发表20周年之际,《自然》网站列举了过去20年基因组测序领域的重要里程碑。今天药明康德内容团队就和读者一起回顾其中的一些精彩内容。

人类基因组(人体的基因有多少个)-第1张图片

2001年:第一版人类基因组图谱发布。

1990年,由世界多国研究人员组成的国际团队启动了人类基因组计划(HGP),目标是对人类基因组中的30亿个碱基进行测序。1998年,由Craig Venter博士创立的Celera Genomics也宣布了人类基因组测序计划。2001年2月,《自然》和《科学》分别发表了人类基因组计划和赛莱拉基因组公司完成的人类基因组草图。这两项突破性研究开启了生物医学的新时代。

人类基因组(人体的基因有多少个)-第2张图片

2004:宏基因组学的诞生

在21世纪之前,对微生物的研究通常需要通过培养来分离单一菌株。然而,微生物学家早就发现自然界中存在的多种微生物无法在实验室中培养,这意味着利用培养研究策略只能捕获自然界中微生物多样性的1%。那么我们可以用什么手段来研究剩下的99%呢?

2004年,两项划时代的研究通过对环境中采集的样本进行测序,成功构建了样本中不同微生物的基因组序列。这两项研究表明,通过DNA测序技术可以对复杂微生物类群中的不同微生物进行分类,并发现未知微生物,而无需单独分离培养一种微生物。他们揭示了宏基因组学的巨大潜力。

2008:下一代基因测序技术

第一代核酸测序技术被称为桑格测序。2003年发表的第一版人类基因组图谱是由桑格测序完成的。而桑格测序法需要通过电泳分离不同大小的DNA片段来读取DNA序列,其大规模应用受到成本和速度的限制。

2008年,发表在《自然》杂志上的两篇论文使用下一代基因测序技术(NGS)生成了一个非裔美国人和一个亚裔美国人的基因组。在这两项研究中,研究人员使用了被称为Solexa测序的下一代测序技术。这项技术至今仍是Illumina公司短读数测序仪的基础。

与桑格测序法相比,下一代测序技术的一个重要突破是,通过将单个DNA分子固定在一个基底上,可以同时对数百万个不同的DNA分子进行测序。2001年出版的第一版人类基因组图谱耗资3亿美元,耗时10多年。有了下一代测序技术,2008年一个人类基因组可以在几周内完成测序,测序成本降低到50万美元。新一代测序技术的出现,是测序可及性的一大进步。今天,这项技术仍在进一步减少测序的时间和成本。

2008:癌症基因组测序的突破

人类基因组图谱发布后,从事癌症研究的科学家们迅速意识到DNA测序在癌症研究和抗癌疗法开发中的巨大潜力。基因组学可能有助于回答一些与癌症有关的基本问题,例如,肿瘤细胞中包含哪些遗传变异?

2008年,《自然》发表了首个急性髓细胞白血病(AML)样本的全基因组序列。在这项研究中,科学家使用下一代测序技术对一名50岁AML患者的肿瘤细胞和正常皮肤细胞的全基因组进行了测序。通过比较癌细胞和正常细胞的基因组序列,研究人员在癌细胞中发现了8种全新的基因突变。这项突破性的研究证实了肿瘤学家的猜测,即基因组测序可以发现可能导致肿瘤发生的新基因突变,从而提供一系列潜在的药物靶点。

自这一突破以来,肿瘤学领域的测序研究以惊人的速度发展。如今,基于DNA测序的检测已经能够帮助发现癌症驱动基因、肿瘤突变负荷和新抗原的出现,为个体化治疗提供非常有价值的信息。

2008年:RNA测序和转录组

虽然人类基因组图谱揭示了人类基因组的DNA序列,但为了进一步了解这些序列的功能,科学家需要检测DNA的转录产物RNA。21世纪初,研究转录组的主要技术之一是微阵列技术。但这种技术的缺点是只能研究固定在微阵列芯片上的已知基因或外显子序列。

2008年,一系列研究展示了使用高通量下一代测序技术对不同生物模型中的转录组进行测序。这项技术被称为RNA测序,首先从mRNA的Poly(A)尾分离RNA,然后逆转录它们生成cDNA,并使用下一代测序技术对cDNA进行测序。2008年,利用RNA测序技术,几个研究小组对酵母和拟南芥的转录组进行了测序,发现了全新的转录本和基因。

RNA测序不仅可以确定功能基因组,还可以监测不同条件下RNA的数量变化。它已经成为遗传学、生物学和医学领域中具有里程碑意义的研究工具之一。

2009年:外显子组测序

历史上,为了寻找单基因疾病的病因,通常需要通过基因研究来确定染色体上可能发生致病突变的位置。外显子测序的突破使研究人员可以在不知道致病基因突变的位置和功能的情况下,找到导致单基因疾病的基因突变。

外显子测序技术利用微阵列捕获基因组DNA中的外显子序列,然后对富集的外显子序列进行测序。不仅可以降低测序成本,还可以对编码的蛋白质进行更深入的测序。

2009年,华盛顿大学的Sarah Ng博士和她的同事报告了使用全外显子测序寻找单基因疾病致病突变的第一个概念证明结果。在这项研究中,该小组对8个对照样本和4个患有弗里曼-谢尔登综合征(一种罕见疾病)的患者样本的外显子进行了测序。他们发现,MYH3基因在4名患者中均为非同义突变或剪接位点异常的基因。本研究建立了利用外显子测序技术发现致病基因变异的研究框架。后来,这个团队应用了同样的策略,发现了米勒综合征等其他单基因疾病的基因变异。

外显子测序对蛋白质编码序列进行深度测序的能力大大加快了研究人员发现致病基因的速度,尤其是在罕见病领域。

2009年:单细胞测序

基于组织样本的基因表达检测只能找到不同细胞类型产生的平均结果,这可能导致研究人员忽略特定细胞类型的表现。2009年,《自然方法》发表了第一份单个小鼠卵裂球的全转录组研究。与微阵列技术相比,该技术具有更高的灵敏度,研究人员不仅可以检测到更多转录RNA的基因,还可以发现新的剪接位点。

单细胞测序技术的发展为分析细胞状态、寻找稀有细胞类型、追踪细胞发育轨迹和谱系、研究肿瘤异质性提供了有力的工具。

2012年:构建人类基因组“百科全书”

在第一版人类基因组图谱完成之前,科学家们已经意识到,确定基因组的DNA序列远未达到理解生命分子过程的目标。储存在DNA序列中的信息需要被调节和解释,与蛋白质的相互作用、染色质结构和化学修饰都对这一过程有重要影响。因此,在2003年,一个名为DNA元素百科全书(encode)的研究项目开始了。该项目旨在识别基因组中的所有功能元件,不仅包括编码蛋白质的基因,还包括启动子和增强子等调控元件。

多种调节基因表达的功能元件(来源:ENCODE官网)

2012年,这个项目的第二阶段(ENCODE 2)完成,研究团队在《自然》、《基因组研究》和《基因组生物》上发表了30篇论文。他们不仅确定了20,687个编码蛋白质的基因,还描述了它们在147种不同细胞类型中的表达模式。研究人员还发现了超过7万个启动子和近40万个增强子区域,并发现基因组中近80%的序列至少有一种功能。

ENCODE 3的研究成果收集了5992个实验,显著拓展了人们对人类和小鼠基因组中调控元件的认识。

目前,该项目已进入第四阶段。它将进一步整合个体基因组和单细胞多组学信息,为理解人类生物学、进化和疾病提供与时俱进的“百科全书”。

标签

20年前,人类基因组图谱的发布,代表了几个研究团队近15年的研究成果。然而,这仅仅是开始。在《自然》杂志纪念人类基因组图谱发表20周年的特刊中,研究人员表示,基因组图谱的发表启发了阐明基因组非编码部分功能的新时代,为疗法的发展铺平了道路。更重要的是,在关注单个基因功能的同时,有助于建立对生物学的系统认识,使我们能够解读定义生命的“天书”。