科学里程碑:他们完成了对整个人类基因组的解码

参与该项目的科学家保证,最终,他们设法制定了整个遗传计划。它将为治疗疾病的医学发现打开大门

尽管几十年来它几乎已经完成了,但科学家们说,他们终于设法完成了人类基因组的解码,这是建造和维持人类的一套指令。

根据本周四发表在《科学》杂志上的研究的参与者的说法,该遗传计划已经完全组装完毕。一个国际研究小组描述了完整人类基因组的首次测序。此前在世界各地都受到赞扬的努力是不完整的,因为当时的 DNA 测序技术无法读取其中的某些部分。即使在更新之后 ,仍有大约 8% 的基因组丢失了。

华盛顿大学的研究员埃文·艾希勒(Evan Eichler)说:“使我们成为人类的某些基因实际上存在于这种 '基因组的暗物质' 中,被完全忽略了,” 华盛顿大学的研究员埃文·艾希勒说,他参与了当前的研究和最初的人类基因组计划。他强调说:“花了20多年的时间,但我们终于成功了。”

Read more!

许多人,包括艾希勒自己的学生,都认为一切都结束了。“我在教他们,他们说:'等一下。这不是他们第六次宣布胜利吗?我说:'不,这次我们真的,真的做到了!

科学家们说,这种全面的基因组图景将使人类对我们的进化和生物学有更深入的了解,同时也为衰老、神经退行性疾病、癌症和心脏病等领域的医学发现打开了大门。

周四发布的六项研究之一的作者卡伦·米加说:“我们只是在扩大了解人类疾病的机会。”

周四发布@@ 的六项研究之一的作者b卡伦·米加说:“我们只是在扩大了解人类疾病的机会。”

这项研究使数十年的工作达到顶峰。人类基因组初稿于2000年在白宫举行的仪式上由两个相互竞争的实体的领导人宣布:由美国商务部的一个机构领导的国际公共资助项目和位于马里兰州的一家私营公司Celera Genomics公司。

科学家们在去年6月发表的一篇关于该研究的文章中写道:“端粒到端粒(T2T)联盟已经完成了人类基因组的第一个真正完整的30.55亿碱基对(bp)序列,这是人类参考基因组自首次推出以来的最大改进。”服务器 bioRXIV,从那以后它还没有经过同行评审,现在终于发生了。

研究人员当时表示,新基因组是一次飞跃,这是由两家私营公司开发的新 DNA 测序技术实现的:加利福尼亚的太平洋生物科学(也称为 PacBi o)和英国牛津纳米孔(Oxford Nanopore)。与长期以来一直被认为对研究人员至关重要的工具相比,其读取 DNA 的技术具有非常特殊的优势。

研究人员写道:“这 8% 的基因组并没有因为缺乏重要性而被忽视,而是因为技术限制。”高精度长读测序终于消除了这一技术障碍,允许对人类基因组中的基因组变异进行全面研究。这样的研究必然需要完整而准确的人类参考基因组,这最终将推动本文介绍的 T2T-CHM13 集合的采用。”

人类基因组由大约 31 亿个 DNA 亚基组成(efe/Cati Cladera)

人类基因组由大约 31 亿个 DNA 亚基组成,以字母 A、C、G 和 T 知道的化学碱基对是这些字母对的字符串,其中包含制造蛋白质的指令,蛋白质是生命的基石。人类有大约30,000个基因,分为23组,称为染色体,存在于每个细胞的核中。

米加说,到目前为止,“我们的地图上一直存在巨大而持续的差距,而这些差距在相当重要的地区有所下降。”

加州大学圣克鲁斯分校的基因组学研究员米加与美国国家人类基因组研究所的亚当·菲利皮(Ada m Phillippy)合作,组织了b科学家团队,从头开始研究新的基因组,目的是对所有基因组进行测序,包括遗失的碎片。该组织以染色体末端的切片命名,称为端粒,被称为 T elomere to Telomere 财团或 T2T。

他的研究为人类基因组添加了新的遗传信息,纠正了以前的错误,并揭示了众所周知在进化和疾病中都起着重要作用的长段 DNA。该研究的一个版本于去年发表,然后由其他科学家进行了审查。

圣路易斯华盛顿大学医学院的遗传学家王婷说:“我想说这是人类基因组计划的巨大改进,” 它的影响力翻了一番,他没有参与调查。

艾希勒说,一些科学家曾经认为未知区域包含 “垃圾”。但他说:“我们当中有些人一直以为那些山上有黄金。”

他说,事实证明,黄金包含许多重要的基因,例如那些使人的大脑比黑猩猩大脑所必需的基因,具有更多的神经元和联系。

为了找到这样的基因,科学家们需要新的方法来阅读生命中神秘的遗传语言。读取基因需要将 DNA 链切成数百到数千个字母的片段。测序机读取每件作品上的字母,科学家们试图按正确的顺序排列这些碎片。这在重复字母的区域尤其困难。

科学家们说,在基因测序机得到改进之前,有些区域是难以辨认的,例如,基因测序机现在允许它们一次准确读取一百万个DNA字母。这使科学家能够将具有重复区域的基因视为更长的链,而不是后来必须组合在一起的碎片。

下一步将是绘制更多基因组,包括那些包含来自父母双方的基因集合的基因组(EFE/Antonio Lacerda)

研究人员还必须克服另一个挑战:大多数细胞都含有母亲和父亲的基因组,这混淆了正确组装部件的尝试。T2T研究人员通过使用来自 “完全hydatiform痣” 的细胞系解决了这个问题,这是一种异常的受精卵,不含胎儿组织,有两个父亲的DNA拷贝,没有母亲的DNA。

下一步将是绘制更多的基因组,包括那些包含父母双方基因集合的基因组。这项工作没有绘制男性中发现的23条染色体中的一条,称为Y染色体,因为该痣只包含一条X染色体。

王说,他正在与 Human Pangenome 参考联盟的 T2T 小组合作,该联盟正在努力为代表人类多样性广度的 350 个人生成 “参考” 基因组或模板。

艾希勒说 :“我们现在有了正确的基因组,我们还需要做更多的事情。”“这是人类遗传学领域真正奇妙的事情的开始。”

去年 2 月,牛津大学的科学家创造了人类的第一棵家谱,这是遗传学的另一个显著进步。麻省理工学院布罗德研究所和哈佛大学的博士后研究员@@ 安东尼·怀尔德·沃恩斯解释说:“过去三十年来,全基因组家谱的理论背景描述了我们如何从祖先那里继承基因,” 麻省理工学院布罗德研究所和哈佛大学的博士后研究员安东尼·怀尔德·沃恩斯解释说。研究所 (BDI) 牛津大学的研究的主要作者-.但是,真正估计这种结构是一个非常困难的统计问题。”

下一步将是绘制更多基因组,包括那些包含父母双亲基因集合的基因组(Melissa Lyttle/《纽约时报》)

迄今@@ 为止,合并来自大量不同数据库的庞大数据集所带来的困难一直是这项研究工作的主要障碍。在BDI任职期间进行的这项新研究的另一位主要作者怀尔德·沃恩斯(Wilder Wohns)报告了 “一种轻松组合来自古代和现代人群的数百万个基因组序列的新方法”。

Wohns 和他的同事们一起使用这种方法创作了人类家谱的 “初稿”。他解释说:“我们设计了一种新颖的算法,该算法可以推断出遗传关系,而无需将每个 DNA 序列相互比较,并将其与另一种算法结合起来,该算法通过将所有祖先视为一个网络来将日期放在共同祖先身上。”此外,通过估计人类的整个家谱,我们能够创建算法,使我们能够使用整个基因组来估计祖先的居住时间和首次居住地。”

继续阅读

Read more!