自从一群科学家发表第一份人类基因组草稿以来,“人类指导手册” 花了21年才终于完成真的很完整。
2000年6月,人类基因组计划(HGP)b和私营公司Celera Genomics宣布了人类基因组的第一份 “草案”,这是经过10年努力和30亿美元的成果投资的美元被列为历史上最伟大的漏洞之一,因为 HGP 不是开始前往遥远星球的旅程,而是发现我们所有基因,即我们自己物种智人的基因图谱的内部旅程。
在 2003 年的 “草稿” 之后,该小组确定了将近 30 亿个 DNA 碱基的数量,这使我们首次有能力阅读自然的 “完整” 遗传模型来构建人类。但人类基因组并不完整:它包含的差距约占基因组的8%。这些差距主要发生在 DNA倾向于复发的地区。这使得使用现有技术很难准确地进行测序,因为现有技术会将基因组分解成微小的碎片,对这些碎片进行测序,然后重新组装它们。
为什么破译剩下的 8% 的基因组很重要?此@@ 后,具有重复DNA碱基的区域,例如HGP基因组中缺失的区域,与许多健康问题有关,包括ALS b和 ALS亨廷顿得癌症和自闭症。科学家们认为,通过对它们进行测序,我们可以更好地研究和治疗这些疾病。
“今天的新闻非常重要。该出版物必须经过同行评审,其背后有大型工作组和大学进行调查。我们越来越多地以更深度和更准确的方式获得关于自己的知识。对整个人类基因组进行测序将有助于避免各种疾病。而且,了解给定病理学的起源机制将有助于开发更直接,更精确的针对疾病的药物,从而降低患病率。” 作为遗传学家的世界参考人物b豪尔赫·多托博士向 Infobae 解释说,他在以下方面拥有丰富的经验美国和欧洲。
他补充说:“这些完整的信息将使我们能够对自己的身体做出更好的决定,因为它改变了我们对无知的看法。例如,决定我们需要吃什么食物来增强防御能力。在我们的微生物组中,有80%的免疫系统。我们需要更多地了解微生物群和哪些益生菌(是活细菌),这将有助于我们调节免疫系统的功能并使其更有效,这可能更精确地减少分子水平上的炎症在面对疾病时我们体内”。
除了以肠道微生物群为例外,Dotto还提到了皮肤和女性生殖系统行为的改善。“遗传学中心” 的创始专家总结说:“我们必须帮助人们减少病情,而这项全基因测序工作将帮助我们做到这一点,” 致力于精准医学,营养和高运动表现的公司 “遗传学中心” 的创始专家总结道。
端粒@@ 到端粒联盟b(T2T)的科学家完成了人类基因组的第一个真正完整的 30.550 亿碱基对(bp)序列,这是人类参考基因组自首次启动以来最大的改进。研究人员说,新基因组是一次飞跃,这是由两家私营公司开发的新 DNA 测序技术实现的:加利福尼亚的太平洋生物科学公司(也称为 PacBi o)和英国牛津纳米孔(Oxford Nanopore)。与长期以来一直被认为对研究人员至关重要的工具相比,其读取 DNA 的技术具有非常特殊的优势。
研究人员写道:“这 8% 的基因组并没有因为缺乏重要性而被忽视,而是因为技术限制。”“高精度长读测序终于消除了这一技术障碍,允许对人类基因组中的基因组变异进行全面研究。这样的研究必然需要完整而准确的人类参考基因组,这最终将推动本文介绍的 T2T-CHM13 集合的采用。”
“如今,一种新的可穿戴技术被用来研究DNA。这是一个手机大小的测序器,可以读取DNA和RNA。你不必建立价值百万美元的实验室。它们不仅用于研究 DNA,而且还可以在食品中识别污染的微生物。遗传信息通过带电流的管子传递,该管会生成有关样品测序的信息。一个引人入胜的发展有望继续让我们赞叹不已,” Dotto说。
生物学家兼理学博士费德里科·普拉达(Federico Prada)现任UADE工程与精确科学学院院长,他向 Infobae 解释说,2003年,随着基因组的完整测序,提出了两个新项目,导致了这一发现。
“一是增加基因组的数量。不仅要对基因组进行测序,而且还要尝试了解人类存在的变异性,从而能够理解哪些变异决定了我们的表型,例如发展某种疾病,跑得更快或有更多的记忆力。这就是所谓的让基因组谈话。第二个目标是完善序列的读数,以免出现坑洼或空白。我们花了将近20年的时间。这有助于我们获得参考基因组,这使我们能够比较所有已进行的遗传和基因组研究,该标准或黄金标准,这使我们将来得出许多结论。”
他补充说:“全面阅读是一个很好的步骤。但是今天的局限性在于基因组的功能。我们需要继续解释更多关于我们的基因组如何运作的信息。这些关键信息参与哪些功能,从而使我们成为我们自己。
总部位于加利福尼亚的太平洋生物科学公司(PacBio)和总部位于英国的牛津纳米波尔公司共同使用不同的技术来破译缺失的8%遗传学。PacBio使用了一种名为HiFi的系统,在该系统中,碱基对像圆圈一样循环,直到它们被完整且高保真地读取为止,因此得名。该系统的使用可以追溯到几年前,代表着在 “读取” 最长序列的长度和准确性方面向前迈出了一大步。
同时,牛津纳米孔在其专有设备中使用电流。碱基对链被压过微观的纳米孔,一次只能有一个分子,电流击中它们以观察它们是什么样的分子。通过去除每个分子,科学家可以识别整个链。
人类有 46 条染色体,共 23 对,代表成千上万个单个基因。每个基因由腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)组成的几个碱基对组成。人类基因组中有数十亿个碱基对。但是研究人员测序的基因组不是来自人,而是来自 hydatiform 痣,这是一种罕见的肿块或生长物,在怀孕开始时在子宫内形成。当精子使没有核的卵子受精时,就会形成这种组织,因此它只包含23条染色体,例如配子(精子或卵子),而不是人类细胞DNA中发现的46条染色体。这些单元简化了计算工作,但可能是一个限制。
该联盟解释说,其工作使DNA碱基的数量从29.2亿增加到30.5亿,增长了4.5%,编码蛋白质的基因数量仅增加了0.4%,达到19,969。根据专家的说法,这项工作还可能带来其他新知识,包括与如何调节基因有关的知识。
继续阅读: