Yes, scientists have sequenced the entire human genome, but they're not done yet

人类基因组从头到尾已经被测序,这意味着全世界的科学家已经确定了近2万个蛋白质编码基因中的大部分。然而,一个国际科学家小组指出,还有更多的工作要做。科学家们指出,尽管我们对这2万个基因的身份几乎已经趋同,但这些基因可以被切割和拼接成大约10万个蛋白质,而基因专家们对这10万个蛋白质是什么还远未达成一致。

该小组于去年秋天在纽约冷泉港实验室(Cold Spring Harbor Laboratory)召开会议,现在已经发布了一份指南,为完成人类基因“目录”的下一步工作确定优先顺序。

“许多科学家一直在努力全面了解人类基因组,这比我们想象的要困难和复杂得多,”约翰霍普金斯大学彭博生物医学工程、计算机科学和生物统计学杰出教授史蒂文·萨尔茨伯格博士说。“我们已经提供了人类基因目录的状态,并提供了完成该目录所需的指导。”

Salzberg和约翰霍普金斯大学的生物医学工程师、副教授Mihaela Pertea、博士、硕士、硕士、博士后研究员Ales Varabyou以及其他19位科学家一起,在10月4日的《自然》杂志上发表了关于人类基因目录的观点。

科学家们说,虽然蛋白质编码基因的最终清单已经接近完整,但科学家们还没有完全分类出基因被切割或拼接的各种方式,这些方式会导致蛋白质的“同种异构体”略有不同。有些蛋白质异构体不会影响蛋白质的功能,但有些可能不同到足以导致特定特征、状况或疾病的风险增加。

为了完成这个目录,科学家们建议对每个基因如何表达成功能性和非功能性蛋白质以及这些蛋白质的三维形状进行全面的研究。

科学家们还建议将重点放在非编码RNA基因的编目上。RNA是由DNA转录的遗传物质,并遵循分子路径制造蛋白质。非编码RNA基因编码的不是蛋白质,而是执行细胞功能的其他类型的分子物质。

最后,国际小组强调了加强常用的导致疾病和疾病的基因变异数据库的重要性,提高了注释DNA测序结果的临床实验室标准,并开发新技术,使更有效和精确的方法能够将广泛的蛋白质与其基因产物相匹配。