Y染色体是人类24条染色体中最后一个完成测序的。图片来源:美国国家人类基因组研究所(NHGRI)
人类Y染色体由于结构复杂一直很难测序和组装。超过一半的Y染色体在当前的人类参考基因组组装中缺失,导致人们对Y染色体的认识很不全面,限制了对其组成、复杂性以及在不同人群间差异的理解。作为“端粒到端粒”联盟的一部分,由美国国家人类基因组研究所领导、包括约翰斯·霍普金斯大学、加州大学圣克鲁斯分校等多家机构的科学家,此次报道了完整的人类Y染色体的62460029个碱基对序列。这次的组装纠正了当前人类参考基因组组装中关于Y染色体的多个错误,同时还向参考基因组中添加了逾3000万个碱基对,揭示了多个基因家族的完整结构,并确认了41个新的蛋白质编码基因。
在另一篇论文中,联合团队组装了代表世界21个不同人群的43名男性的人类Y染色体。这些组装结果更详细阐释了Y染色体在18.3万年的人类演化历史中的遗传差异。研究人员将此次的新见解整合到灵长类动物的研究中,以更深入地挖掘Y染色体的进化,并分析可能影响癌症和其他多种疾病的临床相关基因,进而助力个性化医疗。
07
神经网络设计出全新蛋白质
蛋白质一直难以建模,尤其是人们想要“反向操作”——将所需的功能转化为蛋白质结构,更是一个高难度挑战。
设计蛋白质生物材料的可视化示例。图片来源:马库斯·比勒/《应用物理学杂志》
美国麻省理工学院团队8月宣布将注意力神经网络与图神经网络相结合,以更好地理解和设计蛋白质。该方法将几何深度学习与语言模型的两种优势结合起来,不仅可预测现有蛋白质特性,还可设想自然界尚未设计出的新蛋白质。此次新模型通过对基本原理建模,将大自然发明的一切作为基础,重新组合了这些自然构建块。团队在训练模型时,根据不同蛋白质的功能来预测它们的序列、溶解度和氨基酸组成部分。然后,在收到新蛋白质功能的初始参数后,模型发挥出创造力并生成了全新的结构。
无独有偶,“深度思维”公司也在今年公布了新一代“阿尔法折叠”,其不仅准确性显著提高,预测范围还从蛋白质扩展到其他生物分子,包括配体。该模型已可预测蛋白质数据库(PDB)中的几乎所有分子,精度则可达到原子级。
08
中国国家太空实验室正式运行
今年是中国首次载人飞行任务成功20周年。8月18日,中国载人航天工程办公室传来喜讯:中国国家太空实验室正式运行,空间应用正有序展开、成果频现。
第十四届中国航展上拍摄的中国空间站组合体展示舱的问天实验舱。新华社记者 刘大伟 摄
中国载人航天工程新闻发言人、中国载人航天工程办公室副主任林西强说,当前空间站科学实验设施基本完成在轨测试,在轨运行稳定可靠,具备了大规模开展空间科学研究的能力。截至目前,空间站已开展了60余个实验项目、上万次在轨实验,获得了近60TB原始实验数据,下行了300余个科学实验样品。
作为中国航天史上规模最大、长期有人照料的空间实验平台,运行后的国家太空实验室将利用太空中的环境优势展开科研,其中多数在地球上都无法模拟。而问天实验舱、梦天实验舱、天和核心舱部署的多个实验柜将开展上千项科学实验,探索宇宙中的奥秘,并将孵化的科技成果,转化为实实在在的应用,惠及地球上普通人的生活。
09
迄今最全人脑细胞图谱发布
生物医学发展至今,我们要凭借什么才能对人类这一物种身份有新的认识?答案之一就是脑科学。
图片来源:《科学》杂志