暨南大学生命科学技术学院张弓教授团队建立预测任意蛋白质功能的AlphaFun策略

发布者:何庆瑜发布时间:2024-06-25浏览次数:32

近日,暨南大学生命科学技术学院张弓教授团队建立了一种基于深度学习算法结构的可以预测任意蛋白质功能的策略AlphaFun,首先应用于人类蛋白质组计划,解决了超过99%的人蛋白质功能预测问题,并可拓展至任何物种。

蛋白质是一切生命活动的实际执行者,因此理解蛋白质的功能是解决一切生理和疾病问题的关键。对已知功能蛋白质的研究无法解决癌症、糖尿病等复杂疾病的问题,说明这些疾病的关键很可能存在于未知功能的蛋白质。尽管人类蛋白质组计划已进行了12年,仍有数千个人类蛋白质的功能是完全未知的。但这些未知功能的蛋白质究竟可能执行哪些生物学功能,一直是科学家头疼的问题。这些蛋白质与已知功能蛋白质的序列同源性低,又没有解析的晶体结构,传统的基于序列比对和结构比对的功能预测方法统统不管用,根本无从下手研究。

为了解决这个问题,张弓教授团队开创性地提出了预测蛋白功能的AlphaFun策略。该策略巧妙地利用了AlphaFold2深度学习模型预测的蛋白质结构,虽然这个结构的精度不足以进行结构生物学的精细研究,但以其进行概略的结构比对却完全够用,足以比对至已知功能的蛋白质结构上以预测功能。接下来的问题是计算速度问题,因为结构比对速度很慢,在人蛋白质组范围内进行海量的结构比对需要花费几个月的时间,如果进一步使用其他物种数据库进行结构比对,耗用的时间将是天文数字。研究团队通过高性能的序列概略比对作为启发,将计算缩减到1-2天内完成,大大提高了实用性。藉由这些创新,AlphaFun已成功预测了高达99%的人类蛋白质组功能,精度超过了以往所有功能预测算法,破解了绝大部分目前功能尚不明确的蛋白质,使这些蛋白质的功能研究有了重要的提示信息,研究者可以根据这些预测功能的指引,在合适的生物学模型中进行研究,达到“一击必杀”的效果,大大增加人们对人类蛋白质组的深入认识,为解决复杂疾病问题寻找关键功能蛋白。

此次研究成果的公开发表,将对蛋白质组学和生物信息学领域的持续发展产生积极的推动作用。该研究不仅为未知功能蛋白的功能解析提供了坚实的理论支撑,同时也为其他物种的蛋白质功能注释工作提供了强有力的工具支持。

该论文题为“AlphaFun: Structural-Alignment-Based Proteome Annotation Reveals why the Functionally Unknown Proteins (uPE1) Are So Understudied”,发表在国际期刊《Journal of Proteome Research》。

原文链接:https://pubs.acs.org/doi/10.1021/acs.jproteome.3c00678