暨南大学肿瘤分子生物学教育部重点实验室何庆瑜团队建立机器学习算法全局性评估乙酰化位点功能,相关成果发表于2023年12月发表于Molecular & Cellular Proteomics(IF = 7.0)上

发布者:何庆瑜发布时间:2024-06-25浏览次数:47

1. 文章概述

何庆瑜团队通过乙酰化位点周围分子环境特征开发出一种新的评分模型LAFEM(Lysine Acetylation Functional Evaluating Model),用于评估赖氨酸乙酰化位点的功能重要性。LAFEM根据其计算的乙酰化位点功能评分(Acetylation functional score)筛选与基本性状直接相关的乙酰化位点,并建议优先对这类位点进行后续的功能验证。

2. 图文导读

赖氨酸乙酰化是重要的翻译后修饰之一,在多种生物学过程中具有关键作用。尽管目前通过质谱蛋白质组学技术已鉴定出约20000个赖氨酸乙酰化位点,但由于缺乏优先评估策略,95%以上的乙酰化位点尚无功能注释。

LAFEM模型的建立流程包括数据准备、特征提取、模型构建、模型测试和验证四个步骤。数据准备阶段,共1280个功能验证乙酰化位点被标记为正样本,3621个无功能验证乙酰化位点被标记为负样本,这些乙酰化位点均来自Uniprot和PSP数据库。研究人员随即获得了这些乙酰化位点的8个分子环境特征,并通过欠采样处理训练集,最后使用随机森林模型构建LAFEM优先级策略。通过特征重要性排序,研究人员发现分子可及性表面积、无序性、同源性、位点到结构域距离以及氢键供体能力是探究乙酰化位点功能的重要指标。LAFEM在内部测试数据集和验证数据集中分别取得了0.849和0.896的AUC值,验证了LAFEM的准确性。此外,研究人员通过LAFEM发现在基本性状差异明显的肺癌与其癌旁组织中,差异乙酰化位点的乙酰化功能性评分(AFS)更高,说明了高AFS与基本性状相关性高。此外,研究人员还通过湿实验证明了在肺癌组织中均高表达的NUCKS1的ac-K35和ac-K9中,高AFS的ac-K35位点影响肺癌增殖能力更显著,从功能实验的角度说明了LAFEM模型的实用性。

3. 研究意义

LAFEM是首个不通过定量乙酰化质谱鉴定的赖氨酸乙酰化位点功能评估工具。本次LAFEM评估了共15,410个乙酰化位点的功能重要性,丰富了乙酰化位点的功能注释,为后续实验研究提供了重要参考。此外,LAFEM优先级策略对其它翻译后修饰领域功能重要性评估有重要借鉴意义,其发现的与翻译后修饰功能相关的特征也为该领域的功能研究提供了理论基础。

 

4. 研究团队及资助信息

该研究由何庆瑜教授团队独立完成,暨南大学为唯一完成单位,何庆瑜教授和汪洋副研究员为共同通讯作者,梁钧泽、李德华和肖永春为共同第一作者。该研究得到了国家重点研发计划(2022YFA1304604和2020YFE0202200)、国家自然科学基金(82103208)和广东省自然科学基金项目的基金(2023A1515030115)的资助。


原文链接:https://www.mcponline.org/article/S1535-9476(23)00211-6/fulltext