早上好,植物提取物百科网!

Nature子刊:通过机器学习模型识别复杂疾病的重要生物标记物

更新时间: 2024-09-27 23:18:56 责编:网友投稿 15浏览

Nature子刊:通过机器学习模型识别复杂疾病的重要生物标记物

2021年5月27日讯/随着高通量技术的发展,通过世界各地研究人员的共同努力,形成了大型公共数据库,如癌症基因组图谱(TCGA)。这对阐明疾病表型的分子机制具有重大意义。然而,由于癌症等复杂疾病的病理以及其在遗传、基因组和蛋白质组水平上复杂的分子机制,研究复杂的人类疾病仍具有挑战性。目前,已有很多基于机器学习的方法开发出来,包括非线性核支持向量机(SVMs)
2021年5月27日讯/随着高通量技术的发展,通过世界各地研究人员的共同努力,形成了大型公共数据库,如癌症基因组图谱(TCGA)。这对阐明疾病表型的分子机制具有重大意义。然而,由于癌症等复杂疾病的病理以及其在遗传、基因组和蛋白质组水平上复杂的分子机制,研究复杂的人类疾病仍具有挑战性。目前,已有很多基于机器学习的方法开发出来,包括非线性核支持向量机(SVMs)、随机森林(RFs)和人工智能领域的深度神经网络(DNNs),为药物反应和医学影像分类等临床相关的生物医学和生物组学数据建立了更强大的预测模型。然而这些模型算法较为复杂,存在信息不透明性,且难以解释每个单独特征的作用。然而,识别重要的生物标志物可以协助研究人员建立关于预防、诊断和治疗复杂人类疾病的新假设。

在本研究中,研究人员提出了一种基于排列的特征重要性测试(PermFIT),用于估计和测试特征的重要性。PermFIT(https://github.com/SkadiEye/deepTL)采用计算效率高的方式实现,无需模型改装。PermFIT可解释复杂框架中的单个特征,包括深度神经网络,随机森林和支持向量机。
通过对TCGA肾癌数据和HITChip Atlas体重数据的应用展示, PermFIT程序进一步显示了其优越性能。通过PermFIT程序的特征选择显着提高了这些预测模型的性能。然而,值得指出的是,PermFIT的预测性能改善受限于每个机器学习模型框架的能力。例如,RF在建模交互项方面相对低效,因此PermFIT-RF的性能可能会受到具有基因-基因强交互作用的复杂性状的限制。总体上,PermFIT与DNN的结合始终显示了优越性能。

图 通过特性选择改进模型性能
总之,研究人员通过在不同场景下进行的大量数据研究表明,PermFIT不仅能得到有效的统计推断,还能提高机器学习模型的预测精度。PermFIT在肾癌基因图谱数据和HITChip图谱数据的应用,展示了其在识别重要生物标志物和提高模型预测性能方面的实际应用性能。
()
原文出处:Mi, X., Zou, B., Zou, F. et al. Permutation-based identification of important biomarkers for complex diseases via machine learning models. Nat Commun 12, 3008 (2021). https://doi.org/10.1038/s41467-021-22756-2

关注我们

微信

网站也是有底线的

植物提取物百科 全球最大的植物提取物中文网 stephenture@qq.com

Copyright © 2020-2024 zwwiki.Cn All Rights Reserved

阅读并接受《用户协议》
注:各登录账户无关联!请仅用一种方式登录。


用户注册协议

一、 本网站运用开源的网站程序平台,通过国际互联网络等手段为会员或游客提供程序代码或者文章信息等服务。本网站有权在必要时修改服务条款,服务条款一旦发生变动,将会在重要页面上提示修改内容或通过其他形式告知会员。如果会员不同意所改动的内容,可以主动取消获得的网络服务。如果会员继续享用网络服务,则视为接受服务条款的变动。网站保留随时修改或中断服务而不需知照会员的权利。本站行使修改或中断服务的权利,不需对会员或第三方负责。

关闭
一键复制下载文档
免费下载
公众号:植物提取物百科复制
复制微信公众,搜索即可关注!

关注回复 :提取码

关注微信公众号获取验证码
欢迎使用微信支付
扫一扫支付
金额:
常见问题

请登录之后再下载!

下载中心

您的账号注册成功!密码为:123456,当前为默认信息,请及时修改

下载文件立即修改

帮助中心

如何获取自己的订单号?

打开微信,找到微信支付,找到自己的订单,就能看到自己的交易订单号了。