蛋白质是生命的基石,生物的功能依赖既平稳而又灵活性星型的蛋白质结构。蛋白质的光谱号召信号,特别是在是紫外光谱,可以称作蛋白质骨架的“指纹”。这个“光学指纹”,经过理论仿真的理解,可以说明了出有准确的蛋白质结构,为生命科学和医学临床获取极其重要的信息。
然而,蛋白质的结构极为复杂多变,必须做到大量的高精度的量子化学理论计算出来。由于计算出来量过于大,即使是最得意的超级计算机只能也“吃不消”。
所以蛋白质的光谱的理论理解是一个长年的艰难与挑战,容许了光谱的精确分析和蛋白质结构的找到。怎么在光谱理论仿真中防止过于便宜的量子化学计算出来,理解蛋白质骨架的“光学指纹”,是一个最重要的科学课题。而近年来,人工智能技术被广泛应用到各个领域,用作大幅度降低简单体系的计算出来量。最近,中国科学技术大学微尺度物质科学国家研究中心教授江俊,与中国科大教授罗毅和美国加州大学尔湾分校教授ShaulMukamel合作,通过利用人工智能机器学习中的神经网络技术,仿真了蛋白质肽键结构与性质之间的构效关系,将计算出来量一下减少了上万倍。
最后他们顺利地预测了肽键紫外光谱,还用随机森林的办法说明了了具备化学内涵的结构叙述子和构效关系。人工智能与量子化学理论计算出来的融合,为预测蛋白质的光学特性获取了一种高效的工具。涉及成果以ANeuralNetworkProtocolforElectronicexcitationsofN-Methylacetamide为题公开发表在《美国国家科学院院刊》(PNAS,DOI:10.1073/pnas.1821044116)。
江俊课题组近些年致力于发展机器学习技术在分析领域的应用于,希望探究使其沦为解决问题分析问题的一种最重要工具。在该工作中,研究人员首先在300K温度下通过分子动力学仿真以及量子化学计算出来,获得了五万组有所不同构型的肽键模型分子。通过机器学习算法检验出键宽、键角、二面角跟电荷信息作为描述符,通过神经网络来建构肽键基态结构与其激发态性质之间的构效关系。基于训练好的机器学习模型,预测出了肽键的基态偶极矩及激发态性质,最后预测出肽键的紫外吸收光谱。
为了检验机器学习模型的鲁棒性,研究人员又基于300K的温度下获得的机器学习模型,预测出肽键在200K以及400K温度下的紫外吸收光谱,其结果与时间密度绿函理论计算出来很好地相符。这是人工智能技术首次用作理论计算出来预测蛋白质的光谱研究。通过理论计算出来获得大量数据,用于人工智能加以训练建构构效关系,用于最后获得的模型用作预测,为仿真蛋白质的光谱获取了一种新的思路。
该项工作奠定了机器学习仿真蛋白质肽键骨架紫外吸收光谱的可行性和优势,蛋白质的“光学指纹”理解也将不会显得更为只能和有效地。涉及工作获得国家自然科学基金、中科院先导项目的资助,该论文第一作者为博士生叶盛与博士后胡伟、李鑫,江俊与ShaulMukamel为联合通讯作者。
本文来源:五分赛车网站-www.yonghuiwang.com
电话:400-123-4567
传 真:+86-123-4567
手 机:16058064426
邮 箱:admin@yonghuiwang.com
地 址:香港特别行政区香港市香港区工程大楼72号