农药信息学方法在线平台及其农药研发中应用

作者:世界农药 2024/8/16 9:07:59
绿色农药是防治病、虫、草等有害生物,保障粮食安全重要“武器”。根据联合国粮农组织测算,使用农药平均每年可挽回 30%~40%粮食损失。然而,现有农药的长期不合理使用导致抗性和生态环境问题。根据《中国农业绿色发展报告 2020》,2020 年我国主要粮食作物农药利用率达 40.6%,但仍有 59.4%农药扩散到土壤和大气中,导致生态环境污染。鉴于此,提高绿色农药的研发及创制是解决上述问题的有效途径,

绿色农药是防治病、虫、草等有害生物,保障粮食安全重要“武器”。根据联合国粮农组织测算,使用农药平均每年可挽回 30%~40%粮食损失。然而,现有农药的长期不合理使用导致抗性和生态环境问题。根据《中国农业绿色发展报告 2020》,2020 年我国主要粮食作物农药利用率达 40.6%,但仍有 59.4%农药扩散到土壤和大气中,导致生态环境污染。鉴于此,提高绿色农药的研发及创制是解决上述问题的有效途径,也对保障粮食安全具有十分重要意义。 


随着大数据的积累和数据分析技术的进步,计算信息技术为农药的发现、应用和管理作出了巨大贡献。近年来,农药信息学方法已成功应用于农药靶标识别、活性成分设计和环境影响评价等农药研究与开发各个阶段。本文将重点介绍关于农药信息学在线平台的构建及其在农药研发中应用。基于农药靶标识别、候选农药设计和环境影响评估,构建了一个用于新农药研发的一站式在线平台。该平台系统性整合了农药信息学相关的工具和方法,可通过 http://chemyang.ccnu.edu.cn/ccb/database/PIP/获取。在此基础上,我们介绍了该平台在农药研发中的应用,并深入探讨了农药抗性管理和环境风险评估等农药信息学未来研究方向。 


1 农药信息学方法一站式在线平台 

鉴于健康及生态环境问题,研发高效、低毒、环境友好的绿色农药势在必行。创制绿色农药也是推进绿色兴农、农药减量增效必由之路。作为农业化学领域具有发展潜力的新方法,农药信息学可用于解析实验数据,指导设计新型优质绿色农药,同时也有助于农药残留和风险管理。农药信息学方法已成功应用于农药靶标识别、活性成分设计和环境影响评价等农药研究与开发各个阶段。农药信息学在高效、低毒、环境友好绿色农药研究开发中具有重要作用。农药信息学方法的应用研究,在推进农药研究与开发,实现农药行业绿色转型过程具有现实意义。 


1.1 农药信息学工具和方法 

农药信息学工具和方法主要涉及农药靶标识别、活性成分设计和环境影响评价等阶段。农药靶标识别阶段,农药信息学工具和方法围绕着基于基因组的农药靶标识别和靶标钓靶的反向筛选。如图 1,ACID、SwissTargetPrediction、InsectBase、InsectOR、PlantSPEAD和 PTID工具可用于农药的靶标识别。活性成分设计阶段,农药信息学工具和方法有助于类农药性评估和基于片段 的 分 子 结 构 生 成 。如 图 2 , ACFIS、FungiPAD、 HerbiPAD 、 InsectiPAD 、PADFrag和 QEPest-SFs工具可用于活性成分设计。环境影响评价阶段,农药信息学工具和方法应用于农药残留管理和风险评估。如图 3,BCGlobal、BeeTox、EUPD、PestTox、PID和 OPERA工具可用于环境影响评价。

图片

图 1 可用于农药靶标识别的农药信息学工具 

图片

图 2 可用于农药活性成分设计的农药信息学工具 

图片

图 3 可用于农药环境影响评价的农药信息学工具 


1.2 农药信息学方法一站式在线平台

致力于方便使用,并减少使用方法学习时间,开发了综合性一站式平台(http://chemyang.ccnu.edu.cn/ccb/database/PIP/)。该平台主要围绕农药靶标识别、活性成分设计和环境影响评价等阶段,包括上述各类农药信息学方法及工具(图 4)。对于每个工具,提供了有关资源类型的标签、功能关键词和简要介绍、访问链接和来源文献。实验室开发的网络工具访问统计表明这些方法在全球范围内都很流行(图 5),中国(54.56%)、美国(18.40%) 和德国(4.84%)是该开发网络工具排名前三用户。平台还收集了农药靶标识别、活性成分设计、环境风险评价等方面的实验资源。这些信息包括实验简介、实验方案、指南等,例如农药对蚊子和日本果园蜂(Osmiacornifrons) 毒性测试方案,关于农药和有毒物质的美国环境保护署试验指南。这些信息有助于指导农药发现、应用和管理的实验。 


图片

图 4 一站式在线平台:集合了可用的农药信息学方法,提供了详细的介绍和对这些方法的直接访问 

图片

图 5 实验室访问网络工具的用户数量和分布统计(截至2022 年 2 月)注:饼图显示来自前 10 个国家/地区的用户百分比,嵌入式世界地图用红点显示用户位置 

图片

2 农药信息学方法一站式在线平台在农药研发中应用

在农药研究开发中,农药靶标识别、活性成分设计、环境影响评价至关重要。靶标识别是农药设计的首要步骤,旨在确定有害生物的关键基因/蛋白质。农药信息学通过计算工具预测靶标,支持活性成分的设计和评估。残留物预测和毒性评估是环境影响评价的关键组成部分。农药信息学在农药研发中扮演着不可或缺的角色,为靶标识别、活性成分设计和风险评估提供了重要支持。


2.1 农药靶标识别 

农药靶标识别是基于结构的农药设计第一步,也是最重要一步,其目的是识别对病、虫、草等有害生物具有重要生物功能的基因/蛋白质。农药信息学通过各种计算工具基于实验数据集预测功能信息,被广泛用于靶标识别。我们能够有效地预测不同生物体内的潜在生物靶标,并通过实验测试对其进行深入验证。 


围绕着基于基因组的农药靶标识别主题,图 1表明,用于靶标识别的不同生物基因组资源已经建立起来。越来越多的证据表明,选择性剪接过程的调控可以影响植物的生理机能,选择性剪接为靶标识别提供了良好机会。在线数据库 PlantSPEAD可在线浏览约 43 219 个植物剪接相关蛋白(SplicingRelated Proteins,SRPs)的表达和注释信息。昆虫嗅觉受体(Olfactory receptors,ORs)参与大部分嗅觉感知和交流过程,具有开发杀虫剂潜在靶标潜力。通过多种基因预测算法,InsectOR 网络服务器可预测昆虫嗅觉受体基因,准确率高达 99.0%。昆虫基因组和转录组资源库 InsectBase包含来自 815 个昆虫基因组、25 805 个转录组、超 1 600 多万个基因。这些资源为基因组驱动的新靶标识别提供了基础信息。通过全基因组序列组装,Shahraki 等推断出松异舟蛾(Thaumetopoea pityocampa)中潜在的杀虫靶标。 


已有一些工具可用于农药活性成分的靶标钓靶,从而发现活性成分的农药靶标(图 1)。反向筛选农药靶标是一个有价值且有挑战性的问题,网络资源不仅提供了已知的农药靶标,还提供了寻找新靶标的方法。对于现有的农药活性成分,ACID 网络服务器可以帮助找到其相应的靶标,准确率高达74.4%。徐等运用 ACID 网络服务器评估化合物与靶标蛋白质之间的结合亲和力,从而发现磷酸三苯酯的蛋白质靶标。SwissTargetPrediction 网络服务器可预测化合物最可能靶标,且预测性能较高。第一个综合性农药数据库—农药和靶标相互作用数据库(PTID)于2013年建立,包括约1 347种农药、约4 245个靶标和约 13 738 种农药—靶标相互作用,并附有丰富的生态毒理学等数据注释。 


2.2 农药活性分子设计 

农药信息学通常提供有关分子优化的合理信息,可指导新农药活性成分的设计。它有助于分子生成和类农药性评估过程。发现新的活性成分是防治新植物病害或虫害的迫切需要。基于片段的方法是通过探索大量化学空间来提高新分子生成成功率的常用策略。在农业化学中,类农药性被视为分子与已知农药在分子性质和结构特征方面的相似性。了解已上市农药的分子特征,这将有助于指导农药活性成分的设计和选择。 


已开发基于片段的农药活性成分分子设计网络工具(图 2)。郝等开发了一种药效团相关的片段虚拟筛选(Pharmacophore-linked Fragment Virtual Screening,PFVS)方法,并成功地发现了除草剂靶标细胞色素bc1 复合物的皮摩尔抑制剂。他们提供了一种更新的PFVS 方法,作为 ACIFS 的网络服务器,可更广泛地使用。ACFIS 的结合亲和力预测准确率为 88.5%。利用 ACFIS 网络服务器进行农药有效成分设计。乙酰羟基酸合成酶(AHAS)是一种很有前途的除草剂靶标,但受到杂草抗性的阻碍。一般来说,P197L突变是引起除草剂抗性的主要原因。曲等利用ACFIS 网络服务器中实现的片段链接虚拟筛选生成了一系列嘧啶基水杨酸衍生物。通过筛选排名靠前衍生物并对其进行合成、测试对野生型和 P197LAHAS 的酶抑制活性和温室除草活性,最终发现一种潜在的抗 AHAS 除草剂,对野生型和抗性杂草均表现出良好除草活性。为了探索生物活性片段空间, 农药和药物片段(PADFrag)数据库收集了 1 652 种上市药物和 1 259 种农药的片段、总共包含约 5 919 个独特片段及其相应靶标。这些工具有助于设计农药活性成分的新结构。 


用于分析和量化化合物的类农药性的各类理论计算工具已被开发(图 2)。为了根据化合物的特性对其进行排序,Avram 等[18]提出了一种评分函数(QEPest-SFs)来定性估计除草剂、杀菌剂和杀虫剂的类农药性。该方法基于 6 种分子特性,准确率达到78.7%。与 QEPest-SFs 类似,还建立了一系列网络服务器以方便使用。FungiPAD 网络服务器提供类杀菌剂性的评估,准确率达 82.5%,它基于 3 种评分函数,即类杀菌剂性定量估计(QEF)、相对药物似然性(RDL)和高斯评分函数(GAU)。QEF 通过基于 6 种分子特性的经验拟合来描述可能性,而 RDL 则基于贝叶斯概率论,GAU 根据 9 种分子特性的高斯分布预测药物的类杀菌剂性得分。基于相同的分子特性,InsectiPAD 和 HerbiPAD 网络服务器可分别根据RDL、GAU 的定量估计值、类农药性得分定量进行类杀虫剂性和类除草性评估。InsectiPAD 和 HerbiPAD的准确率分别为 75.0%和 70.0%。这些计算策略可对分子与农药之间的分子相似性进行定量和定性评估。 


2.3 环境影响 

环境中未被代谢或降解的农药残留可能会对空气、土壤、水等生态环境以及鸟类、鱼类等非靶标生物的健康产生有害影响。农药信息学可根据农药的化学结构确定降解生物量,然后从不可提取的残留物中减去降解生物量,从而预测残留物。利用分类模型结合分子特征来预测毒性,农药信息学为农药残留管理和风险评估提供了有用工具。 


为保护人们免受农药残留的不良影响,不同组织制定了最大残留限量标准。例如,欧盟委员会维护 的 欧 盟 农 药 数 据 库 (European Union PesticideDatabase, EUPD)包含了约 653 种农药活性成分在特定食品中的最大残留水平。BCGlobal 在美国农业部对外农业服务局的支持下,提供 140 多个农产品市场的 875 种商品的 1 000 多种农药的最新、最大残留限量标准。它允许用户轻松比较多个国家的标准。农药的环境归趋取决于其理化性质和环境条件。为了模拟农药在环境中的迁移和降解,Felix 等开发了一种归宿和迁移模型 PestTox,以模拟农药的归趋、迁移及其对非目标物种种群动态的影响。敏感性分析表明,持续时间与种群数量存在相关性,成虫发育时间为 100~500 d,卵发育时间为 7~21 d。农药残留管理在预防环境和健康危害问题发生方面可以发挥积极作用。 


经过数十年研究,不同储存库收集了大量生态毒理学等数据。例如,农药信息数据库(Pesticide InfoDatabase,PID)提供了 15 300 多种农药活性成分的生态毒性信息。数据驱动的毒性预测提供了一种降低毒性测试成本和劳动力的方法。昆虫传粉者面临的挑战之一是接触杀虫剂。基于图注意力卷积神经网络(Graph Attention Convolutional Neural Network,GACNN)方法,BeeTOX 已被开发用于预测蜜蜂化学中毒。该方法测试数据集准确率达 83.7%,较其他预测模型高 6.0%。王等为赖氨酸受体设计了第一个光致变色配体(PCL)。这种 PCL 能够调节活蟑螂的神经元和心脏功能。用 BeeTox 法对 PCL 的蜜蜂毒性进行评价,结果表明 PCL 对蜜蜂具有低毒性。毒性数据和预测对发现危害较小的农药具有积极影响。Mansouri 等开发了 OPEAR 模型用于评估化合物的物理化学性质和环境归趋,已应用于超 750 000 种化合物。这些毒理学数据及预测模型有利于监测和控制农药的潜在有害影响。


2.4 资源性能和限制 

关于农药靶标识别工具的性能和限制,由图 1可知:PTID 数据库包含的农药信息全面,但 2013 年来一直未有更新。在线数据库 PlantSPEAD 和昆虫基因组及转录组资源库 InsectBase 分别是植物和昆虫靶标识别代表性资源。InsectOR 网络服务器提供了预测未知功能基因的方法。ACID 网络服务器可基于活性成分找到其潜在靶标,但潜在靶标仅限于已知农药靶标。尽管新靶标被不断发现,但靶标数量仍然有限,欣喜的是在基因组时代,可以大力开展基因组测序和注释工作,以明确新的作用机制,发现新靶标。农药靶标也可以与特征明确的药物靶标相关联,还可通过病原体生存相关的生理途径研究明确农药靶标。


比较了活性成分设计工具的性能和限制(图 2)。在分子生成方面,PADFrag 提供了生物活性分子片段的结构资源,ACFIS 则利用这些片段组装成新分子。在类农药性评估方面,QEPest-SFs 提供了一个评估除草剂、杀虫剂和杀菌剂相似性的综合软件,但其安装和操作较为复杂。相反,FungiPAD、HerbiPAD和InsectiPAD提供了用户友好型的网络平台。这些方法的准确率超过 70.0%,尤其是 FungiPAD准确率高达 82.5%。农用化学品的研发和生产应注重成本,因此需要经济、高产率的化学合成技术。此外,对于在多种作物上都具有高生物利用率的农用化学品,其复杂程度也是惊人的,从实验室到田间的转化也是一个巨大的挑战。 


还统计分析并揭示了农药环境影响评价工具之间的差异(图 3)。在农药残留限量方面,BCGlobal和 EUPD 代表了美国和欧盟的标准。BCGlobal 包含比 EUPD 更丰富的最大残留限量数据。在农药毒性方面,PID 是一个具有代表性的数据库,收集了约15 300 种农药活性成分的人体毒性和生态毒性数据。与目前可用的蜜蜂毒性预测方法相比,BeeTOX的准确率最高,达到 83.7%。PestTox 是首个开源生态建模工具,用于模拟迁移、降解和毒性引起的死亡率。迄今,环境归趋预测仍是一项挑战,农药对环境和人类健康的负面影响已引人关注,合理、适度使用农药是减少环境污染,实现病虫害控制的有效措施,提高理解和认识自然条件下的农药残留和毒性评估也迫切需要。


3 未来展望 

农药信息学应用于设计有效和安全的农药仍然面临挑战。


首先,已知的农药靶标非常有限。在基因组和蛋白质组数据的驱动下,农药信息学促进了对生物体基因功能的研究,为新型农药的合适靶标提供信息,靶标识别将是绿色农药发现的主题;


其次,农药的作用方式模糊且不精确。农药的滥用会导致对农药的敏感性降低,从而导致预防失败。阐明农药与靶标之间的相互作用并设计具有新颖作用方式的新农药可以为克服农药抗性提供解决方案,超越单靶标农药的多靶标位点农药的设计是有用的,更积极主动地使用抗性诊断应有助于农药抗性管理。一种选择是预测农药靶标的抗性突变,检测抗性突变可以预测抗性群体,并可以防止抗性群体的出现;


最后,农药对非靶标物种和环境造成有害影响,必须采取必要措施监测农药的使用。开发农药最佳使用及其影响的预测模型将有助于监测和控制农药的有害影响,农药信息学做出了很大贡献,但仍有很长的路要走。在农药信息学进步的推动下,更多的农药设计平台正在建立,这将为未来提供新型绿色农药。


作者:陈东雨 1,梅龙灿 2,王 玮 1,郝格非 1,2,杨光富 2 (1.贵州大学 绿色农药全国重点实验室,绿色农药与农业生物工程教育部重点实验室,精细化工研 究开发中心,贵阳 550025;2.华中师范大学 绿色农药全国重点实验室,武汉 430079)