欧文氏杆菌(Erwinia)是一类重要的农作物致病细菌,侵染宿主范围广,在世界范围内造成了严重的经济损失,其中Erwinia carotovora subsp. atroseptica SCRI1043 (Eca SCRI1043) 可导致马铃薯感染黑胫软腐病,危害极大。本文构建了Eca SCRI1043基因组的代谢网络,并进行拓扑结构和流平衡分析,以此筛选出网络的中心节点。若中心节点所代表的酶收录在TTD数据库中,则此酶可作为农用杀菌剂的候选靶标。随后选取靶标十一异戊二烯焦磷酸酶(Upps),采用specs公司的商品化合物数据库作为小分子数据库,对靶标进行高通量虚拟筛选,对综合打分结果最好的前400个化合物进行目筛后得到73种先导化合物,这73种先导化合物可以进一步进行后续生测实验以确定其杀菌活性。 Erwinia carotovora subsp. atroseptica SCRI1043 (Eca SCRI1043) is a widespread phytopathogen that causes blackleg and soft rot disease in potatoes. In this paper, we reconstructed the metabolic network of Eca SCRI1043 based on its genomic information. Through the topology and flux balance analysis, hub nodes of the network were selected. After that TTD database was used to screen those hubs and find out the candidate targets. Undecaprenyl pyrophosphate synthetase (Upps) was chosen to do homology modeling and virtual screening by using the comercialize compounds database provided by specs company. Finally, 73 compounds were screened manually in the top scoring 400 compounds.
细菌性软腐病作为一种分布极广的植物病害,在全球造成了严重的经济损失,其中胡萝卜软腐欧文氏菌(Erwinia carotovora subsp. atroseptica SCRI1043,Eca SCRI1043)是其主要病原菌,可危害胡萝卜、马铃薯、大白菜等农作物,并引起储存期蔬菜的腐烂[
Eca SCRI1043是在土壤中传播的植物致病菌,可借助昆虫、地下害虫或灌溉水传播,从根茎部伤口或地上叶片气孔及水孔侵入,主要侵害地下部肉质根,病组织通常表现为软腐与湿腐,如果侵染维管束组织,能阻碍水分输送而导致地上茎叶出现萎蔫等症状[
随着基因组及生物化学数据的大量累积,通过基因组学方法构建物种的代谢网络,可从系统角度出发,筛选对维持物种生存所必须的酶或核酸作为靶标,提高药物开发的效率[
全基因组尺度代谢网络的重构包括重构、模拟、评估及修正。其中模型的重构最为关键,它包括基因注释、代谢反应及反应列表的建立、代谢网络的建立、计量学矩阵的建立以及代谢途径的优化。近几年,国际上对代谢网络重构的研究如火如荼,出现了多种代谢网络重构工具,如GEM System[
代谢草图中的反应信息源于KEGG,而KEGG作为网络重构的主要数据库,其反应方向存在很多错误。Ma和Zeng对KEGG数据库的所有反应信息进行核查,并根据一定的生理学规则,提出了确立反应方向的11条规则[
通用代谢物一般是用于电子转移以及一些功能基团的转移,如磷酸基团、氨基基团、一碳单元、甲基基团等。除了上述物质外,我们认为H2O、NH3、O2、CO2、Phosphate也是通用代谢物[
目前绝大多数代谢网络都是用节点代表代谢物,节点之间的连线代表代谢物之间的反应,而反应方向则由箭头表示。如Ma等人对可逆反应 R00006:2C00022 C00900 + C00011 表示为C00022 C00900和C00022 C00011,其中C00022、C00900、C00011为均KEGG编号的化合物[
生物网络作为复杂网络,可以运用图论理论进行分析。其中连接度和中介性这两个参数可以反应节点在网络中的影响力和重要性[
TTD数据库收集了成功的和正在研究的靶标以及靶标对应的疾病、药物、序列等信息[
Flux Balance Analysis (FBA)是一种分析代谢网络的数学工具,不需要代谢物浓度或者酶动力学信息便可预测生物必需的代谢反应。本文中采用Crobra Toolbox v2.0[
SYBYL-X是Tripos公司研发的一个相当全面的药物与分子设计专业工具,提供了综合的分子模拟工具,同源模建采用的是SYBYL-X 1.2中的Orchestrar模块。虚拟筛选则先用Dock 6.4进行初筛[
Eca的代谢网络用上述“反应物–酶–生成物”的表示方式整理为cytoscape可读的Excel格式,利用cytoHubba插件舍弃孤立反应后含有1416个节点,2041条边(见图1)。为验证本文构建的代谢网络在结构上符合代谢网络的基本规律,故对网络的节点度分布和平均路径长度进行了分析。
目前的研究表明,代谢网络具有典型的“小世界”和“无标度”特征,也就是说代谢网络具有较小的网络平均路径长度,且节点的度符合幂律分布。分析Eca SCRI1043的代谢网络,结果显示,采用“反应物–酶–生成物”的方式表示的代谢网络也符合“小世界”及“无标度”的规律。
Jeong等人对43种不同物种的代谢网络进行研究后发现无论是古菌、原核还是真核,其代谢网络的平均路长都约为3.2,表明任何两种代谢物之间平均只需3步即可完成转化[
图1. Eca SCRI1043的代谢网络
表1. 模式物种及Eca SCRI1043的代谢网络的平均路径长度
从表1中可以看出,胡萝卜软腐欧文氏菌代谢网络的平均路径长度为9.26,直径为28,仍在代谢网络规定的对数尺度范围内。考虑到Eca代谢网络节点的数目,本文构建的代谢网络符合小世界的基本规律。
平均路径长度和网络的直径是评价网络节点间信息交流速度的重要依据。这表明,胡萝卜软腐欧文氏菌代谢网络的大多数代谢物只需通过10步之内的反应就可以完成相互转化,从而可以保证代谢物浓度的变化能迅速的传到整个网络。整个网络的直径为28,说明网络中相距最远的两个代谢物也只需28步就可完成相互转换。这两个指标意味着代谢物和酶的浓度的变化信息能够很快的传递给整个网络,使得整个菌种能够迅速的对外界环境的变化作出反应。
代谢网络节点度的概率密度函数为p(k) = ak–r,其中a与k为常数,幂指数r约为2.2。符合这一条件即为无标度网络。无标度网络的关键节点控制着整个网络的结构,使得网络对随机改变(如突变、环境的变化等)有很强的鲁棒性[
从图中可以看出,连接度高的节点数目较少,绝大多数节点的连接度都较低,也就是说,少数连接度高的节点连接着为数众多的节点,这些高连接度的节点控制着整个网络的结构,对维持网络的稳定性起着重要的作用。
在对胡萝卜软腐欧文氏菌进行靶标筛选时,首先筛选网络中节点的度和中介性都大于均值的节点,得到111个候选酶。之后对这111个酶进行TTD数据库筛选,得到44个候选靶标。随后用FBA验证这44个候选靶标对胡萝卜软腐欧文氏菌的生存是否重要,得到6个对菌种维持生命所必须的靶标(见表2)。
图2. Eca SCRI1043代谢网络的度分布
表2. 潜在靶标信息
潜在靶标十一异戊二烯焦磷酸酶(酶号2.5.1.31, 简称Upps)在PDB数据库中有相似性很高的同源蛋白的晶体结构,在宿主植物中的没有序列相似性高的同源蛋白,因此选取Upps作为潜在靶标,进行下一步的虚拟筛选工作。
十一异戊二烯焦磷酸酶 Upps是由253个氨基酸残基组成的单亚基蛋白质。它催化反应的产物UPP是细菌细胞壁主要成份肽聚糖生物合成中的重要载体,功能是运载N-乙酰胞壁酸五肽到细胞膜与N-乙酰葡萄糖胺结合。作为一个新的潜在的抗生素靶标,它的催化机制和结构构像得到了深入的研究[16-19],也有关于基于结构的抑制剂的筛选的报道[
在同源模建中,模板的选择至关重要,对结果的准确性起着决定性的影响。本文从PDB数据库中选取了Escherichia coli的Upps结构1X06作为胡萝卜软腐欧文氏菌Upps的模板,二者是高度同源蛋白,序列全同性(Identity)为80.3%,1X06的晶体结构具有较高的分辨率(1.9 Å),包含3个配体小分子,分别为镁离子,反应底物IPP以及FPP结构类似物FSPP[
利用SYBYL-X1.2的同源模建模块ORCHESTRAR对Eca SCRI1043的Upps进行同源模建,模建的结果采用Procheck进行评价,拉氏图结果表明模建蛋白的主链结构合理:主链二面角φ、ψ落于中心区域和“可接受区域”的残基占100%,绝大多数φ – ψ角均在正常范围内,没有落在不允许区域内的残基(图3)。
模建蛋白的结构显示Upps是一个主要由a螺旋和ß折叠组成的单体蛋白质分子(图4)。从图4中可以看到Upps的活性口袋是一个狭长的疏水通道,由4个ß折叠(黄色的条带)和2个a螺旋(红色的螺旋)组成了一个桶装空间结构。活性口袋中结合的配体小分子从上到下依次是镁离子,FSPP和IPP。
Asp25是Upps的反应催化位点[
图3. Eca SCRI1043中Upps同源模建的Rmaahcnadrna图
图4. Eca SCRI1043中Upps的同源模建结构图
图5. Upps与底物类似物FSPP的相互作用图
使用Dock 6.4以同源模建的Eca SCRI1043 Upps为受体蛋白质,对specs数据库中的10万多个化合物进行初筛,采用autoMS产生分子表面,再对活性口袋部位分子表面的位点进行聚类,并以配体FSPP周围4 Å半径范围内的氨基酸残基来确定口袋部位的球集。然后用GRID获取口袋部位的网格点数据,并对初筛结构进行打分(Dock 6.4中的对接参数见附录2),取打分前1600的化合物分子用Autodock 4.2进行精筛(Autodock 4.2中的对接参数见附录3),分子对接的网格是以配体FSPP为中心,长宽高分别为38 Å,20 Å,52 Å,网格间距0.375 Å,包含了底物结合的全部空间,取打分前400位的化合物进行目筛,在目筛时没有考虑化合物和蛋白的结合能,筛选标准如下:1) 小分子占据和FPP尽量相同的结合位置,去掉大部分露在活性空间外的分子;2) 考虑小分子和活性空间的亲水和疏水空间及小分子和受体之间的氢键结合情况。最终得到73个潜在活性化合物。在后续工作中可进一步对这些化合物进行生测测实验,鉴定其抑菌活性。
本文重构了胡萝卜软腐欧文氏菌的代谢网络,通过拓扑结构分析并结合TTD数据库和FBA成功筛选到6个Eca SCRI1043维持正常生命活动所必须的酶,为研制杀菌剂提供了潜在的作用靶标。并对其中的靶酶Upps进行了同源模建和虚拟筛选,并获得了73个潜在的活性杀菌剂(见附录4)。本文的研究表明利用代谢网络和靶标筛选的策略研发农药杀菌剂具有可行性,下一步的工作将对筛选到的活性物质进行相应的抑菌试验,以验证其活性。
本文由国家自然科学基金(31071659)资助。感谢张红雨教授,戢风琴博士和马彬广副教授的悉心指导。
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[
[