logo资料库

Gromacs的简单初步流程详解.doc

第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
资料共10页,剩余部分请下载后查看
细胞凋亡蛋白 Bcl-2 的分子动力学模拟 学号:1030402016 姓名:徐优俊 一、背景: 在细胞凋亡的相关调控基因的研究方面,Bcl-2 基因是目前研究的最深入、最广泛的 凋亡调控基因之一。最近,在肝细胞中发现了乙型肝炎病毒(Hepatitis B virus, HBV)的两 种主要靶标(Bcl-2 和 Bcl-xL);HBV 编码一种致病的促进肿瘤产生的蛋白 HBx,HBx 的 宿主靶标是两种小分子蛋白 Bcl-2 和 Bcl-xL,HBx 使用一种特殊的基序---它是一小段氨 基酸序列,类似于在一些导致细胞死亡的蛋白中发现的序列---来与靶标 Bcl-2 和 Bcl-xL 相互作用,促进宿主细胞中钙离子水平提高。钙离子水平提高随后触发病毒 HBV 复制 和细胞死亡。这种基序发生基因突变时,HBx 结合到 Bcl-2 和 Bcl-xL 蛋白上,并阻止病 毒复制。类似地,当人肝细胞中 Bcl-2 或 Bcl-xL 蛋白被敲降或功能减弱时,HBx 更不能 够导致被感染的细胞内的钙离子水平增加和病毒复制。 二、实验步骤: 1) 从 PDB 网站(http://www.rcsb.org/pdb/home/home.do)上下载蛋白结构 4IEH.pdb 文 件。 4IEH.pdb(Bcl-2)的结构: Fig1: Licorice,Tube and NewCartoon representations of Bcl-2 protein 相关信息介绍: Bcl-2 基因家族是目前广泛研究的一类细胞凋亡相关基因,其表达和调控是影响细胞 凋亡的关键因素之一,在细胞凋亡信号转导途径中发挥质量要作用。通过上调促凋亡的 Bcl-2 的基因表达,从而在转录水平调节凋亡相关蛋白的表达以影响凋亡的发生。Bcl-2 家族成员都含有 1-4 个 Bcl-2 同源结构域(BH1-4),并且通常有一个羧端跨膜结构域。 Bcl-2 的网络结构图:
Fig2: This is the evidence view. Different line colors represent the types of evidence for the association. including B-cell CLL/lymphoma 2; Suppresses apoptosis factor-dependent lymphohematopoietic and neural cells. Regulates cell death by controlling the mitochondrial membrane permeability. Appears to function in a feedback loop system with caspases. Inhibits caspase activity either by preventing the release of cytochrome c from the mitochondria and/or by binding to the apoptosis-activating factor. in a variety of cell systems 2) 用 UltraEdit 打开 4IEH.pdb 文件,将 HETATM 一段(除去其中的水),从上图看出, 该蛋白结构存在两条链,除去较短的链,保存为 4IEH_2.pdb 文件。 3) GROMACS 实验准备阶段: 1) Pdb2gmx,建立该蛋白的拓扑文件,其中选择 10(43a2 力场)、2(SPC/E 水),生成 4IEH_2_1.pdb 和 4IEH_2_1.top 文件。 >pdb2gmx -ignh -f 4IEH_2.pdb -o 4IEH_2_1.pdb -p 4IEH_2_1.top -f: 指定你的坐标文件,可以是 pdb、gro、tpr 等等包含有分子坐标的文件; -o: 输出文件,也就是处理过的分子坐标文件,同样可以是 pdb、gro、g96 等文件类型; 拓扑; -p:输出拓扑文件。pdb2gmx 读入力场文件,根据坐标文件建立分子系统的 -ignh:舍弃分子文件中的 H 原子,因为 H 原子命名规则多,有的力场不认; 2) Editconf, 为蛋白质加上 1.5nm 厚度的盒子 >editconf -bt cubic -f 4IEH_2_1.pdb -o 4IEH_2_2.gro -d 1.5 -bt:盒子类型,有正方型,长方形,八面型等等; -f :指定你的坐标文件; -o :输出文件,即放进盒子里面的分子系统。 -d :分子离盒子表面的最短距离(nm)。 3) Genbox, 向上述的盒子中添加水分子,选择 SPC 模式的水溶液,生成溶质+
溶液体系的 4IEH_2_3.pdb 和 4IEH_2_1.top 文件 >genbox -cp 4IEH_2_2.gro -cs spc216.gro -o 4IEH_2_3.pdb -p -cp:带盒子参数的分子坐标文件,也就是 Editconf 的输出文件; -cs:添加的水分子模型,如 spc216、spce、tip3p、tip4p 等; -o: 输出坐标文件,就是添加水分子之后的分子坐标文件,默认是.gro 文件, 4IEH_2_1.top 但是也可以输出其他文件格式,如 pdb; -p: 系统拓扑文件。 4) Make_ndx,生成一个仅包含蛋白质分子的索引文件; >make_ndx -f 4IEH_2_3.pdb -o 4IEH_2_4_pro.ndx -f:指定你的坐标文件; -o:输出 protein 的索引文件 运行上述代码过程中选择 1(protein); ca.itp >genrestr -f 4IEH_2_3.pdb -n 4IEH_2_4_pro.ndx -o ca.itp -f:指定你的坐标文件; -n:输入上述得出的 protein 的索引文件; -o:输出仅包含某种原子的文件 运行上述代码过程中选择 3(C-alpha)的选项; 5) Genrestr, 在 protein 索引文件基础上生成一个仅包含 Ca 原子的索引文件 3) GROMACS 实验核心阶段: 主要步骤:在进行能量最优化之前,先用 GROMACS 的预处理程序 grompp 处理所有 输入文件。grompp 预处理拓扑文件(.top),坐标文件(.gro)和一个参数 文件(.mdp),然后输出一个二进制拓扑文件(.tpr)。再对前面的结果进行 动力学模拟,运行 mdrun 命令; 命令的参数介绍: grompp mdrun -f:所要输入的参数文件; -c:所要输入的坐标文件(*.pdb); -p:输入对应的拓扑文件; -o:生成二进制拓扑文件,是运行 mdrun 命令的输入文件; -s:输入预处理的 tpr 文件; -o:输出新的拓扑文件; -e:输出能量文件; -g:运行该命令时的一些步骤信息; -v:在终端显示运行的进度信息; 1) 对该蛋白的结构进行分步能量最小化。 A 固定 C-alpha 原子(mdp 文件中修改 define=-DCA),采用 steep 算法(修改 integrator=steep) , 进 行 1000 步 能 量 最 小 化 (nstep=1000), 加 入 参 数 coulombtype = PME fourierspacing = 0.12,用 PME 来计算静电库仑 力; >grompp -f em6A.mdp -c 4IEH_2_3.pdb -p 4IEH_2_1.top -o 4IEH_2_6A.tpr 预处理出来的结果:电负性为-4.999999,为了平衡电荷,使体系不崩塌,向 SOL 体系中加入 5 个 Na+中和: >genion -s 4IEH_2_6A.tpr -o 4IEH_2_6_ion.pdb -s:输入拓扑文件; -o:输出加入离子后的坐标文件(*.pdb); -pname: 输入加入阳离子的名称,阴离子为-nname; -pname NA+ -np 5
-np:输入加入阳离子的个数,阴离子为-nn; 在运行上述代码过程中选择 13(SOL)体系; 加入离子后,拓扑结构文件(*.top)需要修改: 在拓扑文件最后的的 “molecules”一栏,添加“NA 5”,然后在 SOL 数量中减 5。重新保存; 重新进行预处理: >grompp 4IEH_2_1.top -o 4IEH_2_6A.tpr >mdrun 4IEH_2_6A.log -c 4IEH_2_6A_em.gro –v -po mdout6A.mdp 4IEH_2_6_ion.pdb 4IEH_2_6A.edr 4IEH_2_6A.tpr 4IEH_2_6A.tpr em6A.mdp -o -c -p -g -f -s -e 由上图 可知, 用 steep 算法跑 了 1000 步后未 收敛, 所以再 次进行 steep 算法; grompp -f em6A.mdp -po mdout6A.mdp -c 4IEH_2_6A_em.gro -p 4IEH_2_1.top -o 4IEH_2_6A.tpr mdrun 4IEH_2_6A.log -c 4IEH_2_6A_em.gro -v 再次经 过 steep 算 法 后,在 跑 了 135 步 后 收 敛; 4IEH_2_6A.edr 4IEH_2_6A.tpr 4IEH_2_6A.tpr -o -g -e -s B 放 开 所 有 原 子(mdp 文件中修改 define=-DFLEX_SPC),采用 l-bfgs 算法(修改 integrator=l-bfgs),进行 3000 步的能量最小化(nsteps = 3000),并修改 emtol=200,加入参数 coulombtype = PME fourierspacing
= 0.12,用 PME 来计算静电库仑力。 em6B.mdp -c 4IEH_2_6A_em.gro >grompp -f 4IEH_2_6B.tpr >mdrun 4IEH_2_6B.log -c 4IEH_2_6B_em.gro –v 4IEH_2_6B.tpr -o -s -p 4IEH_2_1.top -o -e 4IEH_2_6A.edr -g 4IEH_2_6B.tpr 运行 mdrun 命令后,在 707 步后能量收敛; C 对体系进行加热从 0 度加热到 300°,设置运行时间为 30ps;(修改 pr.mdp 的 参数 define = -DPOSRES,constraints = all-bonds,integrator = md,dt = 0.002, nsteps = 15000),其他参数: tc-grps = Protein SOL NA 0.1 tau_t = 0.1 ref_t = 300 300 energygrps= Protein SOL NA >grompp -f Pr7.mdp -c 4IEH_2_6B_em.gro 4IEH_2_7.tpr >mdrun -s 4IEH_2_7.tpr -o 4IEH_2_7.tpr -e 4IEH_2_7.edr -g 4IEH_2_7.log -c 4IEH_2_7_pr.gro -v 4IEH_2_1.top 0.1 300 -p -o D 运 行
100ps 的分子动力学模拟。(修改参数 nsteps = 50000,生成 md1.mdp) >grompp -f md1.mdp -c 4IEH_2_7_pr.gro 4IEH_2_8.tpr >mdrun -s 4IEH_2_8.tpr -o 4IEH_2_8.tpr -e 4IEH_2_8.edr -g 4IEH_2_8.log -c 4IEH_2_8_md.gro -v -p 4IEH_2_1.top -o 4) 对模拟得到的轨迹文件.trr 文件进行分析: A 用 g_rms,计算蛋白质 Ca 原子随时间的 RMSD 结果,画图; -f -n 4IEH_2_4_pro.ndx -o 4IEH_2_8.tpr 4IEH_2_8.tpr.trr >g_rms -s 4IEH_2_9_RMSD.xvg > 4IEH_2_9_RMSD.xvg -s:输入拓扑文件; -f:输入运行 md 生成的轨迹文件; -n:输入蛋白的索引文件; -o:输出 RMSD 的结果文件; 运行上述代码过程中选择 1(protein)、3(C-alpha)的体系; xmgrace:解析 xvg 文件,得出图像文件; Fig3.该图是蛋白质 C-alpha 原子随时间的 RMSD 结果(RMSD:C-alpha 与 proteind 的偏差程度)。该图的趋 势是在一段上升之后逐渐趋于稳定,证明该体系在 100ps 之内有活跃的,在 100ps 之后可能趋于 稳定。
B 用 g_rmsf,计算 Ca 原子的 RMSF 变化幅度并画图 >g_rmsf -s 4IEH_2_8.tpr -f 4IEH_2_8.tpr.trr –o 4IEH_2_10_RMSD.xvg >xmgrace 4IEH_2_10_RMSD.xvg Fig4. 该图是 C-alpha 原子的 RMSF 的图,由图像看出,C-alpha 原子在第 50 和 120 个原子处波动较大, 有可能这两个位点周围区域是该蛋白的活性位点区域。 C 用 g_energy 计算体系的总能量变化并画图 4IEH_2_8.edr -s >g_energy -f >xmgrace 4IEH_2_11_energy.xvg -f:输入能量文件 -s:输入拓扑文件 4IEH_2_8.tpr -o 4IEH_2_11_energy.xvg
Fig4. 该图是 4IEH 蛋白的总能量变化,从整体上看,该体系的能量比较稳定,。 D 用 VMD 画出最终构象的三维结构图,并与起始构象进行比较: 红色表示分子模拟之后的蛋白结构,绿色表示原始蛋白的结构; >ngmx -f 4IEH_2_8.tpr.trr -s 4IEH_2_8.tpr 来查看分子运动轨迹和状态
分享到:
收藏