专栏名称: 生信杂谈
生物信息学;生物信息;计算机辅助药物设计;测序分析;Python;R;机器学习;论文写作;网站制作;LOL;dota2。
目录
相关文章推荐
广电时评  ·  公示 | 2025年5月全国重点网络微短剧规划备案 ·  9 小时前  
新京报评论  ·  神农架景区招“野人”,“野路子”不等于低俗 ... ·  9 小时前  
稀土掘金技术社区  ·  用dayjs解析时间戳,我被提了bug ·  昨天  
外交部发言人办公室  ·  何立峰将访问英国并举行中美经贸磋商机制首次会议 ·  2 天前  
京东零售技术  ·  前沿论文分享 | ... ·  3 天前  
51好读  ›  专栏  ›  生信杂谈

SMINA教程以CDPK1为例

生信杂谈  · 公众号  ·  · 2017-11-12 11:30

正文

请到「今天看啥」查看全文


aid677062.txt | sed 's/\.Cl//' > aid677062.smi



awk主要是进行了前后的颠倒,并且在标题后增加active标签,sed主要是将Cl进行替换,替换成空,中间用管道链接,输出到smi文件格式。

(d)将每个靶点的内容合并为单个文件


1

cat aid*.smi > activaes.msi


T.gondii C.pavum 分别包含156个和89个活性化合物。你可以在这里下载合并好的文件。

1.2.2 创建诱饵数据集

该在线网站说只需要10min,实际上需要1-2天左右时间
由于这些靶点的无活性配体数量较少,我们使用诱饵数据库Database of Useful Decoys:Enhanced(DUDE)方法来从ZINC数据库中进行采样。这些诱饵被选择的方法为化学性质不相同(即和有活性的配体相比较不相似,认为是不结合的)。但分子质量,logP,旋转键和氢键受体供体这些简单的分子参数是相同的。

(a)使用DUDE网站创建诱饵数据集,将会生成dude-decoys.tar.gz文件,里面包含50个参数匹配的诱饵。

(b)将诱饵结合进入单个文件


1

cat decoys/* | grep -v ligand > decoys.msi


点此下载decoys文件,( T.gondii 诱饵和活性化合物。 C.pavum 诱饵和活性化合物)。

1.2.3 生成三维结构

我们将使用开源软件RDKit利用2D SMILES生成3D构像

(a)将RDKit写入你的PYTHONPATH,并且执行rdconf.py脚本


1

2

wget http://bits.csb.pitt.edu/tdtCDPK1/rdconf.py

chmod + x rdconf.py


(b)每个active/decoy生成单一构像


1

2

rdconf.py --maxconfs 1 decoys.smi decoys.sdf

rdconf.py --maxconfs 1 actives.smi actives.sdf


(c)将文件合并


1

cat actives.sdf decoys.sdf > combined.sdf


由于有两个文件,我们将 T.gondii C.pavum 分别命令为gondii.sdf和parvum.sdf

1.3 对接

我们使用SMINA通过对接化合物进入受体结构进行虚拟筛选,采用AutoDock Vina得分功能。由于我们对一个固定的受体对接,所以我们选择一个好的受体结构是非常重要的。我们将会使用CDPK1的测试集来模拟评价我们的对接工具和选择受体结构。

1.鉴定PDB中所有 C.parvum T.gondii 文件,搜索’calcium-dependent protein kinase 1’,并且选择恰当的生物(organism.)

C. parvum : 2QG5 2WEI 3DFA 3F3Z 3HKO 3IGO 3L19 3LIJ 3MWU 3NCG

T. gondii : 3I79 3I7B 3I7C 3KU2 3N51 3NYV 3SX9 3SXF 3T3U 3T3V 3UPX 3UPZ 3V51 3V5P 3V5T 4M84

由于教程较老,故和自己搜索有差异

2.下载这些pdb文件,你可以用如下的简单方法,或者直接下载我下载好的。

将以下代码保存为脚本,例如 down.sh


1

2

3

4

5

6

7

8

9

#!/bin/bash  

str="2QG5 2WEI 3DFA 3F3Z 3HKO 3IGO 3L19 3LIJ 3MWU 3NCG"  

arr=(${str// / })

for i in ${arr[@]}  

do  

wget https://files.rcsb.org/download/$i.pdb

done



执行如下命令:


1

2

chmod +x down.sh

./down.sh


3.比对和提取结构。在pymol中打开靶标pdb文件。比对他们。除去水和原子。提取每个配体到自己的对象。


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

#pymol中执行

from glob import glob

for fil in glob("*.pdb"): cmd.load(fil)

alignto

remove solvent

remove metal

remove GOL

#选择配体BK1周围5埃外的小分子,并且删除,因为并未在结合位点内,不是配体

select unligand,byres resname BK1 gap 5 and hetatm

remove unligand

#选择配体

select ligand,hetatm

extract parvum,ligand

#保存配体

save parvumlig.pdb,parvum

remove ligand


4.保存受体和配体文件,注意的是 3LI9 没有酶结构域, 3DFA 2QG5 为未结合态结构,综合考虑我们将其删除。


1

remove 3LI9 and 3DFA and 2QG5


保存(注意一下需要保存为python文件后 run 进行操作)


1







请到「今天看啥」查看全文