说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111359694.4 (22)申请日 2021.11.17 (71)申请人 中山大学 地址 510275 广东省广州市海珠区新港西 路135号 (72)发明人 聂怡初 邓文斌 刘焕彬 麦扬  刘赣 徐健 赵景新 谢芫 萧倩  (74)专利代理 机构 广州新诺专利商标事务所有 限公司 4 4100 专利代理师 李海恬 (51)Int.Cl. A61K 31/496(2006.01) A61K 31/4178(2006.01) A61P 11/00(2006.01) G01N 33/50(2006.01)G06K 9/62(2022.01) G06N 20/00(2019.01) G16B 20/30(2019.01) C12N 15/85(2006.01) C12N 15/12(2006.01) C12N 15/53(2006.01) C12Q 1/02(2006.01) (54)发明名称 抗特发性肺纤维化化合物及其计算机预测 筛选方法 (57)摘要 本发明涉及一种抗特发性肺纤维化化合物 及其计算机预测筛选方法, 属于药物研发技术领 域。 通过本发明的预测筛选方法, 得到具有式I或 II结构特征的抗特发性肺纤维化化合物可有效 延缓肺组织中炎症与纤维化的发展进程, 达到治 疗特发性肺纤维化的效果。 权利要求书3页 说明书20页 序列表14页 附图18页 CN 114432311 A 2022.05.06 CN 114432311 A 1.具有式I或II结构特征的化合物或其药用盐、 水合物、 立体异构体在制备用于治疗 和/或预防特发性肺纤维化的药物中的用途: 2.一种用于抗特发性肺纤维化的药物 组合物, 其特征在于, 包括权利要求1所述的化合 物或其药 学上可接受的盐、 水合物、 立体异构体, 以及药 学上可接受的辅料。 3.一种抗特发性肺纤维化 化合物的计算机预测筛 选方法, 其特 征在于, 包括以下步骤: 蛋白模型准备: 获取与特发性肺纤维化相关的靶点蛋白的三维结构模型及其序列; 配体准备: 选取Enamine数据库中分子量为370 ‑960的候选化合物作为配体, 构成筛选 数据库; 分子对接: 以Lamarckian  genetic algorithm软件程序进行对接, 设定蛋白为刚性, 配 体为柔性, 并以ADT工具在配体和蛋白上增加了Koollman  charges; 同时根据靶点蛋白已知 配体设置grid, 使grid覆盖整个配体结合区域, 并以 的grid spacing和介电常数的距 离相关函数计算结合 自由能, 获得ADT对化合物结合能的分析结果, 按照结合能大小, 由小 到大进行排序, 备用; 选取其中前20%的化合物与机器学习活性预测模型预测结果比对, 选取虚拟对接与机 器学习模型评分综合 性得分最高的化 合物进行后续的生物学验证; 建立机器学习模型: 获取靶点蛋白已知配体的结构文件以及pIC50活性数据, 将已知配 体 的 活 性 数 据 转 换 为 ‑l o g ( p I C5 0) ,利 用 p y t h o n 中 R D k i t 模 块 的 MolecularDescriptorCalculator程序对已知配体进行分子特征的提取; 利用sklearn模块 的StandardScaler对所述分子特征进行标准化处理; 再利用sklearn模块进行基于随机森 林和RFE的组合特征选 择; 最后使用pyt hon中Scikit ‑Learn中的S upport Vector Machine, AdaBoost, Random  Forrest, Gradient  Boosting, K ‑Nearest Neighbor以及Bayesian   Ridge算法对已知配 体数据进行拟合计算, 得 出用于活性筛 选的机器学习模型; 虚拟筛选: 按照上述对已知配体的处理方法, 对筛选数据库中候选化合物进行分子特 征的提取, 代入上述机器学习模型中, 进行拟合计算, 得到各候选化 合物的机器学习得分; 模型优化: 综合各候选化合物的机器学习得分和结合能大小, 整合得到虚拟活性值, 选 取虚拟活性值佳的候选化合物, 以PGLuc ‑promCol1A2 ‑A549细胞进行活性筛选, 将获得的化 合物细胞活性数据反馈到所述机器学习模型中, 进行机器学习模型 的优化, 得优化机器学 习模型;权 利 要 求 书 1/3 页 2 CN 114432311 A 2化合物筛选: 将筛选数据库中候选化合物进行分子特征的提取, 代入上述优化机器学 习模型进行分析, 得到 机器筛选结果, 即得 预测抗特发性肺纤维化 化合物。 4.根据权利要求3所述的计算机预测筛选方法, 其特征在于, 所述靶点蛋白包括: VEGFR1, VEGFR2, FGFR 1, FGFR2, FGFR3, P DGFRα, TGFβ 1 R, VEGFR3和P DGFRβ 。 5.根据权利 要求4所述的计算机预测筛选方法, 其特征在于, 所述VEGFR3的三维结构模 型通过以下方法构建: 获取VE GFR3蛋白的氨基酸序列, 去除配体结合域以外的序列, 保留重 点结构相关序列, 以VEGFR2三维结构为模板, 通过SW ISS‑MODEL完成同源 模拟; 所述PDGFRβ 的三维结构模型通过以下方法构建: 获取PDGFRβ 蛋白的氨基酸序列, 去除 配体结合域以外的序列, 保留重点结构相关序列, 以FLT3三维结构为模板, 通过SWISS ‑ MODEL完成同源 模拟。 6.根据权利要求3所述的计算机预测筛选方法, 其特征在于所述标准化处理为: 将选用 的配体database  进行加氢、 设置为PH=7.4的状态; 靶点蛋白文件去除原有的溶剂分子和 配体分子、 添加氢原子; 设定好对接的网格范围及大小。 7.根据权利要求3所述的计算机预测筛选方法, 其特征在于, 所述虚拟活性值 Consensus score通过以下公式得到: 其中: Targets表示指各靶点蛋白; STargets表示各候选化合物针对靶点蛋白, 分别 根据模型计算得到的机器学习得分和根 据该化合物对每 个靶点的结合能计算得到的分数; 所述STargets按照以下 标准评分: 所述排名通过以下方法得到: 以所述筛选数据库中所有化合物针对每个靶点的结合 能 由低到高进行排位, 机器学习的得分由高到低排列; 某候选化合物在所述的排位中的顺序 位置, 即为该候选化 合物的排名。 8.根据权利要求3所述的计算机预测筛选方法, 其特征在于, 所述pGLuc ‑promCol1A2报 告基因A549细胞通过以下 方法构建: 构建质粒: PCR扩增COL1A2基因序列, 将扩增产物与Luc载体分别用NheI/HindIII双酶 切, 回收酶切产物, 加入T4  DNA Ligase酶连接, 将连接产物转化至DH5α 感受态细胞, LB培养 基培养, 取阳性克隆, 得COL1A 2‑荧光色素酶质粒, 备用; 转染: 使用Lipofectamine  2000转染试剂, Opti ‑MEM培养基, 将上述pGLuc ‑promCol1A2 质粒转染至A549细胞, 即得。 9.根据权利要求8所述的计算机预测筛选方法, 其特征在于, 所述转染步骤之后, 还包权 利 要 求 书 2/3 页 3 CN 114432311 A 3

.PDF文档 专利 抗特发性肺纤维化化合物及其计算机预测筛选方法

文档预览
中文文档 56 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共56页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 抗特发性肺纤维化化合物及其计算机预测筛选方法 第 1 页 专利 抗特发性肺纤维化化合物及其计算机预测筛选方法 第 2 页 专利 抗特发性肺纤维化化合物及其计算机预测筛选方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:02:41上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。