目录

  • 1 课程介绍
    • 1.1 课程介绍
  • 2 药物作用基础
    • 2.1 药物作用基础1-2
  • 3 药物研发原理及技术
    • 3.1 药物研发原理及技术1-4
  • 4 药靶与药物发现
    • 4.1 药靶与药物发现1-4
  • 5 配体与药物发现
    • 5.1 配体与药物发现1-4
  • 6 药物生物信息学进展
    • 6.1 药物生物信息学进展1-4
  • 7 实践
    • 7.1 基于受体药物设计
    • 7.2 基于配体药物设计
  • 8 自主学习
    • 8.1 药物研发基本技术1-4
  • 9 2024-2025版
    • 9.1 药物学基础
      • 9.1.1 药物的基本概念及药物发现发展简史
      • 9.1.2 药物作用原理及药物研发流程
      • 9.1.3 第一章小结练习
    • 9.2 药物研发方法学基础
      • 9.2.1 现代药物工业形成简史及药物研发基本概念
      • 9.2.2 药物研发伦理及药物研发基本方法
      • 9.2.3 第二章小结练习
    • 9.3 生物信息学在药物研发中的应用
      • 9.3.1 TTD药靶数据库
      • 9.3.2 PDB药靶结构数据库
      • 9.3.3 DGIdb基因药物相互作用数据库
      • 9.3.4 第三章小结练习-1
      • 9.3.5 ChEMBL化学物质数据库理论及实践
      • 9.3.6 ChemSpider化学物质数据库理论及实践
      • 9.3.7 DrugBank药物综合数据库
      • 9.3.8 TCMBank中药综合数据库
      • 9.3.9 基于受体药物设计
      • 9.3.10 基于配体药物设计
      • 9.3.11 分子对接和构效关系数据库
      • 9.3.12 CMap疾病-药物-基因连通图数据库
      • 9.3.13 第三章小结练习-2
    • 9.4 生物信息学药物研发前景展望
      • 9.4.1 生物信息学与精准医疗及发展前景
    • 9.5 AI+药物设计
      • 9.5.1 人工智能药物设计理论与实践
    • 9.6 药物研发生物信息学工具使用实践
      • 9.6.1 药物作用预测
      • 9.6.2 同源建模
      • 9.6.3 分子对接
      • 9.6.4 精准医疗
  • 10 2022-2023版
    • 10.1 第一章 药物学基础知识
      • 10.1.1 第一课时 课程介绍
      • 10.1.2 第二课时 药物的基本概念
      • 10.1.3 第三课时 药物的起源和发展历史
      • 10.1.4 第四课时 中国药物发展历程
      • 10.1.5 第五课时 药物作用的基本原理
      • 10.1.6 第六课时 药物研发过程
    • 10.2 第二章 药物生物信息学
      • 10.2.1 第七课时 药物生物信息学的概念及其在药学领域的应用
      • 10.2.2 第八课时 疾病的分子机制及受体与疾病
      • 10.2.3 第九课时 药靶的概念、分类及药物发现中的经典药靶
      • 10.2.4 第十课时 药靶数据库-TTD详解(含随堂测试)
      • 10.2.5 第十一课时 随堂测试1
      • 10.2.6 第十二课时 药靶数据库-TTD使用实战
      • 10.2.7 第十三课时 药靶相关综合数据库-DrugBank详解
      • 10.2.8 第十四课时 药靶相关综合数据库-DrugBank使用
      • 10.2.9 第十五课时 药靶相关综合数据库-DrugBank使用实战
      • 10.2.10 第十六课时 靶点与生物活性数据库-ChEMBL详解
      • 10.2.11 第十七课时 靶点与生物活性数据库-ChEMBL使用
      • 10.2.12 第十八课时 靶点与生物活性数据库-ChEMBL使用实战
      • 10.2.13 第十九课时 其他重要药物生物信息数据库-CMap原理
      • 10.2.14 第二十课时 其他重要药物生物信息数据库-CMap使用及使用实战
      • 10.2.15 第二十一课时 其他重要药物生物信息数据库-CMap使用实战
      • 10.2.16 第二十二课时 其他重要药物生物信息学数据库-PDB
      • 10.2.17 第二十三课时 其他重要药物生物信息学数据库-ChemSpider
      • 10.2.18 第二十四课时 其他重要药物生物信息学数据库-10KMP
    • 10.3 第三章 计算机辅助药物设计
      • 10.3.1 第一课时 计算机辅助药物设计概述
      • 10.3.2 第二课时 计算机辅助药物设计理论基础
      • 10.3.3 第三课时 计算机辅助药物设计常用技术
      • 10.3.4 第四课时 计算机辅助药物设计方法学-直接药物设计
      • 10.3.5 第五课时 计算机辅助药物设计-间接药物设计
      • 10.3.6 第六课时 计算机辅助药物设计-介于两者间的新方法和新策略
      • 10.3.7 第七~九课时 基于配体药物设计
      • 10.3.8 第十~十二课时 基于受体药物设计
      • 10.3.9 第十三课时 计算机辅助药物设计成功案例-格列卫
      • 10.3.10 第十四课时 计算机辅助药物设计-DPP4抑制剂
      • 10.3.11 第十五课时 计算机辅助药物设计-蛋白酶抑制剂研究进展
    • 10.4 第四章 药物基因组学
      • 10.4.1 第四十课时 药物基因组学概述
      • 10.4.2 第四十一课时 药物基因组学研究方法
      • 10.4.3 第四十二课时 药物基因组学成功案例
      • 10.4.4 第四十三课时 药物基因组学数据库PharmGKB简介
      • 10.4.5 第四十四课时 药物基因组学数据库PharmGKB使用
      • 10.4.6 第四十五课时 药物基因组学数据库PharmGKB使用实战
      • 10.4.7 第四十六课时  抗凝药物个体化治疗策略
      • 10.4.8 第四十七课时 口服降糖药物个体化治疗策略
      • 10.4.9 第四十八课时 抗肿瘤药物个体化治疗策略
    • 10.5 第五章 实践操作
      • 10.5.1 Cmap的使用
      • 10.5.2 Modeller的使用
      • 10.5.3 AutoDock的使用
      • 10.5.4 PharmGKB的使用
    • 10.6 总复习
      • 10.6.1 课程考核说明
    • 10.7 拓展:生物医学大数据分析前沿—深度学习在药物研发中的应用
      • 10.7.1 深度学习在药物研发中的应用
      • 10.7.2 分子动力学模拟在药物研发中的应用
      • 10.7.3 2023版
  • 11 2021版
    • 11.1 第四~六课时 疾病治疗的分子途径
    • 11.2 第八~第十二课时 生物信息学——基因组到药物的桥梁
      • 11.2.1 第八课时 生物信息学—基因组到药物的桥梁
      • 11.2.2 第九课时 测序技术和序列分析概述
      • 11.2.3 第十课时 序列比对
    • 11.3 第十一课时 药靶识别生物信息学方法
    • 11.4 第十二、十三课时 药靶识别生物信息学工具—Cmap&DrugBank
    • 11.5 第十四课时 药靶确证、本章小结及答疑
    • 11.6 第一~三课时 药物基因组学概述
    • 11.7 第四~六课时 个体化治疗中的生物信息学—PharmGKB
    • 11.8 第七~九课时 靶向抗肿瘤药物个体化治疗决策
    • 11.9 第十~十二课时 抗凝药物个体化治疗决策
    • 11.10 第一~三课时 前言
    • 11.11 第十~十二课时 计算机辅助药物设计成功案例
    • 11.12 第十三~十五课时 本章小结和答疑
基于配体药物设计

学习指导

  1. 复习QSAR原理

  2. 掌握使用RDKit实现QSAR的方法


综合应用题:基于 RDKit 与随机森林的化合物活性预测模型构建

【背景描述】

作为药物研发部门的数据分析师,你正在负责一项针对大鼠膀胱肿瘤受体(BZR)的定量构效关系(QSAR)研究项目。你的目标是利用机器学习模型,根据化合物的分子结构预测其生物活性(以 pIC50 值表示),从而指导后续的分子优化。

【任务要求】

请结合 Python 编程语言和 RDKit 化学信息学库,完成以下四个步骤的任务:

(1)数据预处理与特征提取:

   你手头有一份包含化合物 SMILES 字符串和对应实验测得 pIC50 值的原始数据集。请编写代码读取数据,并利用 RDKit 计算每个分子的理化性质描述符(至少包含:分子量 MolWt、脂水分配系数 MolLogP、极性表面积 TPSA、氢键供体数 NumHDonors、氢键受体数 NumHAcceptors)。在此过程中,需要妥善处理无法被 RDKit 解析的无效 SMILES 分子。

(2)模型构建与评估:

   将提取到的分子描述符作为特征(X),pIC50 值作为标签(y)。请使用 Scikit-learn 库构建一个随机森林回归模型(Random Forest Regressor)。将数据集按 8:2 的比例划分为训练集和测试集,训练模型后,输出测试集的决定系数(R^2)和均方根误差(RMSE)以评估模型性能。

(3)新分子活性预测:

   模型训练完成后,请写出利用该模型预测一个全新化合物(例如阿司匹林,SMILES: 'CC(=O)Oc1ccccc1')pIC50 值的核心代码逻辑。


脚本下载


在线资源

RDKit官网:http://www.rdkit.org/

RDKit帮助文档:http://www.rdkit.org/docs/api-docs.html

Python Vina官网:https://pypi.org/project/vina/