课程门户-章节详情

药物生物信息学

林雪

1 课程介绍
- 1.1 课程介绍
2 药物作用基础
- 2.1 药物作用基础1-2
3 药物研发原理及技术
- 3.1 药物研发原理及技术1-4
4 药靶与药物发现
- 4.1 药靶与药物发现1-4
5 配体与药物发现
- 5.1 配体与药物发现1-4
6 药物生物信息学进展
- 6.1 药物生物信息学进展1-4
7 实践
- 7.1 基于受体药物设计
- 7.2 基于配体药物设计
8 自主学习
- 8.1 药物研发基本技术1-4
9 2024-2025版
- 9.1 药物学基础
  - 9.1.1 药物的基本概念及药物发现发展简史
  - 9.1.2 药物作用原理及药物研发流程
  - 9.1.3 第一章小结练习
- 9.2 药物研发方法学基础
  - 9.2.1 现代药物工业形成简史及药物研发基本概念
  - 9.2.2 药物研发伦理及药物研发基本方法
  - 9.2.3 第二章小结练习
- 9.3 生物信息学在药物研发中的应用
  - 9.3.1 TTD药靶数据库
  - 9.3.2 PDB药靶结构数据库
  - 9.3.3 DGIdb基因药物相互作用数据库
  - 9.3.4 第三章小结练习-1
  - 9.3.5 ChEMBL化学物质数据库理论及实践
  - 9.3.6 ChemSpider化学物质数据库理论及实践
  - 9.3.7 DrugBank药物综合数据库
  - 9.3.8 TCMBank中药综合数据库
  - 9.3.9 基于受体药物设计
  - 9.3.10 基于配体药物设计
  - 9.3.11 分子对接和构效关系数据库
  - 9.3.12 CMap疾病-药物-基因连通图数据库
  - 9.3.13 第三章小结练习-2
- 9.4 生物信息学药物研发前景展望
  - 9.4.1 生物信息学与精准医疗及发展前景
- 9.5 AI+药物设计
  - 9.5.1 人工智能药物设计理论与实践
- 9.6 药物研发生物信息学工具使用实践
  - 9.6.1 药物作用预测
  - 9.6.2 同源建模
  - 9.6.3 分子对接
  - 9.6.4 精准医疗
10 2022-2023版
- 10.1 第一章药物学基础知识
  - 10.1.1 第一课时课程介绍
  - 10.1.2 第二课时药物的基本概念
  - 10.1.3 第三课时药物的起源和发展历史
  - 10.1.4 第四课时中国药物发展历程
  - 10.1.5 第五课时药物作用的基本原理
  - 10.1.6 第六课时药物研发过程
- 10.2 第二章药物生物信息学
  - 10.2.1 第七课时药物生物信息学的概念及其在药学领域的应用
  - 10.2.2 第八课时疾病的分子机制及受体与疾病
  - 10.2.3 第九课时药靶的概念、分类及药物发现中的经典药靶
  - 10.2.4 第十课时药靶数据库-TTD详解(含随堂测试）
  - 10.2.5 第十一课时随堂测试1
  - 10.2.6 第十二课时药靶数据库-TTD使用实战
  - 10.2.7 第十三课时药靶相关综合数据库-DrugBank详解
  - 10.2.8 第十四课时药靶相关综合数据库-DrugBank使用
  - 10.2.9 第十五课时药靶相关综合数据库-DrugBank使用实战
  - 10.2.10 第十六课时靶点与生物活性数据库-ChEMBL详解
  - 10.2.11 第十七课时靶点与生物活性数据库-ChEMBL使用
  - 10.2.12 第十八课时靶点与生物活性数据库-ChEMBL使用实战
  - 10.2.13 第十九课时其他重要药物生物信息数据库-CMap原理
  - 10.2.14 第二十课时其他重要药物生物信息数据库-CMap使用及使用实战
  - 10.2.15 第二十一课时其他重要药物生物信息数据库-CMap使用实战
  - 10.2.16 第二十二课时其他重要药物生物信息学数据库-PDB
  - 10.2.17 第二十三课时其他重要药物生物信息学数据库-ChemSpider
  - 10.2.18 第二十四课时其他重要药物生物信息学数据库-10KMP
- 10.3 第三章计算机辅助药物设计
  - 10.3.1 第一课时计算机辅助药物设计概述
  - 10.3.2 第二课时计算机辅助药物设计理论基础
  - 10.3.3 第三课时计算机辅助药物设计常用技术
  - 10.3.4 第四课时计算机辅助药物设计方法学-直接药物设计
  - 10.3.5 第五课时计算机辅助药物设计-间接药物设计
  - 10.3.6 第六课时计算机辅助药物设计-介于两者间的新方法和新策略
  - 10.3.7 第七~九课时基于配体药物设计
  - 10.3.8 第十～十二课时基于受体药物设计
  - 10.3.9 第十三课时计算机辅助药物设计成功案例-格列卫
  - 10.3.10 第十四课时计算机辅助药物设计-DPP4抑制剂
  - 10.3.11 第十五课时计算机辅助药物设计-蛋白酶抑制剂研究进展
- 10.4 第四章药物基因组学
  - 10.4.1 第四十课时药物基因组学概述
  - 10.4.2 第四十一课时药物基因组学研究方法
  - 10.4.3 第四十二课时药物基因组学成功案例
  - 10.4.4 第四十三课时药物基因组学数据库PharmGKB简介
  - 10.4.5 第四十四课时药物基因组学数据库PharmGKB使用
  - 10.4.6 第四十五课时药物基因组学数据库PharmGKB使用实战
  - 10.4.7 第四十六课时抗凝药物个体化治疗策略
  - 10.4.8 第四十七课时口服降糖药物个体化治疗策略
  - 10.4.9 第四十八课时抗肿瘤药物个体化治疗策略
- 10.5 第五章实践操作
  - 10.5.1 Cmap的使用
  - 10.5.2 Modeller的使用
  - 10.5.3 AutoDock的使用
  - 10.5.4 PharmGKB的使用
- 10.6 总复习
  - 10.6.1 课程考核说明
- 10.7 拓展：生物医学大数据分析前沿—深度学习在药物研发中的应用
  - 10.7.1 深度学习在药物研发中的应用
  - 10.7.2 分子动力学模拟在药物研发中的应用
  - 10.7.3 2023版
11 2021版
- 11.1 第四～六课时疾病治疗的分子途径
- 11.2 第八～第十二课时生物信息学——基因组到药物的桥梁
  - 11.2.1 第八课时生物信息学—基因组到药物的桥梁
  - 11.2.2 第九课时测序技术和序列分析概述
  - 11.2.3 第十课时序列比对
- 11.3 第十一课时药靶识别生物信息学方法
- 11.4 第十二、十三课时药靶识别生物信息学工具—Cmap&DrugBank
- 11.5 第十四课时药靶确证、本章小结及答疑
- 11.6 第一～三课时药物基因组学概述
- 11.7 第四～六课时个体化治疗中的生物信息学—PharmGKB
- 11.8 第七～九课时靶向抗肿瘤药物个体化治疗决策
- 11.9 第十～十二课时抗凝药物个体化治疗决策
- 11.10 第一～三课时前言
- 11.11 第十～十二课时计算机辅助药物设计成功案例
- 11.12 第十三～十五课时本章小结和答疑

基于配体药物设计

学习指导

复习QSAR原理
掌握使用RDKit实现QSAR的方法

综合应用题：基于 RDKit 与随机森林的化合物活性预测模型构建

【背景描述】

作为药物研发部门的数据分析师，你正在负责一项针对大鼠膀胱肿瘤受体（BZR）的定量构效关系（QSAR）研究项目。你的目标是利用机器学习模型，根据化合物的分子结构预测其生物活性（以 pIC50 值表示），从而指导后续的分子优化。

【任务要求】

请结合 Python 编程语言和 RDKit 化学信息学库，完成以下四个步骤的任务：

（1）数据预处理与特征提取：

你手头有一份包含化合物 SMILES 字符串和对应实验测得 pIC50 值的原始数据集。请编写代码读取数据，并利用 RDKit 计算每个分子的理化性质描述符（至少包含：分子量 MolWt、脂水分配系数 MolLogP、极性表面积 TPSA、氢键供体数 NumHDonors、氢键受体数 NumHAcceptors）。在此过程中，需要妥善处理无法被 RDKit 解析的无效 SMILES 分子。

（2）模型构建与评估：

将提取到的分子描述符作为特征（X），pIC50 值作为标签（y）。请使用 Scikit-learn 库构建一个随机森林回归模型（Random Forest Regressor）。将数据集按 8:2 的比例划分为训练集和测试集，训练模型后，输出测试集的决定系数（R^2）和均方根误差（RMSE）以评估模型性能。

（3）新分子活性预测：

模型训练完成后，请写出利用该模型预测一个全新化合物（例如阿司匹林，SMILES: 'CC(=O)Oc1ccccc1'）pIC50 值的核心代码逻辑。

脚本下载

在线资源

RDKit官网：http://www.rdkit.org/

RDKit帮助文档：http://www.rdkit.org/docs/api-docs.html

Python Vina官网：https://pypi.org/project/vina/

图片预览