个人介绍
计算生物学

主讲教师:

教师团队:共1

  • 包家立
学校: 浙江大学
开课院系: 医学院-公共卫生系
专业大类: 生物学
开课专业: 生物化学与分子生物学

本系列介绍了计算生物学。老师主要讲解了信息论基础、贝叶斯概率理论及应用、神经网络理论及应用、隐含马尔可夫模型理论及应用等相关内容。计算生物学是开发和应用数据分析及理论的方法、数学建模和计算机仿真技术,用于生物学研究,是用高级计算方法来管理、分析生物学数据并从中挖掘发现知识的一门学科;正在成为现代生物学研究的核心方法之一。

教师团队

包家立

职称:教授

单位:浙江大学

部门:医学院-公共卫生系

职位:教授

计算生物学

计算生物学(Computational Biology)是生物学的一个分支。根据美国国家卫生研究所(NIH)的定义,它是指开发和应用数据分析及理论的方法、数学建模和计算机仿真技术,用于生物学、行为学和社会群体系统的研究的一门学科。

特点

计算生物学是指开发和应用数据分析及理论的方法、数学建模、计算机仿真技术等。当前,生物学数据量和复杂性不断增长,每14个月基因研究产生的数据就会翻一番,单单依靠观察和实验已难以应付。因此,必须依靠大规模计算模拟技术,从海量信息中提取最有用的数据。 

各种计算方法已开始广泛应用于药物研究,以及研发创新的、具有自主知识产权的疾病靶标和信息学分析系统等。同时,运用计算生物学,科学家有望直接破译在核酸序列中的遗传语言规律,模拟生命体内的信息流过程,从而认识代谢、发育、进化等一系列规律,最终为人类造福。

发展

20世纪80年代计算机科学与技术发展,以及生物化学、分子生物学的系统论建立,1989年在美国召开了生物化学系统论与生物数学的国际会议,讨论了生物系统理论的计算机模型研究方法,开创了计算生物学的发展,属于早期计算系统生物学家的研讨会;因此,后来改为国际分子系统生物学会议(ICMSB,参见第10届会议),第11届国际分子系统生物学会议在中科院-德国马普上海计算生物学研究所成功举办。化学生物学、计算生物学与合成生物学,构成系统生物学与系统生物工程的实验数据、数学模型与工程设计的方法体系,即系统生物技术,带来了21世纪系统生物科学的全球迅速发展时期。 

当前,计算生物学和生物信息学在研究的方法和对象上已无显著区别,在基因与蛋白质的计算机辅助设计、比较基因组分析、生物系统模型、细胞信号传导与基因调控网络研究、专家数据库、生物软件包等领域发挥重要作用。

研究内容

计算生物学的研究内容主要包括以下几个方面:

1.生物序列的片段拼接。

2.序列对接。

3.基因识别。

人类长达30个亿DNA序列中只有3%-5%是基因。阐明人体中全部基因的位置,结构,功能,表达等,计算能力扮演了一个重要的角色,一个重要应用就是模拟基因表达数据集。

4.种族树的建构。

5.蛋白质结构预测。

蛋白质的很多特性,功能是和它实际的三维结构及其相关的,任意给一段蛋白质序列,生物学家就可以用传统的生物学方法求出其结构,但这不但成本高而且费时,计算生物学的蛋白质结构预测工具通过序列分析可以直接得出其结构,如,CYTO:人类T细胞中的因果蛋白质信号网络。

6.生物数据库

生物学数据量不断增长,每14个月基因研究产生的数据就会翻一番,海量的数据单单依靠观察和实验已无能为力

传统的数据库技术这时显示了强大的威力,例如CATH蛋白结构分类数据库,果蝇交互数据库。

随着科学技术的发展,计算生物学的应用也越来越广泛,如对生物等效性的研究,皮肤的电阻,骨关节炎的治疗,哺乳动物的睡眠等等。

相关期刊

 《计算生物学》Hans Journal of Computational Biology 是一本关注计算生物学领域最新进展的国际中文期刊,主要刊登运用应用数据分析、理论方法、数学建模、计算机仿真等技术来对生物数据进行提取的相关领域学术论文。本刊支持思想创新、学术创新,倡导科学,繁荣学术,集学术性、思想性为一体,旨在为了给世界范围内的科学家、学者、科研人员提供一个传播、分享和讨论计算生物学领域内不同方向问题与发展的交流平台。

研究领域:

· 基因组分析

· 序列分析

· 种系遗传学

· 结构生物信息学

· 基因表达

· 系统生物

· 数据挖掘和文本挖掘

· 数据库与知识本体

· 分子生物学

贝叶斯概率

贝叶斯概率是由贝叶斯理论所提供的一种对概率的解释,它采用将概率定义为某人对一个命题信任的程度的概念。贝叶斯理论同时也建议贝叶斯定理可以用作根据新的信息导出或者更新现有的置信度的规则。

历史

贝叶斯理论和贝叶斯概率以托马斯·贝叶斯(1702-1761)命名,他证明了现在称为贝叶斯定理的一个特例。术语贝叶斯却是在1950年左右开始使用,很难说贝叶斯本人是否会支持这个以他命名的概率非常广义的解释。拉普拉斯证明了贝叶斯定理的一个更普遍的版本,并将之用于解决天体力学、医学统计中的问题,在有些情况下,甚至用于法理学。但是拉普拉斯并不认为该定理对于概率论很重要。他还是坚持使用了概率的经典解释。 

Frank P. Ramsey在《数学基础》(1931年)中首次建议将主观置信度作为概率的一种解释。Ramsey视这种解释为概率的频率解释的一个补充,而频率解释在当时更为广泛接受。统计学家Bruno de Finetti于1937年采纳了Ramsey的观点,将之作为概率的频率解释的一种可能的代替。L. J. Savage在《统计学基础》(1954年)中拓展了这个思想。 

有人试图将“置信度”的直观概念进行形式化的定义和应用。最普通的应用是基于打赌:置信度反映在行为主体愿意在命题上下注的意愿上。 当信任有程度的时候,概率计算的定理测量信任的理性程度,就像一阶逻辑的定理测量信任的理性程度一样。很多人将置信度视为经典的真值(真或假)的一种扩展。 

Harold Jeffreys, Richard T. Cox, Edwin Jaynes和I. J. Good研探了贝叶斯理论。其他著名贝叶斯理论的支持者包括[[John Maynard Keynes和B.O. Koopman。

变种

术语主观概率, 个人概率, 认知概率和逻辑概率描述了通常成为贝叶斯学派的思想中的一些。这些概念互相重叠,但有不同的侧重。这里提到的一些人物不会自称是贝叶斯学派的。 

贝叶斯概率应该测量某一个体对于一个不确定命题的置信程度,因此在这个意义下是主观的。有些自称贝叶斯学派的人并不接受这种主观性。客观主义学派的主要代表是Edwin Thompson Jaynes和Harold Jeffreys。也许现在还在世的主要客观贝叶斯学派人物是杜克大学的James Berger。Jose Bernardo和其他一些人接受一定程度的主观性,但相信在很多实际情况中有使用"先验参照(reference priors)"的需要。 

逻辑(或者说,客观认知)概率的推崇者,例如Harold Jeffreys, Rudolf Carnap, Richard Threlkeld Cox和Edwin Jaynes, 希望将能够在两个有相同关于某个不确定命题的真实性相关的信息的人计算出同样的概率的技术规律化。这种概率不和个人相关,而只和认知情况相关,因此位于主观和客观之间。但是,他们推荐的方法有争议。批评者对这个声称发起挑战,在关于相关事实的信息缺乏的时候,更偏好某一个置信度是有现实依据的。另一个问题是迄今为止的技术对于处理实际问题还是不够的。 

频率概率

贝叶斯概率和频率概率相对,它从确定的分布中观测到的频率或者在样本空间中的比例来导出概率。 

采用频率概率的统计和概率的理论由R.A. Fisher, Egon Pearson和Jerzy Neyman在20世纪上半叶发展起来。A. N. Kolmogorov也采用频率概率来通过勒贝格积分为测度论中的概率奠定数学基础(《概率论基础》(1933年))。Savage, Koopman, Abraham Wald和其他一些学者自1950年以来发展了贝叶斯概率。 

贝叶斯学派和频率学派在概率解释上的分歧在统计学实践上有重要的结果。例如,在用同样的数据比较两个假设的时候,假设测试理论基于概率的频率解释,它允许基于错误推出数据更支持另外那个模型/假设的概率来否定或接受一个模型/假设(零假设)。出现这种错误的概率称为一类误差,它要求考虑从同样的数据源导出的假想的数据集合要比实际观测到的数据更为极端。这个方法允许论断'或者两个假设不同或者观测到的数据是误导性的集合'。相对应的是,贝叶斯方法基于实际观测到的数据,因此能够对于任何数量的假设直接赋予后验概率。对于代表每个假设的模型的参数必须赋予概率的要求是这种直接方法的代价。

应用

自1950年代以来,贝叶斯理论和贝叶斯概率通过考克斯定理, Jaynes的最大熵原理以及荷兰书论证得到了广泛的应用。在很多应用中,贝叶斯方法更为普适,也似乎较频率概率能得出更好的结果。贝叶斯因子也和奥卡姆剃刀一起使用。数学应用请参看贝叶斯推论和贝叶斯定理。 

有些人将贝叶斯推论视为科学方法的一种应用,因为通过贝叶斯推论来更新概率要求从对于不同假设的初始信任度出发,采集新的信息(例如通过做试验),然后根据新的信息调整原有的信念。调整原有的信念可以意味着(更加接近)接受或者推翻初始的假设。 

贝叶斯技术最近被应用于垃圾邮件的过滤上。贝叶斯垃圾邮件过滤器采用电子邮件的一个参考集合来定义什么最初被认为是垃圾邮件。定义了参考之后,过滤器使用参考中的特点来将新的邮件判定为垃圾邮件或有效邮件。新电子邮件作为新的信息出现,并且如果用户在垃圾邮件和有效邮件的判定中发现错误,这个新的信息会更新初始参考集合中的信息,以期将来的判定可以更为精确。参看贝叶斯推论和贝叶斯过滤。

参考教材


课程评价

教学资源
课程章节 | 文件类型   | 修改时间 | 大小 | 备注
1 隐含马尔克夫模型的应用(四)
视频
.mp4
2017-07-07 73.13MB
2 神经网络应用(三)
视频
.mp4
2017-07-07 80.06MB
3 神经网络应用(四)
视频
.mp4
2017-07-07 72.30MB
4 神经网络应用(五)
视频
.mp4
2017-07-07 74.34MB
5 隐含马尔克夫模型理论(一)
视频
.mp4
2017-07-07 73.64MB
6 隐含马尔克夫模型理论(二)
视频
.mp4
2017-07-07 79.40MB
7 隐含马尔克夫模型理论(三)
视频
.mp4
2017-07-07 73.69MB
8 隐含马尔克夫模型理论(四)
视频
.mp4
2017-07-07 77.22MB
9 隐含马尔克夫模型理论(五)
视频
.mp4
2017-07-07 81.82MB
10 隐含马尔克夫模型理论(六)
视频
.mp4
2017-07-07 75.23MB
11 隐含马尔克夫模型理论(七)
视频
.mp4
2017-07-07 72.20MB
12 隐含马尔克夫模型理论(八)
视频
.mp4
2017-07-07 74.63MB
课程章节
提示框
提示框
确定要报名此课程吗?
确定取消

京ICP备10040544号-2

京公网安备 11010802021885号