生物信息学复习- 飞之心的日志- 网易博客

生物信息学 复习

2010-05-31 20:46:30 阅读7 评论0 字号:

THE ASSIGNMENT FOR BIOINFORMATICS


Chapter 1 PPT1
1.什么是生物信息学?(狭义和广义)
生物信息学广义的概念是指应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生
理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。

生物信息学狭义的概念是指应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。
 
2.生物信息学的发展历史。
?      20世纪50年代,生物信息学开始孕育。
?      20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来。
?      20世纪70年代,生物信息学的真正开端。
?      20世纪70年代到80年代初期 ,出现了一系列xx的序列比较方法和生物信息分析方法。
?      20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库。
?      20世纪90年代后 ,HGP促进生物信息学的迅速发展。

3.人类基因组计划和基因组信息学的相互作用。
 人类基因组计划简介:人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图
谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传息。
基因组:一个物种中所有基因的整体组成。  人类基因组构成——24条染色体和线粒体。
建立四张图谱:遗传图谱;物理图谱;序列图谱;转录图谱。
 
4.用狭义的方式来诠释核酸序列和蛋白质结构序列。


 
5.生物信息学的目标和任务
收集和管理生物分子数据;数据分析和挖掘;开发分析工具和实用软件:生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。

6.生物信息学主要研究内容。
(1)生物分子数据的收集与管理;(2)数据库搜索及序列比较 ;(3)基因组序列分析;
(4)基因表达数据的分析与处理 ;(5)蛋白质结构预测。
 
7.生物信息学所用的方法和技术。
(1)数学统计方法;(2)动态规划方法 ;(3)机器学习与模式识别技术 ;(4)数据库技术及数据挖掘 ;(5)人工神经网络技术;(6)专家系统 ;(7)分子模
型化技术;(8)量子力学和分子力学计算 ;(9)生物分子的计算机模拟;(10)因特网(Internet)技术。

 

 


Chapter 2 PPT 2
1.      生物大分子构成的三条基本原则:
(1)构成生物体各类有机大分子的单体在不同的生物中都相同;
(2)生物体内一切有机大分子的构成都遵循共同的规则;
(3)某一特定生物体所拥有的核酸及蛋白质分子决定了它的属性。
2. 真核细胞和原核细胞的区别:

 


3.遗传定律(孟德尔)
 
4.蛋白质和DNA的构成单元。
? 氨基酸(amino acid)是蛋白质的基本结构单位。
? 核苷酸是DNA的基本结构单位。

5.中心法则。
 
6.DNA是怎样编码的?
基因是DNA上一段特定的碱基序列,携带遗传信息,一条DNA上有几个基因并不确定,因DNA不同而不同 。三个碱基编码一个氨基酸,不同的碱基序列编码不同的氨基酸序

列(即蛋白质的一级结构),氨基酸间脱水形成肽,肽经一定的盘旋折叠形成具有空间特异性结构的蛋白质,形成不同的蛋白质,即蛋白质的翻译过程。

7.蛋白质的一二三级结构。
蛋白质的一级结构是指多肽链中氨基酸的序列
蛋白质的二级结构主要有以下几种形式:
(i)?螺旋 ;(ii)?折叠 –平行折叠 反平行折叠 ;(iii)?—转角 –连接作用
(iv)无规卷曲-没有确定规律性的肽链构象,但仍然是紧密有序的稳定结构。
(v)无序结构。
蛋白质的三级结构(tertiary structure) 在二级结构基础上的肽链再折叠形成的构象。
?型—主要是由?螺旋所构成;
 ?型—主要由反平行的?折叠所构成,?折叠片之间以?转角连接;
 ?/?型—由?螺旋包裹的以平行?链为主的?—?—?花样所构成。
 
Chapter3 PPT 3
1.      序列分析的任务和目的。
序列比较的根本任务是:(1)发现序列之间的相似性;(2)辨别序列之间的差异
目的:
      相似序列 ? 相似的结构,相似的功能
      判别序列之间的同源性
      推测序列之间的进化关系

 


Chapter 4 PPT 4
1.      为什么要构建生物分子数据库。
(1)生物分子数据高速增长 (2)分子生物学及相关领域研究人员迅速获得{zx1}实验数据。

2.一二级数据库(怎样查?)
一级数据库
?     数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释
二级数据库
?     对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的 。

3.国际上xx的核酸序列数据库
(1)欧洲分子生物学实验室的EMBL。
(2)美国生物技术信息中心的GenBank。
(3)日本遗传研究所的DDBJ。

 

 

Chapter 5 PPT 5
1.关于密码子
(1)密码子的使用是非随机的
如果密码子的{dy}、第二位碱基是A、U,那么第三位将尽可能使用G、C;反之亦然。
如果三位都用G、C,则配对容易,分解难;三位都用A、U,则相反。
 一般地说,高表达的基因,要求翻译速度快,要求密码子和反密码子配对快、分手也快。
(2)密码子的使用有一定的统计规律
对同义密码子的使用存在着偏爱
不同种属偏爱的密码子不同
  人类基因组:
             密码子第三位取A、U的情况占90%
             而第三位取G、C仅占10%
 密码子的使用偏性与基因功能、蛋白质结构相关
(3)密码子中的密码
三个碱基的位置与所编码的氨基酸性质存在着联系
      例如:
?        芳香族氨基酸——以U作为{dy}位碱基
?        中间位置碱基的性质与氨基酸是亲疏水性相关
             疏水氨基酸的密码子,其第二位碱基是U
             亲水氨基酸的密码子,其第二位碱基是A
             第二位碱基是G、C的密码子所编码的氨基酸亲水性、疏水性居中。

2.基因分析中所关注的?
?     原核基因识别:重点在于识别编码区域
?     非翻译区域(untranslated regions, UTR)
编码区域两端的DNA,有一部分被转录,但是不被翻译,这一部分称为非翻译区域
?     5’UTR---基因上游区域的非翻译区域 ;3’UTR---基因下游区域的非翻译区域
?     对于任何给定的核酸序列(单链DNA或mRNA),根据密码子的起始位置,可以按照三种方式进行解释。
?     这三种阅读顺序称为阅读框(reading frames)
一个开放阅读框(ORF,open reading frame)是一个没有终止编码的密码子序列。
原核基因识别任务的重点是识别开放阅读框,或者说识别长的编码区域。

 

 

 


Chapter 6 PPT 6
1.      什么是系统发生、系统发生学、系统发生树?
系统发生(phylogeny)——是指生物形成或进化的历史。
系统发生学(phylogenetics)——研究物种之间的进化关系。
系统发生树(phylogenetic tree)——表示形式,描述物种之间进化关系。

2.      有根数、无根树的构建。
系统发生树的构建方法分为两大类:
(1)基于距离的构建方法:非加权组平均法 ;邻近归并法 ;Fitch-Margoliash法
最小进化方法
(2)基于离散特征的构建方法:{zd0}简约法;{zd0}似然法;进化简约法;相容性方法 
 

 

 


Chapter 7 PPT 7
1.      为什么要对protein进行预测?
Page 181 寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射。

2.      蛋白质预测的思路和方法。
思路:     蛋白质结构预测主要有两大类方法:
(1)理论分析方法
–    通过理论计算(如分子力学、分子动力学计算)进行结构预测。
(2)统计的方法
–    对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。
–    包括:
?        经验性方法
?        结构规律提取方法
?        同源模型化方法
 

 

 


Chapter 8 PPT 8
1.      生物芯片定义。
基因芯片(gene chip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。
       基因芯片把大量已知序列探针集成在同一个基片上,经过标记的若干靶核酸序列通过与芯片特定位置上的探针杂交,便可根据碱基互补匹配的原理确定靶基因的序列。 


   
2、基因芯片对于生物分子信息检测的作用和意义
       在生命科学领域中,基因芯片为分子生物学、生物医学等研究提供了强有力的手段。
      利用基因芯片技术,可研究生命体系中不同部位、不同生长发育阶段的基因表达,比较不同个体或物种之间的基因表达,比较正常和疾病状态下基因及其表达的差
异。
      基因芯片技术也有助于研究不同层次的多基因协同作用的生命过程,发现新的基因功能,研究生物体在进化、发育、遗传过程中的规律。
生物信息学在基因芯片中的应用:
       生物信息学在基因芯片中的应用主要体现在三个方面:
       确定芯片检测目标
       芯片设计
       实验数据管理与分析

<#--{zx1}日志--> <#--推荐日志--> <#--引用记录--> <#--相关日志--> <#--推荐日志--> <#--推荐阅读--> <#--相关文章--> <#--历史上的今天--> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构-->
郑重声明:资讯 【生物信息学复习- 飞之心的日志- 网易博客】由 发布,版权归原作者及其所在单位,其原创性以及文中陈述文字和内容未经(企业库qiyeku.com)证实,请读者仅作参考,并请自行核实相关内容。若本文有侵犯到您的版权, 请你提供相关证明及申请并与我们联系(qiyeku # qq.com)或【在线投诉】,我们审核后将会尽快处理。
—— 相关资讯 ——