中国高校课件下载中心 》 教学资源 》 大学文库

内蒙古科技大学:《生物信息学》课程考试试卷A卷2009答案

文档信息
资源类别:文库
文档格式:PDF
文档页数:5
文件大小:167.64KB
团购合买:点击进入团购
内容简介
内蒙古科技大学:《生物信息学》课程考试试卷A卷2009答案
刷新页面文档预览

内蒙古科技大学2009/2010学年第一学期 四、问答题(共3题,每题5分,共15分) 《生物信息学》答案 1.解释正则表达式C-Y-X2-DG]-G-X-S可的含义 课程号:66149304 考试方式:开卷 -:连字符用于分割基序中的每一个位点:【们:方括号里的余项表示基序中特殊位 使用专业、年级:生技06,生工0们任课教师:繁禄 点上已识别的残基。X:字母X表示任意一个氨基酸:(:这表示一个特殊残基或X 考试时间:2009年1月8日 备注:A卷 的重复。 一、名词解释(共5题,每题3分,共15分) 2.构建蛋白质二级数据库的主要方法有哪些? 1.序列比对:通过比较生物分子序列,发现它们的相似性,找出序列之间共同的 单模体法、多模体法和全域对位挂列法 区域,同时辨别序列之间的差异。 3.总结基因融合法预测蛋白质相互作用的基本原理。 2.基序(moi):通过多序列比对,将同源序列收集在一起,以得到保守区域。这 进化过程中,基因可以融合成一个较大的“Composite Gene”,也可分裂成较小 些保守区域反映了蛋白质分子的一些重要结构和功能称为模体或基序(motifs) 的“Component Gene"”。在一个基因组中出现的“Composite Gene”(也叫Rosetta stone 3.表达序列标签(EST):是从cDNA文库中生成的一些很短的序列(300一500bp), Sequence)可以推测在其它基因组中Component Genes之间的功能相互作用。 它们代表在特定组织或发有阶段表达的基因,有时可代表特定的cDNA. 五、计算题(共3题,共40分) 4.电子克隆:根据大量EST具有相互重叠的性质,通过计算机算法获得cDNA全 L.对两个序列ACACACTA和AGCACACA进行全局比对(I0分) 长序列。 将两序列中匹配残基所对应单元的值置为1,不匹配的值置为0。-2分 5.开放阅读框(ORF):没有终止密码子(TGA,TAA或TAG)打断的阅读框。 A A 二、填空题(共6愿,每空1分,共20分) 后 L,目前国际上最常用的核酸序列数据库有GenBank、EMBL和DDBL。 2.目前回际上最常用的蛋白序列数据库有Swiss-Prot、PIR和MPS。 3.列举至少五种NCBI的服务项目PubMed、Ente2、OMM、 Taxonomy Browser和Blast等。 4.蛋白质得分矩阵类型有等价矩阵、遗传密码矩阵(GC)、疏水矩阵一 PAM矩阵和BLOSUM矩阵等。 5.预测蛋白质-蛋白质相互作用的理论方法主要有基因表达关联、基因近邻法 010 0 0 种系轮廓发生法和基因融合法等。 然后对矩阵中每个单元进行连续求和,即把能够到达该位置的所有单元中最大值与 6.对位排列主要有局部比对和全局此对。 该位置的值相加。 三、单项选择想(共5愿,每题2分,共10分) 若令当前位置为第1行、第j列,那么能够达到它的单元为 I、B2、C3、B4、C5、C 第1页共5页

第 1 页 共 5 页 内蒙古科技大学 2009/2010 学年第一学期 《生物信息学》答案 课程号:66149304 考试方式:开卷 使用专业、年级:生技 06,生工 07 任课教师:蔡禄 考试时间:2009 年 1 月 8 日 备 注: A 卷 一、名词解释(共 5 题,每题 3 分,共 15 分) 1. 序列比对:通过比较生物分子序列,发现它们的相似性,找出序列之间共同的 区域,同时辨别序列之间的差异。 2. 基序(motif):通过多序列比对,将同源序列收集在一起,以得到保守区域。这 些保守区域反映了蛋白质分子的一些重要结构和功能称为模体或基序(motifs) 3. 表达序列标签(EST):是从 cDNA 文库中生成的一些很短的序列(300—500bp), 它们代表在特定组织或发育阶段表达的基因,有时可代表特定的 cDNA. 4. 电子克隆:根据大量 EST 具有相互重叠的性质,通过计算机算法获得 cDNA 全 长序列。 5. 开放阅读框(ORF):没有终止密码子(TGA,TAA 或 TAG)打断的阅读框。 二、填空题(共 6 题,每空 1 分,共 20 分) 1. 目前国际上最常用的核酸序列数据库有 GenBank 、 EMBL 和 DDBJ 。 2. 目前国际上最常用的蛋白序列数据库有 Swiss-Prot 、 PIR 和 MIPS 。 3. 列举至少五种NCBI的服务项目 PubMed 、 Entrez 、 OMIM 、 Taxonomy Browser 和 Blast 等。 4. 蛋白质得分矩阵类型有等价矩阵 、遗传密码矩阵(GCM) 、 疏水矩阵 、 PAM矩阵 和 BLOSUM矩阵 等。 5. 预测蛋白质-蛋白质相互作用的理论方法主要有 基因表达关联、 基因近邻法 、 种系轮廓发生法 和 基因融合法 等。 6. 对位排列主要有局部比对和 全局比对 。 三、单项选择题(共 5 题,每题 2 分,共 10 分) 1、B 2、C 3、B 4、C 5、C .装订线.装订线.装订线.试卷须与答题纸一并交监考教师.装订线.装订线.装订线. 四、问答题(共 3 题,每题 5 分,共 15 分) 学生班级_学生学号:□□□□□□□□□□□□学生姓名:_ 1. 解释正则表达式 C-Y-X2-[DG]-G-X-[ST]的含义 -:连字符用于分割基序中的每一个位点;[ ]:方括号里的余项表示基序中特殊位 点上已识别的残基。 X:字母 X 表示任意一个氨基酸; (n):这表示一个特殊残基或 X 的重复。 2. 构建蛋白质二级数据库的主要方法有哪些? 单模体法、多模体法和全域对位排列法 3. 总结基因融合法预测蛋白质相互作用的基本原理。 进化过程中,基因可以融合成一个较大的“Composite Gene”,也可分裂成较小 的“Component Gene”。在一个基因组中出现的“Composite Gene ”(也叫 Rosetta stone Sequence)可以推测在其它基因组中 Component Genes 之间的功能相互作用。 五、计算题(共 3 题,共 40 分) 1. 对两个序列 ACACACTA 和 AGCACACA 进行全局比对(10 分) 将两序列中匹配残基所对应单元的值置为 1,不匹配的值置为 0。-2 分 A C A C A C T A A 1 0 1 0 1 0 0 1 G 0 0 0 0 0 0 0 0 C 0 1 0 1 0 1 0 0 A 1 0 1 0 1 0 0 1 C 0 1 0 1 0 1 0 0 A 1 0 1 0 1 0 0 1 C 0 1 0 1 0 1 0 0 A 1 0 1 0 1 0 0 1 然后对矩阵中每个单元进行连续求和,即把能够到达该位置的所有单元中最大值与 该位置的值相加。 若令当前位置为第 i 行、第 j 列,那么能够达到它的单元为

(1)第i+1行中的第j个单元之后的所有单元 D9900 (2)第j+1列中的第1个单元之后的所有单元. E12111390 对矩阵的所有单元都重复这一操作,直到全部结束为止。 2分 首先,根据最小距离值3(对角线元素0除外),将A和B聚合为AB。AB与C、D、E T A 间的距离分别为: D 9 100 1211139 0 dc =6 A 0 0 0 0 de+d=72/2 -2分 完成所有矩阵单元的分值计算后,接下来就是从最高分值单元开始找出最大分值路径 di= +i=8 d=9 也就是找出最佳匹配。根据上述求和过程的特性,最大分值单元一定是在序列的N一 端,也就是矩阵左上角。从这一起始单元回湖,找出具有最大分值的路径,即最准路 径。所谓回溯,就是由算法结束时的单元开始,反向查找到达到该单元所经过的路径。 d= 246-26512 。1 da.e=11.51 -一-2分 -每式1.5分 最终比对结果如图 A_CACACTA 新的距离矩阵为: AGCACAC_A AB DE 矩阵起始单元的最大匹配值7,实际上就是最佳匹配路径中相同匹配残基的数目。 AB 0 2.对于下列距离矩阵,用UPGMA构建系统发生树。(10分) 6 0 E D 9 10 0 0 E 11.5113 A 90 B 3 0 2分 c650 根据最小距离值6(对角线元素0除外),将AB和C聚合为ABC。ABC与 第2页共5页

第 2 页 共 5 页 (1) 第 i+1 行中的第 j 个单元之后的所有单元 (2) 第 j+1 列中的第 i 个单元之后的所有单元。 对矩阵的所有单元都重复这一操作,直到全部结束为止。 -2 分 A C A C A C T A A 7 5 5 3 3 1 1 1 G 6 5 4 3 2 1 1 0 C 5 6 4 4 2 2 1 0 A 5 4 5 3 3 1 1 1 C 3 4 3 4 2 2 1 0 A 3 2 3 2 3 1 1 1 C 1 2 1 2 1 2 1 0 A 1 0 1 0 1 0 0 1 -2 分 完成所有矩阵单元的分值计算后,接下来就是从最高分值单元开始找出最大分值路径, 也就是找出最佳匹配。根据上述求和过程的特性,最大分值单元一定是在序列的 N 一 端,也就是矩阵左上角。从这一起始单元回溯,找出具有最大分值的路径,即最佳路 径。所谓回溯,就是由算法结束时的单元开始,反向查找到达到该单元所经过的路径。 -2 分 最终比对结果如图 A_CACACTA AGCACAC_A -2 分 矩阵起始单元的最大匹配值 7,实际上就是最佳匹配路径中相同匹配残基的数目。 2. 对于下列距离矩阵,用 UPGMA 构建系统发生树。(10 分) A B C D E A 0 B 3 0 C 6 5 0 D 9 9 10 0 E 12 11 13 9 0 首先,根据最小距离值 3(对角线元素 0 除外),将 A 和 B 聚合为 AB。AB 与 C、D、E 间的距离分别为: A B C D E A 0 B 3 0 C 6 6 0 D 9 9 10 0 E 12 11 13 9 0 -每式 1.5 分 新的距离矩阵为: AB C D E AB 0 C 6 0 D 9 10 0 E 11.51 13 9 0 -2 分 根据最小距离值 6(对角线元素 0 除外),将 AB 和 C 聚合为 ABC。ABC 与 2/72 2 1 2 2 1 2 2 ,CAB ,CA ddd ,CB =+= d ,CAB = 6 81 2 1 2 1 2 , 2 2 ,DAB ,DA ddd DB =+= d ,DAB = 9 2/265 2 1 2 1 2 , 2 2 ,EAB ,EA ddd EB =+= d ,EAB = 51.11

D、E间的距离分别为: d=+d=6034 1 2 doee=9.5 dz=12.28 每式1.5分 -2分 新的距离矩阵为: 3.对下面距离矩阵,用邻近归并法构建系统发生树(20分) ABC D E ABC 0 D 9.5 0 E 12.28 90 -2分 0 根据最小距离值9对角线元素0除外),将D和E聚合为DE。ABC与DE间的距离为: 1 1 F 0 发散系数r,速率校正距离阵=L,}x。公式分别如下: 1.5分 告 -1分 根据以上结果,可以构建一个系统树 A B F rr/(N-2) 30 7.5 B-13 0 7 10 9 1142 10.5 C-11.5-11.5 0 8 32 8 D-10 -10 -10.5 0 938 9.5 E -10 -10 -10.5 -13 0 8 34 8.5 F-10.5 -10.5 -11.5-11.5044 11 第3页共5页

第 3 页 共 5 页 D、E 间的距离分别为: -每式 1.5 分 新的距离矩阵为: ABC D E ABC 0 D 9.5 0 E 12.28 9 0 -2 分 根据最小距离值 9(对角线元素 0 除外),将 D 和 E 聚合为 DE。ABC 与 DE 间的距离为: -1.5 分 根据以上结果,可以构建一个系统树 -2 分 3. 对下面距离矩阵,用邻近归并法构建系统发生树(20 分) ABC EF D A 0 5 4 7 6 8 B 0 7 10 9 11 C 0 7 6 8 D 0 5 9 E 0 8 F 0 发散系数ri,速率校正距离阵M={Mij}m×n。公式分别如下: 1 N i k r = = ik ∑d 2 i ij ij r r M d N+ = − − A B C D E F r j -1 分 i ri/(N-2) A 0 5 4 7 6 8 30 7.5 B -13 0 7 10 9 11 42 10.5 C -11.5 -11.5 0 7 6 8 32 8 D -10 -10 -10.5 0 5 9 38 9.5 E -10 -10 -10.5 -13 0 8 34 8.5 F -10.5 -10.5 -11 -11.5 -11.5 0 44 11 8/ 2 1 2 2 1 2 ,ABCDE ,ABCD += ddd d ,ABCDE = 11 965 2,ABCE =

-5分 其中,=-I3为最小值。设新节点(邻接节点)为AB 5=Su/2+(r.-r)/(2XN-2) ABC D E F r/(N-2) =5/2+(7.5-10.5)/2=1 0 5 6 15 7.5 S2=5-1=4 -12 19 9.5 Sca=(&+Sx-S)/2-3 12 -13 0 8 17 8.5 5a=(S2+Sa-SJ/2=6 F -13 -12 -1202311.5 S元a=(S+5e-SuD/2=5 Sr.F(S.+Sr.-S)/2=7 其中M:=-13为最小值。设新节点(邻接节点)为D 一每式0.5分,共3分 S=S./2+(r-r)/(2×N-2)) 删去已连接的类群A和B后,计算结果见下表 =5/2+(9.5-8.5)/2=3 AB r/(N-2) S=5-3=2 0 3 5 Sw,F(Sx+Sx-5)/2=2 -12 0 7 6 24 5=(S.+Sm.-5at)/2-6 D -10 -10 0 9 9 -每式0.5分,共2分 E -10 -10 -12 0 24 8 删去已连接的类群D和E后,计算结果见下表 F -10.67-10.67 -10.67-10.67 0 32 10.67 ABC DE F r. r/(N-2) 一3分 ABC 0 2 6 8 8 其中a二-12为最小值.设新节点(邻接节点)为ABC DE -14 0 68 8 S=/2+(r-rd/(2x (N-2)) -14 -14012 12 -3/2+(7-8)/2-1 -1分 S,a-3-1=2 设新节点(邻接节点)为ABCDE Sa=(Sm+S。Sa)/2=5 Sm.=Ss./2+(rs-r)/(2X (N-2)) S=(SLu+SLe-Sa.)/2=4 =2/2+(8-8)/2=1 Sr.=(Sr.+Sr.e-SB.c)/2=6 S:.n=2-l=1 -一-每式0.5分,共2.5分 Sr.=(Sa+S.S)/2-=5 删去已连接的类群B和C后,计算结果见下表 -每式0.5分,共1.5分 第4页共5页

第 4 页 共 5 页 -5 分 其中MA,B=-13 为最小值。设新节点(邻接节点)为AB SA,AB= SA,B/2+(rA-rB)/(2×(N-2)) =5/2+(7.5-10.5)/2=1 SB,AB=5-1=4 SC,AB=(SC,A+ SC,B-SA,B)/2=3 SD,AB=(SD,A+ SD,B-SA,B)/2=6 SE,AB=(SE,A+ SE,B-SA,B)/2=5 SF,AB=(SF,A+ SF,B-SA,B)/2=7 -每式 0.5 分,共 3 分 删去已连接的类群A和B 后,计算结果见下表 AB C D E F ri ri/(N-2) AB 0 3 6 5 7 21 7 C -12 0 7 6 8 24 8 D -10 -10 0 5 9 27 9 E -10 -10 -12 0 8 24 8 F -10.67 -10.67 -10.67 -10.67 0 32 10.67 -3 分 其中MAB,C=-12 为最小值。设新节点(邻接节点)为ABC SAB,ABC= SAB,C/2+(rAB-rC)/(2×(N-2)) =3/2+(7-8)/2=1 SC,ABC=3-1=2 SD,ABC=(SD,AB+ SD,C-SAB,C)/2=5 SE,ABC=(SE,AB+ SE,C-SAB,C)/2=4 SF,ABC=(SF,AB+ SF,C-SAB,C)/2=6 -每式 0.5 分,共 2.5 分 删去已连接的类群 AB 和 C 后,计算结果见下表 ABC D E F ri ri/(N-2) ABC 0 5 4 6 15 7.5 D -12 0 5 9 19 9.5 E -12 -13 0 8 17 8.5 F -13 -12 -12 0 23 11.5 -3 分 其中MD,E=-13 为最小值。设新节点(邻接节点)为DE SD,DE= SD,E/2+(rD-rE)/(2×(N-2)) =5/2+(9.5-8.5)/2=3 SE,DE=5-3=2 SABC,DE=(SABC,D+ SABC,E-SD,E)/2=2 SF,DE=(SF,D+ SF,E-SD,E)/2=6 -每式 0.5 分,共 2 分 删去已连接的类群D和E 后,计算结果见下表 ABC DE F ri ri/(N-2) ABC 0 2 6 8 8 DE -14 0 6 8 8 F -14 -14 0 12 12 -1 分 设新节点(邻接节点)为 ABCDE SABC,ABCDE= SABC,DE/2+(rABC-rDE)/(2×(N-2)) =2/2+(8-8)/2=1 SE,DE=2-1=1 SF,ABCDE=(SF,ABC+ SF,DE-SABC,DE)/2=5 -每式 0.5 分,共 1.5 分

根据以上结果,获得一个系统树 -3分 第5页共5页

第 5 页 共 5 页 根据以上结果,获得一个系统树 4 A 1 1 2 2 1 B 1 C 4 3 D E F -3 分

已到末页,全文结束
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档