内蒙古科技大学:《生物信息学》课程教学课件(PPT讲稿)第四章 序列分析

第四章序列分析 本章提要:本章主要介绍DNA和蛋白质序列分 析的基本内容。包括核酸序列检索、核酸序列的 基本分析(碱基组份、限制性酶切分析、重复序 列分析),基因结构分析、表达标签序列分析的 基本方法和软件。蛋白质序列基本分析、检索、 跨膜区分析、蛋白质亚细胞定位、功能预测等内 容。 2025/5/27 BIOINFORMATICS 1
第四章 序列分析 2025/5/27 BIOINFORMATICS 1 本章提要:本章主要介绍DNA和蛋白质序列分 析的基本内容。包括核酸序列检索、核酸序列的 基本分析(碱基组份、限制性酶切分析、重复序 列分析),基因结构分析、表达标签序列分析的 基本方法和软件。蛋白质序列基本分析、检索、 跨膜区分析、蛋白质亚细胞定位、功能预测等内 容

§4.1核酸序列分析 4.1.1为什么要分析DNA序列 核酸序列分析是生物信息学应用中的 一个重要方面。基于已有知识所形成的核 酸序列数据库以及在此基础之上所形成的 二级数据库对未知核酸序列的分析及功能 预测具有重要的参考价值。在从事分子生 物学研究的几乎所有实验室中,对所获得 与生 的核酸序列进行生物信息学分析已经成为 工 进行下一步实验之前的一个标准操作。 程 院 2025/5/27 BIOINFORMATICS 2
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 2 §4.1 核酸序列分析 4.1.1 为什么要分析DNA序列 核酸序列分析是生物信息学应用中的 一个重要方面。基于已有知识所形成的核 酸序列数据库以及在此基础之上所形成的 二级数据库对未知核酸序列的分析及功能 预测具有重要的参考价值。在从事分子生 物学研究的几乎所有实验室中,对所获得 的核酸序列进行生物信息学分析已经成为 进行下一步实验之前的一个标准操作

在很多时候,往往通过一个简单序 列相似性的比较就可以对未知序列进行 初步的功能预测,为后续实验确定初步 的研究方向。本节将主要讲述如何采用 生物信息学技术对核酸序列进行较为全 面的分析。 数理与生物工程学院 2025/5/27 BIOINFORMATICS
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 3 在很多时候,往往通过一个简单序 列相似性的比较就可以对未知序列进行 初步的功能预测,为后续实验确定初步 的研究方向。本节将主要讲述如何采用 生物信息学技术对核酸序列进行较为全 面的分析

序列比较通常在蛋白质水平上进行, 或者说在蛋白质翻译中检测远缘序列更为 容易一些,因为由64个密码子(codon)所 组成的遗传密码(genetic code)的冗余被缩 减成了20个蛋白质的功能单位一氨基酸。 数理与生物工程学 2025/5/27 BIOINFORMATICS
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 4 序列比较通常在蛋白质水平上进行, 或者说在蛋白质翻译中检测远缘序列更为 容易一些,因为由64个密码子(codon)所 组成的遗传密码(genetic code)的冗余被缩 减成了20个蛋白质的功能单位—氨基酸

然而,这种简并性可能伴随着有用 信息的丢失,这是因为许多直接与进化 过程相关的信息在蛋白质水平无法表现, 通过核苷酸序列则可以反映出来。例如, 沉默突变(silent mutation)就是在DNA水平 的突变,但并不导致蛋白质水平的氨基 酸置换。 数理与生物工程学院 2025/5/27 BIOINFORMATICS
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 5 然而,这种简并性可能伴随着有用 信息的丢失,这是因为许多直接与进化 过程相关的信息在蛋白质水平无法表现, 通过核苷酸序列则可以反映出来。例如, 沉默突变(silent mutation)就是在DNA水平 的突变,但并不导致蛋白质水平的氨基 酸置换

随着测序技术的迅速发展与普及, 越来越多的DNA序列已被测定并存贮在 各种分子数据库中(如GenBank)。对这些 序列进行分析,可以获得如下几个方面 的信息: 数理与生物工程学院 2025/5/27 BIOINFORMATICS 6
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 6 随着测序技术的迅速发展与普及, 越来越多的DNA序列已被测定并存贮在 各种分子数据库中(如GenBank)。对这些 序列进行分析,可以获得如下几个方面 的信息:

DNA碱基组成、密码子的偏向、内部重复序 列等; •序列及所代表的类群间的系统发育关系: •特殊位点(限制性位点及转录、翻译和表达 调控相关信号); ·内含子/外显子(intron/exon)预测所确定的遗传 结构; ·可读框(open-reading frame,ORF)分析所推导 数理与生 的蛋白质编码序列(coding sequence,CDS)等。 工程学院 2025/5/27 BIOINFORMATICS
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 7 •DNA碱基组成、密码子的偏向、内部重复序 列等; •序列及所代表的类群间的系统发育关系; •特殊位点(限制性位点及转录、翻译和表达 调控相关信号); •内含子/外显子(intron/exon)预测所确定的遗传 结构; •可读框(open-reading frame,ORF)分析所推导 的蛋白质编码序列(coding sequence, CDS)等

4.1.2核酸序列的基本分析 4.1.2.1核酸序列的检索 已知核酸序列的检索是核酸序列分析最为 基本的一个方面。可通过多种方式实现该功能。 例 如 可通 过NCBI使 用 EntreZ(http://www.ncbi.nlm.nih.gov:80/entrez/query.fcgi?db=Nucl eotide)系统进行检索,在输入框中输入需要检索 的内容,然后点击按钮“G0”即可开始(图4- I)。同样,也可使用EBI的SRS服务器 (http:/srs.ebi.ac.uk/)进行检索,可参考第三章。 理与生 工程 院 2025/5/27 BIOINFORMATICS 8
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 8 4.1.2 核酸序列的基本分析 4.1.2.1核酸序列的检索 已知核酸序列的检索是核酸序列分析最为 基本的一个方面。可通过多种方式实现该功能。 例 如 , 可通过 NCBI 使 用 Entrez(http://www.ncbi.nlm.nih.gov:80/entrez/query.fcgi?db=Nucl eotide)系统进行检索,在输入框中输入需要检索 的内容,然后点击按钮“Go”即可开始(图4- 1) 。 同 样 , 也 可 使 用 EBI 的 SRS 服务器 (http://srs.ebi.ac.uk/)进行检索,可参考第三章

CGCTCAGGAT ATCGGATCCCCGG ATTATATAGC TCGATCGATCT TTCTC TAT ATATACACACA NCBI TTCGCATACGTG Nucleotide TTAC TAAC CAAT All Databases PubMed Nucleotide Protein Genome Structure Search Nucleotide for AF113672 GoClear Save Search Limits Preview/Index History Clipboard Details 图4-1NCB核酸序列检索的网络界面 2025/5/27 BIOINFORMATICS 9
2025/5/27 BIOINFORMATICS 9 图4-1 NCBI核酸序列检索的网络界面

在进行序列检索时,往往需要同时检索多条 序列。这一,点可通过逻辑关系式按照GenBank接 受号进行批量检索。例如,需要检索序列接受号 分别为AF113671、AF113672、AF113673、 AF113674、AF113675、AF113676的序列,可在 序列输入框中输入“AF113671[ac]OR AF113672 [ac]OR AF113673 [ac]OR AF113674 [ac]OR AF113675[ac]ORAF113676[ac]”,即可同时检索 出这些序列。其中,“[ac”是序列接受号的描述 数 字段。GenBank数据库中所采用的描述字段详见 http://www.ncbi.nlm.nih gov/Entrez/entrezhelp.html#SearchFields 物 程 院 2025/5/27 BIOINFORMATICS 10
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 10 在进行序列检索时,往往需要同时检索多条 序列。这一点可通过逻辑关系式按照GenBank接 受号进行批量检索。例如,需要检索序列接受号 分别为 AF113671 、 AF113672 、 AF113673 、 AF113674、AF113675、AF 113676的序列,可在 序列输入框中输入“AF113671 [ac] OR AF113672 [ac] OR AF113673 [ac] OR AF113674 [ac] OR AF113675 [ac] OR AF113676 [ac]”,即可同时检索 出这些序列。其中, “[ac]”是序列接受号的描述 字段。GenBank数据库中所采用的描述字段详见 网 址 http://www.ncbi.nlm.nih.gov/Entrez/entrezhelp.html#SearchFields
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 内蒙古科技大学:《生物信息学》课程考试试题A卷2010答案.pdf
- 内蒙古科技大学:《生物信息学》课程考试试题A卷2010.pdf
- 内蒙古科技大学:《生物信息学》课程考试试卷A卷2009答案.pdf
- 内蒙古科技大学:《生物信息学》课程f考试试卷A卷2009.pdf
- 内蒙古科技大学:《生物信息学》课程授课教案(讲义,共八章,授课教师:蔡禄).pdf
- 内蒙古科技大学:《生物信息学》课程教学大纲 Bioinformatics.pdf
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第十五章-高等植物多样性.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第一章 植物细胞的结构与功能.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第五章 根的结构发育与生理功能.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第四章 组织形成.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)绪论 Plant Biology.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第三章 细胞分裂分化衰老与死亡.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第二章 细胞代谢.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第八章 植物的生殖.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第六章叶的结构发育与生理功能.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第七章 茎的结构发育与生理功能.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第十章 植物激素对生长发育的调节.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第十三章 原核生物.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第九章 器官间的相互联络和相关性.pps
- 中国农业大学:《植物生物学》课程教学课件(PPT讲稿)第十二章 植物的运动.pps
- 内蒙古科技大学:《生物信息学》课程教学课件(PPT讲稿)第一章 生物信息学引论.ppt
- 内蒙古科技大学:《生物信息学》课程教学课件(PPT讲稿)第三章 生物信息学资源与数据挖掘工具.ppt
- 内蒙古科技大学:《生物信息学》课程教学课件(PPT讲稿)第二章 生物学基础.ppt
- 内蒙古科技大学:《生物信息学》课程教学课件(PPT讲稿)第七章 生物芯片.ppt
- 内蒙古科技大学:《生物信息学》课程教学课件(PPT讲稿)第六章 分子系统发生分析.ppt
- 内蒙古科技大学:《生物信息学》课程教学课件(PPT讲稿)第五章 序列比对.ppt
- 内蒙古科技大学:《生物信息学》课程教学课件(PPT讲稿)第八章 后基因组时代的生物信息学.ppt