logo资料库

一步步教你使用NCBI.pdf

第1页 / 共16页
第2页 / 共16页
第3页 / 共16页
第4页 / 共16页
第5页 / 共16页
第6页 / 共16页
第7页 / 共16页
第8页 / 共16页
资料共16页,剩余部分请下载后查看
一步一步教你使用 NCBI 查找 DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST 序列比对等 bbs.bbioo.com 作者:urbest 2007-8-1 苏州大学生命科学学院
一步一步教你使用 NCBI 苏州大学生命科学学院医学遗传  最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用 BLAST 进行序列比对……,这些问题在 NCBI 上都可以方便的找到答案。现在我就结合我自 己使用 NCBI 的一些经历(经验)跟大家交流一下 BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下 NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的 mRNA、cDNA、蛋白序列 Part three 运用 STS 查找已经公布的引物序列 Part four 如何运用 BLAST 进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于 NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分 利用 Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的 IL6(白细胞介素 6)为例讲述一下具体的操作步骤 1.打开 Map viewer 页面,网址为:http://www.ncbi.nlm.nih.gov/mapview/index.html 在 search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示: 2.点击“GO”出现如下页面:   2 
一步一步教你使用 NCBI 苏州大学生命科学学院医学遗传  3.在步骤二图示的右下角有一个 Quick Filter,下面是让你选择的几个复选框,在 Gene 前面的小方框里打勾,然后点击 Filter. 出现下图: 说明一下:1、染色体的红色区域即为你的目的基因所处位置。2、下面参考序列给出了 三个,是不同的部门做出来的,经我验证,序列有微小的差异,但总体来说基本相同。尽管 你分别点击后,序列代码、序列代码等有所差异,但碱基基本一致,不影响大家研究分析序 列。现在普遍采用的是最上面的那个序列,这一条是世界范围的生物科学家用计算机合成的 一个序列。我也推荐大家使用这个序列。   3 
一步一步教你使用 NCBI 苏州大学生命科学学院医学遗传  4.点击上述三条序列第一条序列(即 reference)对应的"Genes seq",出现新的页面, 页面下方为: 5.点击上图出现的“Download/View Sequence/Evidence ”,即下载查看序列等功能, 结果如图所示: 先对上面这张图做点简要的说明,在 Sequence Format(序列输出格式)后面是一个下 拉式选择菜单,默认的为 FASTA 格式,还有一个是 GenBank 格式。我推荐大家选择 GenBnak 格式,因为这个格式提供了很多该基因的信息,而 FASTA 格式只有基因序列。 6.在 Sequence Format 后选择 GenBank,然后点击下面的 Display,目的基因的相关 信息和序列就出现在眼前了。点击后如图所示(网页较大,只抓取一小部分以作示范):   4 
一步一步教你使用 NCBI 苏州大学生命科学学院医学遗传  在上述打开的网页中,你可以看到基因长度,基因序列,以及这个基因是如何被报道出 来的等各种信息。 你会看到: mRNA join(3598..3678,3841..4031,5090..5203,5911..6057, 7803..8394) 这代表了从基因的 3598 位开始就是转录区了,即我们常说的 mRNA 片断,由于内含子的存在, 所以 mRNA 在 DNA 序列上分成了几段。 CDS join(3660..3678,3841..4031,5090..5203,5911..6057, 7803..7970) CDS 代表编码序列,即蛋白编码区是从 3660 开始的(ATG),由于剪接作用所以 CDS 区 也是不连续的。 说到这里,可能很多朋友都已经明白了 promoter 即启动子区域在哪里了。但我还是再 唠叨几句:转录起始位点前面是基因的调控区,启动子区没有明显的位置定义,大家也只是 猜测它的大体位置,如果你要研究 promoter 区的话,建议你选择转录起始位点前的 2000 个碱基进行研究,一般默认的是这样。当然你如果觉得长度太长不好研究的话,也可以只研 究-1000 到 0 这一千个碱基,因为一般情况下,启动子区的变异都在这个区域内。 这样大家就可以找到自己的目的基因序列和启动子了,这种方法可能使用的人不是很 多,但我个人比较喜欢,因为它最大的优点是可以找到启动子区域和其他调控区域。希望大 家可以发帖交流,让我们把 NCBI 用的更好!   5 
一步一步教你使用 NCBI 苏州大学生命科学学院医学遗传  第二部分 如何查找连续的 mRNA、cDNA、蛋白序列(依 然以人类的 IL6 为例) 1.进入 NCBI 主页:http://www.ncbi.nlm.nih.gov/ 在 search 后面选择 Gene,在 for 后面填写需要查找的基因的名字。如图所示: 点击“Go”,出现以下界面: 出现了很多基因序列,在每个序列的右边还有“Order cDNA clone” 的链接,这些序 列中有些序列是跟你的目的基因同名的,有些是别名(Other Aliases)与你的目的基因一 致,根据每个序列的介绍认真选择你的目的基因。上图中我需要的 IL6 是标号为 2 的序列。 2.1 查找 cDNA 序列 2.1.1 点击 Order cDNA clone, 出现目的页面如图所示:   6 
一步一步教你使用 NCBI 苏州大学生命科学学院医学遗传  2.1.2 点击 Clone Sequence 后面的链接即可得到 cDNA 序列。点击后如图所示(只抓 取其中一部分): 2.2 查找 mRNA、蛋白序列 回到步骤 1 点击“Go”之后出现的页面,点击目的基因的名字,出现以下页面(只抓取   7 
一步一步教你使用 NCBI 苏州大学生命科学学院医学遗传  相关部分): 页面的下半部分,即可以获取 mRNA 和蛋白序列的部分: 找到“NCBI Reference Sequences (RefSeq)”,它分为几个板块,第一个“mRNA and Protein ”区可以让我们找到连续的编码 mRNA 序列和蛋白序列。在 mRNA and Protein   8 
分享到:
收藏