手机用户可
保存上方二维码到手机中,在
微信扫一扫中右上角选择“从
相册选取二维码”即可。
1、名词解释 直系同源(Orthologous)
点击查看答案
本题答案:指不同种类的同源序列,他们是在物种的形成事件中从一个祖
本题解析:试题答案指不同种类的同源序列,他们是在物种的形成事件中从一个祖先序列独立进化而成的,可能有相似功能,也可能没有。
2、单项选择题 GenBank数据库中的登录号AAR19268是()。
A.水稻的DNA序列
B.水稻的蛋白质序列
C.人类的DNA序列
D.人类的蛋白质序列
点击查看答案
本题答案:A
本题解析:暂无解析
3、名词解释 开放阅读框(ORF)
点击查看答案
本题答案:开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱
本题解析:试题答案开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列。
4、问答题 简述DNA计算实现方式中,表面方式与试管方式相比具有哪些优点?
点击查看答案
本题答案:试管方式:就是在一个或多个试管的溶液里进行生化反应;<
本题解析:试题答案试管方式:就是在一个或多个试管的溶液里进行生化反应;
表面方式:是将对应的解空间的D NA分子固定在一块固体上,其次进行各种生化反应,或是在表面逐步形成解空间,然后根据具体问题对所有可能的解进行筛选,最后得到运算结果。
(1)操作简单,易于实现自动化操作;
(2)减少人为操作过程中造成的DNA分子的丢失及其它操作失误;
(3)减少分子在表面上的相互作用,同时增强分子间的特异性结合;
(4)信息储存密度大,据估计,10毫克DNA表面上的储存密度是传统计算姬的10的8次方倍,而在溶液中仅为10的5次方倍;
(5)结果易于纯化。
5、问答题 简述人类基因组研究计划的历程。
点击查看答案
本题答案:通过国际合作,用15年时间(1990-2005)至少投
本题解析:试题答案通过国际合作,用15年时间(1990-2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA的全部核苷酸序列,定位约10万基因,并对其他生物进行类似研究。
1990,人类基因组计划正式启动。
1996,完成人类基因组计划的遗传作图,启动模式生物基因组计划。
1998完成人类基因组计划的物理作图,开始人类基因组的大规模测序。Celera公司加入,与公共领域竞争启动水稻基因组计划。
1999,第五届国际公共领域人类基因组测序会议,加快测序速度。
2000,Celera公司宣布完成果蝇基因组测序,国际公共领域宣布完成第一个植物基因组——拟南芥全基因组的测序工作。
2001,人类基因组“中国卷”的绘制工作宣告完成。
2003,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的.目标全部实现。
2004,人类基因组完成图公布
6、单项选择题 RGP是()。
A.在线人类孟德尔遗传数据
B.国家核酸数据库
C.人类基因组计划
D.水稻基因组计划
点击查看答案
本题答案:D
本题解析:暂无解析
7、填空题 二级结构的三种状态:(),()和()
点击查看答案
本题答案:α螺旋;β折叠;β转角
本题解析:试题答案α螺旋;β折叠;β转角
8、问答题 人类基因组计划与生物信息学有什么关系?
点击查看答案
本题答案:人类基因组计划的实施,促进了测序技术的迅猛发展,从而使实验数
本题解析:试题答案人类基因组计划的实施,促进了测序技术的迅猛发展,从而使实验数据和可利用信息急剧增加,信息的管理和分析成为基因组计划的一项重要的工作。而这些数据信息的管理、分析、解释和使用促使了生物信息学的产生和迅速发展。
9、单项选择题 Blast结果中HSP的含义是()。
A.空位
B.期望值
C.过滤
D.高分配对片段
点击查看答案
本题答案:D
本题解析:暂无解析
10、名词解释 HGP(human genome project)
点击查看答案
本题答案:人类基因组计划,1990年由美国能源部(DOE)和国立
本题解析:试题答案人类基因组计划,1990年由美国能源部(DOE)和国立健康研究院(NIH)资助的一个研究计划。
目的是:
①鉴定出人类的所有基因;
②确定构成人类基因组的约30亿个碱基对的序列;
③将上述信息储存于专门的数据库中,并开发出相应的分析工具;
④研究由此而产生的伦理、法律和社会问题并提出相应对策。
11、问答题 你认为生物信息学有什么用?对你的生活、研究有影响吗?
点击查看答案
本题答案:(1)主要用于:
在基因组分析方面:生物序列相似
本题解析:试题答案(1)主要用于:
在基因组分析方面:生物序列相似性比较及其数据库搜索、基因预测、基因组进化和分子进化、蛋白质结构预测等
在医药方面:新药物设计、基因芯片疾病快速诊断、流行病学研究:SARS、人类基因组计划、基因组计划:基因芯片。
(2)指导研究和实验方案,减少操作性实验的量;验证实验结果;为实验结果提供更多的支持数据等材料。
12、名词解释 空位罚分
点击查看答案
本题答案:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中
本题解析:试题答案空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。
13、问答题 生物信息学研究意义?
点击查看答案
本题答案:(1)认识生物本质
了解生物分子信息的组织和
本题解析:试题答案(1)认识生物本质
了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。
(2)改变生物学的研究方式
改变传统研究方式,引进现代信息学方法
(3)在医学上的重要意义
为疾病的诊断和治疗提供依据,为设计新药提供依据
14、单项选择题 利用中国知网文献数据库(中国知网)查找论文题目是“日光温室光温因子对黄瓜叶绿体超微结构及其功能的影响”发表的期刊是()。
A.园艺学报
B.应用生态学报
C.生态学报
D.遗传学报
点击查看答案
本题答案:B
本题解析:暂无解析
15、填空题 序列比对的基本思想,是找出()和()的相似性,就是通过在序列中插入()的方法使所比较的序列长度达到一致。比对的数学模型大体分为两类,分别是()和()。
点击查看答案
本题答案:检测基因;目标序列;空位;整体比对;局部比对
本题解析:试题答案检测基因;目标序列;空位;整体比对;局部比对
16、名词解释 标度树
点击查看答案
本题答案:分支长度与相邻节点对的差异程度成正比的树。
本题解析:试题答案分支长度与相邻节点对的差异程度成正比的树。
17、问答题 假设你得到一段未知蛋白的氨基酸序列,从你学习到的生物信息学分析方法和软件,设计一个分析流程来分析该未知蛋白的功能和家族类别以及其结构预测。
点击查看答案
本题答案:1、用该序列进行BLASTP搜索。
2、再对
本题解析:试题答案1、用该序列进行BLASTP搜索。
2、再对其进行蛋白质结构域、功能域的搜索,可以用Znterproscan、Pfam,并对其进行结构分析。
3、再用ClustW进行多序列比对。
4、用人工神经网络的方法对其结构进行结构预测。
18、名词解释 Ab initio prediction
点击查看答案
本题答案:蛋白质三级结构预测方法—从头预测法,在既没有已知结构的同源蛋
本题解析:试题答案蛋白质三级结构预测方法—从头预测法,在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,只能采用从头预测方法,即(直接)仅仅根据序列本身来预测其结构。
19、名词解释 DDBJ
点击查看答案
本题答案:日本DNA数据库,主要向研究者收集DNA序列信息并赋予
本题解析:试题答案日本DNA数据库,主要向研究者收集DNA序列信息并赋予其数据存取号,信息来源主要是日本的研究机构,也接受其他国家呈递的序列。
20、名词解释 序列注释
点击查看答案
本题答案:是指从原始序列数据中获得有用的生物学信息。这主要是指基
本题解析:试题答案是指从原始序列数据中获得有用的生物学信息。这主要是指基因组DNA中寻找基因和其他功能元件(结构注释),并给出这些序列的功能(功能注释)。
21、单项选择题 Bioinformatics的含义是()。
A.生物信息学
B.基因组学
C.蛋白质组学
D.表观遗传学
点击查看答案
本题答案:A
本题解析:暂无解析
22、问答题 UniGene数据库主要收集什么样的数据?
点击查看答案
本题答案:UniGene数据库称得上是一个实验性质的系统,它通过
本题解析:试题答案UniGene数据库称得上是一个实验性质的系统,它通过程序自动将GenBank中的基因序列划分到某个非冗余的基于基因的集合中。这样,每个UniGene集合就代表了一个独特的基因,并包含了与这个基因相关的信息。
23、名词解释 互补序列(complementary sequence)
点击查看答案
本题答案:能够与其他DNA片段根据碱基互补序列(A与T配对,G与
本题解析:试题答案能够与其他DNA片段根据碱基互补序列(A与T配对,G与C配对)形成两练结构的核苷酸序列。
24、名词解释 Gene Ontology 协会
点击查看答案
本题答案:编辑一组动态的、可控的基因产物不同方面性质的字汇的协会
本题解析:试题答案编辑一组动态的、可控的基因产物不同方面性质的字汇的协会。从3个方面描述基因产物的性质,即,分子功能,生物过程,细胞区室。
25、名词解释 查询序列(query sequence)
点击查看答案
本题答案:也称被检索序列,用来在数据库中检索并进行相似性比较的序
本题解析:试题答案也称被检索序列,用来在数据库中检索并进行相似性比较的序列。
26、单项选择题 隐马尔科夫模型的代号是()。
A.HMM
B.CDD
C.HTGS
D.GSS
点击查看答案
本题答案:A
本题解析:暂无解析
27、名词解释 structure domain
点击查看答案
本题答案:结构域,是在蛋白质三级结构中介于二级和三级结构之间的可
本题解析:试题答案结构域,是在蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元,每个结构域自身形成紧实的三维结构,可以独立存在或折叠,但结构域与结构域之间关系较为松散。
28、单项选择题 DDBJ的含义是()。
A.美国国家生物信息中心
B.欧洲分子生物学实验室
C.日本DNA数据库
D.中国基因组研究中心
点击查看答案
本题答案:C
本题解析:暂无解析
29、填空题 检测系统发育树可靠性的技术:()和()
点击查看答案
本题答案:bootstrapping;Jack-knifing
本题解析:试题答案bootstrapping;Jack-knifing
30、单项选择题 没有直接参与完成人类基因组计划的国家是()。
A.英国
B.中国
C.俄罗斯
D.德国
点击查看答案
本题答案:C
本题解析:暂无解析
31、问答题 预测蛋白质三级结构的三种方法
点击查看答案
本题答案:1)同源建模法:依据蛋白质与已知结构蛋白比对信息构建3
本题解析:试题答案1)同源建模法:依据蛋白质与已知结构蛋白比对信息构建3D模型;
2)折叠识别法:寻找与未知蛋白最合适的模板,进行序列与结构比对,最终建立结构模型;
3)从头预测法:根据序列本身从头预测蛋白质结构。
32、名词解释 比较基因组学
点击查看答案
本题答案:是在基因组图谱和测序的基础上,利用某个基因组研究获得的信息推
本题解析:试题答案是在基因组图谱和测序的基础上,利用某个基因组研究获得的信息推测其他原核生物、真核生物类群中的基因数目、位置、功能、表达机制和物种进化的学科。
33、名词解释 coiled coil
点击查看答案
本题答案:卷曲螺旋,是蛋白质中由2~7条α螺旋链相互
本题解析:试题答案卷曲螺旋,是蛋白质中由2~7条α螺旋链相互缠绕形成类似麻花状结构的总称。卷曲螺旋是控制蛋白质寡聚化的元件,在机体内执行着分子识别、代谢调控、细胞分化、肌肉收缩、膜通道等生物学功能。
34、问答题 国际上权威的核酸序列数据库有那些?
点击查看答案
本题答案:(1)欧洲分子生物学实验室的EMBL。
(2
本题解析:试题答案(1)欧洲分子生物学实验室的EMBL。
(2)美国生物技术信息中心的GenBank。
(3)日本遗传研究所的DDBJ。
35、问答题 HGP选择作为研究人类的四大“模式生物“有哪些?
点击查看答案
本题答案:酵母、线虫、果蝇、小鼠。
本题解析:试题答案酵母、线虫、果蝇、小鼠。
36、问答题 简述常用的引物设计软件的名称和各自特点。
点击查看答案
本题答案:首先是引物分析评论功能,该功能只有少数商业版软件能够做
本题解析:试题答案首先是引物分析评论功能,该功能只有少数商业版软件能够做到,其中以“Oligo6”最优秀;其次是引物的自动搜索功能,各种软件在这方面的侧重点不同,因此自动搜索的结果也不尽相同。自动搜索功能以“PremierPrimer”为最强且方便实用,“Oligo6”其次,其他软件如“VectorNTISuit”、“Dnasis”、“Omiga”和“Dnastar”都带有引物自动搜索功能,但搜索结果不是十分理想。要想得到效果很好的引物,在自动搜索的基础上还要辅以人工分析。
37、问答题 如何查找由Rao Y 实验室于2005以后发表的,文章主题中与brain有关的文献,写出检索语言。
点击查看答案
本题答案:Brain[ti] AND RaoY[au] AND
本题解析:试题答案Brain[ti] AND RaoY[au] AND 2005:2013[dp]
38、单项选择题 domain的含义是()。
A.基序
B.跨叠克隆群
C.碱基对
D.结构域
点击查看答案
本题答案:D
本题解析:暂无解析
39、名词解释 neighbor—joining method
点击查看答案
本题答案:邻接法,基于最小进化原理经常被使用的一种算法,它不检验所有可
本题解析:试题答案邻接法,基于最小进化原理经常被使用的一种算法,它不检验所有可能的拓扑结构,能同时给出拓扑结构和分支长度。在重建系统发生树时,认为在进化分子上,发生趋异的次数可以不同,它是最有效的的基于距离数据重建系统树的方法之一。
40、问答题 如何判断起始密码子?内含子?
点击查看答案
本题答案:AUG甲硫氨酸(met)
内含子(5&rsq
本题解析:试题答案AUG甲硫氨酸(met)
内含子(5’-GT……AG-3’)
41、名词解释 基因预测(geneprediction)
点击查看答案
本题答案:用计算机程序对可能的基因所做的预测,它是基于DNA片段
本题解析:试题答案用计算机程序对可能的基因所做的预测,它是基于DNA片段与已知基因序列的匹配程度的。
42、单项选择题 根据研究发现,人类基因组中真正编码蛋白质的区域仅占DNA序列的()。
A.1-2%
B.3-5%
C.5-10%
D.10-20%
点击查看答案
本题答案:B
本题解析:暂无解析
43、名词解释 替换(substitution)
点击查看答案
本题答案:在指定的位置不相同的氨基酸进行连配,如果联配的残基有相
本题解析:试题答案在指定的位置不相同的氨基酸进行连配,如果联配的残基有相似的物化性质,那么替换是保守的。
44、问答题 MEGA2如何将其它多序列比对格式文件转化为MEGE格式的多序列比对文件?
点击查看答案
本题答案:(1)选择菜单file,
(2)选择Text
本题解析:试题答案(1)选择菜单file,
(2)选择Text File Editorand Format Coverter工具,
(3)调入需要转换的序列和相应的格式,
(4)获得转换后的MEGA格式的文件并保存。
45、名词解释 聚类分析
点击查看答案
本题答案:就是将数据分成若干簇(cluster),簇内最大程度相
本题解析:试题答案就是将数据分成若干簇(cluster),簇内最大程度相似,簇间最大程度相异。某一状态的出现概率仅取决于其前驱的k个状态,k阶马尔可夫模型
46、名词解释 BLOSUM矩阵
点击查看答案
本题答案:模块替代矩阵。矩阵中的每个位点的分值来自蛋白比对的局部
本题解析:试题答案模块替代矩阵。矩阵中的每个位点的分值来自蛋白比对的局部块中的替代频率的观察。每个矩阵适合特定的进化距离。例如,在BLOSUM62矩阵中,比对的分值来自不超过62%一致率的一组序列。
47、名词解释 算法(algorithm)
点击查看答案
本题答案:在计算机程序中包含的一种固定过程。
本题解析:试题答案在计算机程序中包含的一种固定过程。
48、填空题 多序列联配的常用软件:()
点击查看答案
本题答案:Clustal
本题解析:试题答案Clustal
49、名词解释 模体(motif)
点击查看答案
本题答案:短的保守的多肽段,含有相同模体的蛋白质不一定是同源的,
本题解析:试题答案短的保守的多肽段,含有相同模体的蛋白质不一定是同源的,一般10-20个残基。
50、名词解释 信息位点
点击查看答案
本题答案:由位点产生的突变数目把其中的一课树与其他树区分开的位点
本题解析:试题答案由位点产生的突变数目把其中的一课树与其他树区分开的位点。
51、填空题 用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括()
点击查看答案
本题答案:输入层,隐含层和输出层
本题解析:试题答案输入层,隐含层和输出层
52、问答题 先导化合物的来源有四种来源
点击查看答案
本题答案:1)通过偶然性观察发现的先导化合物(这个方法最著名的例
本题解析:试题答案1)通过偶然性观察发现的先导化合物(这个方法最著名的例子就是亚历山大.弗莱明发现的青霉素,今天所用的许多抗生素皆由其发展出来)
2)也可以通过替代疗法的药物开发中发现的药物副作用来识别先导化合物(例如,镇定剂氯化物丙嫀是在试验中发现用在抗组胺剂时被发现的)
3)先导化合物也可以来自传统医药学(如奎宁化合物就来自金鸡纳的树皮)
4)先导化合物也可以来自天然的底物或是配体(比如说,肾上腺素作为舒喘宁的类似物用来治疗哮喘)
53、名词解释 MEGA(Molecular Evolutionary Genetics Analysis)
点击查看答案
本题答案:是一款免费的构树软件,它提供了序列比对、格式转换、数据
本题解析:试题答案是一款免费的构树软件,它提供了序列比对、格式转换、数据修订、距离计算、系统树重建和可信度评估等全套功能,能对DNA、mRNA氨基酸序列及遗传距离进行系统发生分析以及基因分化年代的分析。
54、名词解释 除权配对算法(UPGMA)
点击查看答案
本题答案:最初,每个序列归为一类,然后找到距离最近的两类将其归为
本题解析:试题答案最初,每个序列归为一类,然后找到距离最近的两类将其归为一类,定义为一个节点,重复这个过程,直到所有的聚类被加入,最终产生树根。
55、问答题 为什么蛋白质空间结构预测很重要,目前有哪几条途径用于从蛋白质的氨基酸序列预测其空间三维结构?
点击查看答案
本题答案:蛋白质空间结构的预测很重要。研究蛋白质结构,有助于了解
本题解析:试题答案蛋白质空间结构的预测很重要。研究蛋白质结构,有助于了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相互作用,通过分析蛋白质的结构,确认功能单位或者结构域,可以为遗传操作提供目标,为设计新的蛋白质或改造已有蛋白质提供可靠的依据,同时为新的药物分子设计提供合理的靶分子结构。
目前有三条途径用于从蛋白质一级序列预测其空间三维结构:
A、同源建模法。是蛋白质三维结构预测的主要方法。对于一个未知结构的蛋白质,首先通过序列同源分析找到一个已知结构的同源蛋白质,然后,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。前提是必须要有一个已知结构的同源蛋白质。
B、穿针引线法。需建立核心折叠数据库,在预测蛋白质空间结构时将一个待预测结构的蛋白质序列与数据库中核心折叠进行比对,找出比对结果最好的核心折叠,作为构造待预测蛋白质结构模型的根据。
C、从头开始法。在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,直接根据序列本身来预测其结构。该方法先对蛋白质及溶剂作近似处理,再建立能量函数,通过对构象空间进行快速搜索找到与某一全局最小能量相对应的构象。
56、单项选择题 OMIM是()。
A.在线人类孟德尔遗传数据库
B.国家核酸数据库
C.人类基因组计划
D.水稻基因组计划
点击查看答案
本题答案:A
本题解析:暂无解析
57、问答题 简述构建进化树的步骤,每一步列举1-2种使用的软件或统计学方法。
点击查看答案
本题答案:(1)多序列比对:ClustalW
(2)校对比
本题解析:试题答案(1)多序列比对:ClustalW
(2)校对比对结果:BIOEDIT
(3)建树:MEGA
(4)评估系统发育信号和进化树的牢固度:自举法(Bootstrap)
58、单项选择题 蛋白质基序(motif)中[ST]的含义是()。
A.氨基酸为ST
B.氨基酸为S和T
C.氨基酸为S或T
D.除掉S和T之外的任意氨基酸
点击查看答案
本题答案:C
本题解析:暂无解析
59、问答题 GBFF格式的特性表格式包括哪三个部分?
点击查看答案
本题答案:特性表格式包含三个部分:
第一,特性关键词(
本题解析:试题答案特性表格式包含三个部分:
第一,特性关键词(Featurekey);
第二,特性位置(Location);
第三,限定词(Qualifiers)
60、名词解释 序列的比对
点击查看答案
本题答案:是一种关于序列相似性的定性描述:在什么区域相似,在什么
本题解析:试题答案是一种关于序列相似性的定性描述:在什么区域相似,在什么区域存在差别。最优比对:揭示两条序列的最大相似程度。(又叫序列联配,其意义在于从核酸、氨基酸的层次分析序列的相似性,推测其结构功能及进化上的联系,是基因识别、分子进化、生命起源研究的基础。
61、填空题 蛋白质质谱数据搜索工具:()
点击查看答案
本题答案:SEQUEST
本题解析:试题答案SEQUEST
62、单项选择题 多序列比对工具是()。
A.BLAST
B.ClustalW
C.Mega
D.GCG
点击查看答案
本题答案:B
本题解析:暂无解析
63、单项选择题 SAGE的含义是()。
A.基因表达连续分析
B.聚丙烯酰胺凝胶电泳
C.基因组分析
D.双向电泳分析
点击查看答案
本题答案:A
本题解析:暂无解析
64、问答题 真核基因结构识别主要包含哪些内容?
点击查看答案
本题答案:(1)ORF识别及其可靠性验证:确定DNA序列的编码区
本题解析:试题答案(1)ORF识别及其可靠性验证:确定DNA序列的编码区
(2)启动子及转录因子结合位点分析:CAP序列、识别区、解旋区、转录起始位点
(3)重复序列分析:哺乳动物基因组中存在大量重复序列,由于重复序列的大量存在常会影响序列的正确分析,因此在对真核基因进行分析前,最好能把重复序列找出来,并从序列中屏蔽掉
(4)CpGisland:可以为基因及其启动子的预测提供重要的线索
(5)3’UTR区:真核生物的转录终止信号是在3’UTR区
65、单项选择题 GenBank数据库的基本信息单位是()。
A.FASTA
B.GBFF
C.GCG
D.ASN.1
点击查看答案
本题答案:B
本题解析:暂无解析
66、名词解释 注释(annotation)
点击查看答案
本题答案:对数据库中原始的DNA碱基序列添加相关信息(比如编码的
本题解析:试题答案对数据库中原始的DNA碱基序列添加相关信息(比如编码的基因,氨基酸序列等)或其他的注解。
67、问答题 生物信息学在基因芯片中的应用有哪些?
点击查看答案
本题答案:(1)确定芯片检测目标。
(2)芯片设计。<
本题解析:试题答案(1)确定芯片检测目标。
(2)芯片设计。
(3)实验数据管理与分析。
68、填空题 初级序列数据库:()
点击查看答案
本题答案:GenBank,EMBL和DDBJ
本题解析:试题答案GenBank,EMBL和DDBJ
69、名词解释 promoter
点击查看答案
本题答案:启动子,是RNA聚合酶识别、结合并开始转录所必需的一段DNA
本题解析:试题答案启动子,是RNA聚合酶识别、结合并开始转录所必需的一段DNA序列。
70、问答题 什么是物种的标记序列?
点击查看答案
本题答案:指物种特有的一段核苷酸序列。可以通过相似性查询,得到某
本题解析:试题答案指物种特有的一段核苷酸序列。可以通过相似性查询,得到某一序列在数据库中的某一物种中反复出现,且在其他物种中没有的明显相似的序列。
71、单项选择题 LCR的含义是()。
A.编码区
B.非编码区
C.低复杂度区域
D.开放阅读框
点击查看答案
本题答案:C
本题解析:暂无解析
72、问答题 生物信息学步入后基因组时代后,其发展方向有哪几个方面。
点击查看答案
本题答案:生物信息学步入后基因组时代后,其发展方向主要有:
本题解析:试题答案生物信息学步入后基因组时代后,其发展方向主要有:
①各种生物基因组测序及新基因的发现;
②单核苷酸多态性(SNP)分析;
③基因组非编码区信息结构与分析;
④比较基因组学和生物进化研究;
⑤蛋白质结构和功能的研究。
73、多项选择题 真核基因组特点包括()
A.基因组大,巨大的非编码序列,重复序列占了绝大部分
B.基因结构复杂,无显著长度的开放阅读框
C.存在可变剪接
D.CpG岛
E.等值区
点击查看答案
本题答案:A, B, C, D, E
本题解析:暂无解析
74、单项选择题 Proteomics的含义是()。
A.生物信息学
B.基因组学
C.蛋白质组学
D.表观遗传学
点击查看答案
本题答案:C
本题解析:暂无解析
75、单项选择题 TAIR(AtDB)数据库是()。
A.线虫基因组
B.果蝇基因组
C.拟南芥数据库
D.大肠杆菌基因组
点击查看答案
本题答案:C
本题解析:暂无解析
76、问答题 指出下列特殊标识符的格式?
点击查看答案
本题答案:①序列辨认号(GI):一串阿拉伯数字
②Ge
本题解析:试题答案①序列辨认号(GI):一串阿拉伯数字
②GenBank/EMBL/DDBJ序列接受号:
1个字母+5个阿拉伯数字;1个字母+6个阿拉伯数字
③RefSeq序列接受号:带“-”
mRNA记录(NM*);完整的基因组或染色体(NC*)
④PDB序列接受号:1个阿拉伯数字+3个字母
77、单项选择题 ortholog的含义是()。
A.直系同源
B.旁系同源
C.直接进化
D.间接进化
点击查看答案
本题答案:A
本题解析:暂无解析
78、名词解释 表谱(PSSM)
点击查看答案
本题答案:指一张基于多序列比对的打分表,表示一个蛋白质家族,可以
本题解析:试题答案指一张基于多序列比对的打分表,表示一个蛋白质家族,可以用来搜索序列数据库。
79、单项选择题 提交序列到GenBank中,使用的程序可以是()。
A.Entrez
B.SRS
C.Medline
D.BankIt
点击查看答案
本题答案:D
本题解析:暂无解析
80、名词解释 RefSeq
点击查看答案
本题答案:给出了对应于基因和蛋白质的索引号码,对应于最稳定、最被人承认
本题解析:试题答案给出了对应于基因和蛋白质的索引号码,对应于最稳定、最被人承认的Genbank序列。
81、填空题 提供蛋白质功能注释信息的数据库:()(京都基因和基因组百科全书)和()(蛋白质信息资源)
点击查看答案
本题答案:KEGG;PIR
本题解析:试题答案KEGG;PIR
82、名词解释 基因预测的从头分析
点击查看答案
本题答案:依据综合利用基因的特征,如剪接位点,内含子与外显子边界
本题解析:试题答案依据综合利用基因的特征,如剪接位点,内含子与外显子边界,调控区,预测基因组序列中包含的基因。
83、名词解释 多序列比对
点击查看答案
本题答案:通过序列的相似性检索得到许多相似性序列,将这些序列做一
本题解析:试题答案通过序列的相似性检索得到许多相似性序列,将这些序列做一个总体的比对,以观察它们在结构上的异同,来回答大量的生物学问题。
84、问答题 什么是序列比对?及其基本分类?
点击查看答案
本题答案:序列比对(Sequence Alignment)是通过
本题解析:试题答案序列比对(Sequence Alignment)是通过在序列中搜索一系列单个性状或性状模式来比较2个(双序列比对)或更多(多重序列比对)序列的方法。
序列比对的分类:
A、双序列比对:两条序列的比对。
B、多序列比对:三条或以上序列的比对
85、名词解释 反式调控元件
点击查看答案
本题答案:远离所调控的编码序列,通常位于不同的染色体上。
本题解析:试题答案远离所调控的编码序列,通常位于不同的染色体上。
86、名词解释 BioEdit
点击查看答案
本题答案:BioEdit是一个序列编辑器与分析工具软件。功能包括
本题解析:试题答案BioEdit是一个序列编辑器与分析工具软件。功能包括:序列编辑、外挂分析程序、RNA分析、寻找特征序列、支持超过20000个序列的多序列文件、基本序列处理功能、质粒图绘制等等。
87、名词解释 GenBank
点击查看答案
本题答案:是美国全国卫生研究所维护的基因序列数据库,汇集并注释了
本题解析:试题答案是美国全国卫生研究所维护的基因序列数据库,汇集并注释了所有公开的核酸序列,与日本的DNA数据库DDBJ以及欧洲分子实验室核酸序列数据库EMBL一起,都是国际核苷酸序列数据库合作的成员。
88、名词解释 虚拟细胞
点击查看答案
本题答案:一种建模手段,把细胞定义为许多结构,分子,反应和物质流
本题解析:试题答案一种建模手段,把细胞定义为许多结构,分子,反应和物质流的集合体。
89、名词解释 系统发生(phylogeny)
点击查看答案
本题答案:是指生物种族的进化历史,亦即生物体在整个进化谱
本题解析:试题答案是指生物种族的进化历史,亦即生物体在整个进化谱
90、名词解释 近邻
点击查看答案
本题答案:任意一颗无根树中仅被一个内部节点分隔的一对物种。
本题解析:试题答案任意一颗无根树中仅被一个内部节点分隔的一对物种。
91、名词解释 BLAST
点击查看答案
本题答案:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行
本题解析:试题答案基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。
92、单项选择题 单核苷酸标记是()。
A.RFLP
B.SNP
C.SSR
D.RAPD
点击查看答案
本题答案:A
本题解析:暂无解析
93、名词解释 分子进化树(molecular evolutionary tree)
点击查看答案
本题答案:在研究生物进化和系统分类中,常用一种类似树状分支的图形
本题解析:试题答案在研究生物进化和系统分类中,常用一种类似树状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形成为系统发育树(phylogenetictree)。
94、问答题 BLAST应用有哪些?
点击查看答案
本题答案:BLAST应用:
1.是序列分析的基础; 本题解析:试题答案BLAST应用:
1.是序列分析的基础;
2.评价实验结果;
3.为实验提供新思路,并指导进一步实验设计;
4.是寻找和鉴定新基因的重要手段;
5.是蛋白质结构预测和分子设计的基础;
6.是研究生物进化和种属分类的基本方法。
95、填空题 测试基因预测程序正确预测基因的能力的项目是()(基因预测评估项目)
点击查看答案
本题答案:GASP
本题解析:试题答案GASP
96、问答题 NCBI维护的核苷酸数据库由哪几部分组成的,其主要的内容是什么?
点击查看答案
本题答案:由三部分组成:表达序列标签序列、基因组测序序列、核心核
本题解析:试题答案由三部分组成:表达序列标签序列、基因组测序序列、核心核苷酸序列。
97、问答题 在基因组序列分析方面,科学家关注哪些信息?
点击查看答案
本题答案:就人类基因组而言,编码区域在人类基因组所占的比例不超过
本题解析:试题答案就人类基因组而言,编码区域在人类基因组所占的比例不超过3%。其余97%是非编码序列。对于非编码序列,人们了解得比较少,尚不清楚其含义或功能。然而,非编码区域对于生命活动具有重要的意义。这部分序列主要包括内含子、简单重复序列、移动元件(mobileelement)及其遗留物、伪基因(pseudogene)等。
98、填空题 蛋白质组研究的三大关键核心技术是()、()、()。
点击查看答案
本题答案:双向凝胶电泳技术;质谱鉴定技术;计算机图像数据处理与蛋白质数
本题解析:试题答案双向凝胶电泳技术;质谱鉴定技术;计算机图像数据处理与蛋白质数据库
99、多项选择题 人类基因组计划要完成的几张图谱分别是()
A.物理图谱
B.遗传图谱
C.序列图谱
D.生物图谱
E.基因图谱
点击查看答案
本题答案:A, B, C, E
本题解析:暂无解析
100、名词解释 Clustsl X
点击查看答案
本题答案:是CLUSTAL多重序列比对程序的Windows版本,
本题解析:试题答案是CLUSTAL多重序列比对程序的Windows版本,是用来对核酸与蛋白序列进行多序列比较的程序,也可以对来自不同物种的功能或结构相似的序列进行比对和聚类,通过重建系统发生树判断亲缘关系,并对序列在生物进化过程中的保守性进行估计。
101、名词解释 马尔可夫链
点击查看答案
本题答案:具有马尔可夫特性的离散状态随机过程。
本题解析:试题答案具有马尔可夫特性的离散状态随机过程。
102、名词解释 一致序列
点击查看答案
本题答案:这些序列是指把多序列联配的信息压缩至单条序列,主要的缺
本题解析:试题答案这些序列是指把多序列联配的信息压缩至单条序列,主要的缺点是除了在特定位置最常见的残基之外,它们不能表示任何概率信息。
103、问答题 如何选择合适的评分矩阵?
点击查看答案
本题答案:一般来说,在局部相似性搜索上,BLOSUM矩阵较PAM
本题解析:试题答案一般来说,在局部相似性搜索上,BLOSUM矩阵较PAM要好
当比较距离相近的蛋白时,应选择低的PAM或高的BLOSUM矩阵;当比较距离较远的蛋白时,应选择高的PAM或低的BLOSUM矩阵
对于数据库搜索来说一般选择BLOSUM62矩阵
PAM矩阵可用于寻找蛋白质的进化起源,BLOSUM矩阵用于发现蛋白质的保守域
104、单项选择题 利用中国知网文献数据库(中国知网)查找论文题目是“扩张蛋白家族蛋白序列分析”发表在期刊“生物信息学”2008年第7卷第3期上()。
A.第3-5页
B.第93-95页
C.第193-195页
D.第293-295页
点击查看答案
本题答案:C
本题解析:暂无解析
105、单项选择题 下列Fasta格式正确的是()。
A.seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta
B.>seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta
C.seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta
D.>seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta
点击查看答案
本题答案:B
本题解析:暂无解析
106、名词解释 系统发育分析
点击查看答案
本题答案:通过一组相关的基因或者蛋白质的多序列比对或其他性状,可
本题解析:试题答案通过一组相关的基因或者蛋白质的多序列比对或其他性状,可以研究推断不同物种或基因之间的进化关系。
107、问答题 如何进行BLAST结果显著性判断?
点击查看答案
本题答案:结果显著性判断:查看E值列表;查看比对情况。
本题解析:试题答案结果显著性判断:查看E值列表;查看比对情况。
(1.E值是不是显著;
2.两个蛋白质是不是具有近似的大小;
3.两个蛋白质是否有共同的模体或信号序列;
4.两个蛋白质是不是一个合理的多序列比对的一部分;
5.两个蛋白质是否有一个相似的生物学功能;
6.两个蛋白质是否具有相似的3维结构。
7.如果一个BLAST搜索得到一个对另一个蛋白质的边缘匹配,以这个具有较远亲缘关系的蛋白质作为查询项再进行一次新的BLAST搜索。)
108、问答题 序列的相似性与同源性有什么区别与联系?
点击查看答案
本题答案:相似性是指序列之间相关的一种量度,两序列的的相似性可以
本题解析:试题答案相似性是指序列之间相关的一种量度,两序列的的相似性可以基于序列的一致性的百分比;而同源性是指序列所代表的物种具有共同的祖先,强调进化上的亲缘关系。
109、单项选择题 利用PubMed文献数据查找论文“Enhancing phytoremediation through the use of transgenics and endophytes”发表的期刊是()。
A.New Phytol
B.Gene
C.Nature
D.Plant Phsiol
点击查看答案
本题答案:A
本题解析:暂无解析
110、问答题 GEO数据库主要收集的是什么样的数据?
点击查看答案
本题答案:基因表达精选集(GEO)数据库存储的是一些准确的基因表
本题解析:试题答案基因表达精选集(GEO)数据库存储的是一些准确的基因表达图谱数据和大规模的分子实验数据
111、名词解释 PSI-BLAST
点击查看答案
本题答案:位点特异性迭代比对。是一种专门化的的比对,通过调节序列打分矩
本题解析:试题答案位点特异性迭代比对。是一种专门化的的比对,通过调节序列打分矩阵(scoringmatrix)探测远缘相关的蛋白。
112、名词解释 PDB(Protein Data Bank)
点击查看答案
本题答案:PDB中收录了大量通过实验(X射线晶体衍射,核磁共振N
本题解析:试题答案PDB中收录了大量通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子的三维结构,记录有原子坐标、配基的化学结构和晶体结构的描述等。PDB数据库的访问号由一个数字和三个字母组成(如,4HHB),同时支持关键词搜索,还可以FASTA程序进行搜索。
113、问答题 基因芯片对于生物分子信息检测的作用和意义?
点击查看答案
本题答案:在生命科学领域中,基因芯片为分子生物学、生物医学等研究
本题解析:试题答案在生命科学领域中,基因芯片为分子生物学、生物医学等研究提供了强有力的手段。利用基因芯片技术,可研究生命体系中不同部位、不同生长发育阶段的基因表达,比较不同个体或物种之间的基因表达,比较正常和疾病状态下基因及其表达的差异。基因芯片技术也有助于研究不同层次的多基因协同作用的生命过程,发现新的基因功能,研究生物体在进化、发育、遗传过程中的规律。
114、名词解释 miRNA
点击查看答案
本题答案:是一类小的非编码单链RNA,由19~25个核苷酸构成,
本题解析:试题答案是一类小的非编码单链RNA,由19~25个核苷酸构成,广泛存在于动植物中,调节着基因表达。
115、名词解释 进化树的二歧分叉结构
点击查看答案
本题答案:指在进化树上任何一个分支节点,一个父分支都只能被分成两
本题解析:试题答案指在进化树上任何一个分支节点,一个父分支都只能被分成两个子分支。
116、单项选择题 EST的含义是()。
A.表达序列标签
B.序列标签位点
C.高通量基因组序列
D.人工合成序列
点击查看答案
本题答案:A
本题解析:暂无解析
117、多项选择题 最常用的序列相似性查询工具是()
A.FASTA
B.BLAST
C.SWISS-PROT
D.PDB
E.PIR
点击查看答案
本题答案:A, B
本题解析:暂无解析
118、问答题 为什么要构建生物分子数据库。
点击查看答案
本题答案:(1)生物分子数据高速增长
(2)分子生物学
本题解析:试题答案(1)生物分子数据高速增长
(2)分子生物学及相关领域研究人员迅速获得最新实验数据。
119、问答题 相比使用BLAST套件搜索数据库,BLAST2工具在结果呈现上有什么优点?
点击查看答案
本题答案:BLAST2序列分析工具,它能进行两条序列的精确比对,
本题解析:试题答案BLAST2序列分析工具,它能进行两条序列的精确比对,同时给出两序列的图形化比对结果和文本形式的联配结果。
120、问答题 什么是序列比对中使用的PAM矩阵和BLOSUM矩阵,它们的作用是什么,一般BLAST选择使用的矩阵是什么
点击查看答案
本题答案:PAM矩阵和BLOSUM矩阵都是用于序列相似性的记分矩
本题解析:试题答案PAM矩阵和BLOSUM矩阵都是用于序列相似性的记分矩阵(scoring matrix)。记分矩阵中含有对齐时具体使用的数值。一般FASTA和BLAST都提供BLOSUM或PAM系列矩阵供选择,若要进行突变性质的进化分析时可以使用PAM,FASTA缺省推荐BLOSUM50矩阵。
PAM矩阵(Point Accepted Mutation)基于进化的点突变模型,如果两种氨基酸替换频繁,说明自然界接受这种替换,那么这对氨基酸替换得分就高。一个PAM就是一个进化的变异单位, 即1%的氨基酸改变,但这并不意味100次PAM后,每个氨基酸都发生变化,因为其中一些位置可能会经过多次突变,甚至可能会变回到原来的氨基酸。
模块替换矩阵BLOSUM(BLOcks Substitution Matrix)首先寻找氨基酸模式,即有意义的一段氨基酸片断(如一个结构域及其相邻的两小段氨基酸序列),分别比较相同的氨基酸模式之间氨基酸的保守性(某种氨基酸对另一种氨基酸的取代数据),然后,以所有 60%保守性的氨基酸模式之间的比较数据为根据,产生BLOSUM60;以所有80%保守性的氨基酸模式之间的比较数据为根据,产生BLOSUM80。
121、问答题 什么是多序列全局比对的累进算法?(三个步骤)
点击查看答案
本题答案:第一,所有的序列之间逐一比对(双重比对);
本题解析:试题答案第一,所有的序列之间逐一比对(双重比对);
第二,生成一个系统树图,将序列按相似性大致分组;
第三,使用系统树图作为引导,产生出最终的多序列比对结果。
122、问答题 你认为,什么是生物信息学?
点击查看答案
本题答案:采用信息科学技术,借助数学、生物学的理论、方法,对各种
本题解析:试题答案采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。
123、名词解释 序列表谱(profile)
点击查看答案
本题答案:是一种特殊位点或模体序列,在多序列比较的基础上,氨基酸
本题解析:试题答案是一种特殊位点或模体序列,在多序列比较的基础上,氨基酸的权值和空位罚分的表格。
124、问答题 生物信息学的目标和任务?
点击查看答案
本题答案:收集和管理生物分子数据;数据分析和挖掘;开发分析工具和
本题解析:试题答案收集和管理生物分子数据;数据分析和挖掘;开发分析工具和实用软件:生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。
125、名词解释 分子钟(molecular clock)
点击查看答案
本题答案:对于每一个给定基因(或蛋白质)其分子进化率大致是恒定的
本题解析:试题答案对于每一个给定基因(或蛋白质)其分子进化率大致是恒定的。
126、名词解释 外类群
点击查看答案
本题答案:是进化树中处于一组被分析物种之外的,具有相近亲缘关系的
本题解析:试题答案是进化树中处于一组被分析物种之外的,具有相近亲缘关系的物种。
127、多项选择题 分析EST序列时首要注意以下几点()
A.EST序列中除了A\G\T\C外,可能出现未知碱基
B.EST只是单次测序,得出的结果没有可信度
C.EST序列中可能出现错误的插入和缺失,导致读码框移位
D.某个EST序列是数据库中另一序列的一个片段
E.某个EST序列不在基因的编码区内
点击查看答案
本题答案:A, C, D, E
本题解析:暂无解析
128、问答题 简要介绍FASTA序列格式
点击查看答案
本题答案:FASTA格式,又叫Pearson格式,是最简单的,使
本题解析:试题答案FASTA格式,又叫Pearson格式,是最简单的,使用最多的格式。它的基本形式分为三个部分:
⑴第一行:大于号(﹥)表示一个新的序列文件的开始,为标记符。后面可以加上文字说明,gi号,GenBank检索号,LOCUS名称等信息。
⑵第二行:序列本身,为DNA的标准符号,通常大小写均可。
⑶结束:无特殊标志,但建议多留一个空行,以便将序列和其他内容区分开。
129、名词解释 BioPerl
点击查看答案
本题答案:是Perl语言专门用于生物信息学、基因组学及其他生命科
本题解析:试题答案是Perl语言专门用于生物信息学、基因组学及其他生命科学领域的工具与函数模块集。
130、名词解释 整体联配(global alignment)
点击查看答案
本题答案:对两个核苷酸或蛋白质序列的全长所进行的比对。
本题解析:试题答案对两个核苷酸或蛋白质序列的全长所进行的比对。
131、名词解释 HMM 隐马尔可夫模型
点击查看答案
本题答案:一种统计模型,它考虑有关匹配、错配和间隔的所有可能的组
本题解析:试题答案一种统计模型,它考虑有关匹配、错配和间隔的所有可能的组合来生成一组序列排列。(课件定义)是蛋白质结构域家族序列的一种严格的统计模型,包括序列的匹配,插入和缺失状态,并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。
132、单项选择题 利用PubMed文献数据查找论文“Cancer epigenetics: from mechanism to therapy”作者的单位是()。
A.University of California
B.University of Columbia
C.University of Cambridge
D.University of Chicago
点击查看答案
本题答案:C
本题解析:暂无解析
133、名词解释 SWLSS—MODE
点击查看答案
本题答案:是目前最著名的蛋白质三级结构预测服务器,建立在已知生物大分子
本题解析:试题答案是目前最著名的蛋白质三级结构预测服务器,建立在已知生物大分子结构基础上,利用同源建模的方法对未知序列的蛋白质三级结构进行预测。
134、名词解释 折叠识别法
点击查看答案
本题答案:寻找与已知蛋白最合适的模板,进行结构和序列比对,最终建
本题解析:试题答案寻找与已知蛋白最合适的模板,进行结构和序列比对,最终建立机构模型。
又称为线索化方法。(另一版本:先假设一个特定的蛋白构象,然后对这一构象进行评估的过程。)
135、名词解释 分子钟
点击查看答案
本题答案:认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通
本题解析:试题答案认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通过分子进化推断出物种起源的时间。
136、名词解释 EST
点击查看答案
本题答案:表达序列标签—是从一个随机选择的cDNA克
本题解析:试题答案表达序列标签—是从一个随机选择的cDNA克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA部分序列,代表一个完整基因的一小部分
137、名词解释 权重矩阵(序列轮廓)
点击查看答案
本题答案:它们表示完全结构域序列,多序列联配中每个位点的氨基酸都
本题解析:试题答案它们表示完全结构域序列,多序列联配中每个位点的氨基酸都有分值,并且特定位置插入或缺失的可能性均有一定的衡量方法(课件定义)。基础上针对特定的应用目标而建立的数据库。
138、问答题 生物信息学所用的方法和技术。
点击查看答案
本题答案:(1)数学统计方法;
(2)动态规划方法;<
本题解析:试题答案(1)数学统计方法;
(2)动态规划方法;
(3)机器学习与模式识别技术;
(4)数据库技术及数据挖掘;
(5)人工神经网络技术;
(6)专家系统;
(7)分子模型化技术;
(8)量子力学和分子力学计算;
(9)生物分子的计算机模拟;
(10)因特网(Internet)技术。
139、问答题 简述邻接法(NJ)构树的算法思想。
点击查看答案
本题答案:邻接法的思想不仅仅计算最小两两比对距离,还对整个树的长
本题解析:试题答案邻接法的思想不仅仅计算最小两两比对距离,还对整个树的长度进行最小化,从而对树的拓扑结构进行限制。这种算法由一棵星状树开始,所有的物种都从一个中心节点出发,然后通过计算最小分支长度的和相继寻找到近邻的两个序列,每一轮过程中考虑所有可能的序列对,把能使树的整个分支长度最小的序列对一组,从而产生新的距离矩阵,直到寻找所有的近邻序列。
140、单项选择题 CDS的含义是()。
A.编码区
B.非编码区
C.低复杂度区域
D.非调控区
点击查看答案
本题答案:A
本题解析:暂无解析
141、问答题 如何用BLAST发现新基因?
点击查看答案
本题答案:从一个一直蛋白质序列开始,通过tBLASTn工具搜索一个DN
本题解析:试题答案从一个一直蛋白质序列开始,通过tBLASTn工具搜索一个DNA数据库,可以找到相应的匹配,如与DNA编码的已知蛋白质的匹配或者与DNA编码的相关蛋白质的匹配。然后通过BLASTx或BLASTp在蛋白质数据库中搜索DNA或蛋白质序列来“确定”一个新基因。
142、问答题 如何处理BLAST后过少或过多的结果?
点击查看答案
本题答案:如何处理过多的结果:限定数据库:Refseq;限定生物
本题解析:试题答案如何处理过多的结果:限定数据库:Refseq;限定生 物体;利用序列的特定部分搜索;调整打分矩阵;调整E值。处理过少的结果:去掉数据库限定,进行多个数据库搜索;提高E值;尝试更高的PAM矩阵和更低的BLOSUM矩阵;去掉物种限制;进行高级比对搜索。
143、名词解释 PAM矩阵
点击查看答案
本题答案:PAM指可接受突变百分率。一个氨基酸在进化中变成另一种
本题解析:试题答案PAM指可接受突变百分率。一个氨基酸在进化中变成另一种氨基酸的可能性,通过这种可能性可以鉴定蛋白质之间的相似性,并产生蛋白质之间的比对。一个PAM单位是蛋白质序列平均发生1%的替代量需要的进化时间。
144、填空题 蛋白质结构域家族的数据库有:(),()
点击查看答案
本题答案:Pfam;SMART
本题解析:试题答案Pfam;SMART
145、填空题 聚类分析方法,分为有()
点击查看答案
本题答案:监督学习方法,无监督学习方法
本题解析:试题答案监督学习方法,无监督学习方法
146、名词解释 先导化合物
点击查看答案
本题答案:是指具有一定药理活性的、可通过结构改造来优化其药理特性而可能
本题解析:试题答案是指具有一定药理活性的、可通过结构改造来优化其药理特性而可能导致药物发现的特殊化合物。就是利用计算机在含有大量化合物三维结构的数据库中,搜索能与生物大分子靶点匹配的化合物,或者搜索能与结合药效团相符的化合物,又称原型物,简称先导物,是通过各种途径或方法得到的具有生物活性的化学结构
147、问答题 序列比对分类有哪些?
点击查看答案
本题答案:A、双序列比对:两条序列的比对
B、多序列比
本题解析:试题答案A、双序列比对:两条序列的比对
B、多序列比对:三条或以上序列的比对
148、名词解释 距离法
点击查看答案
本题答案:首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推
本题解析:试题答案首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。其次基于这个矩阵中的进化距离关系构建进化树。
149、名词解释 最大简约法(MP)
点击查看答案
本题答案:在一系列能够解释序列差异的的进化树中找到具有最少核酸或
本题解析:试题答案在一系列能够解释序列差异的的进化树中找到具有最少核酸或氨基酸替换的进化树。
150、问答题 生物信息学研究有什么意义?
点击查看答案
本题答案:(1)认识生物本质,了解生物分子信息的组织和结构,破译
本题解析:试题答案(1)认识生物本质,了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系
(2)改变生物学的研究方式
(3)改变传统研究方式,引进现代信息学方法
(4)在医学上的重要意义
为疾病的诊断和治疗提供依据
为设计新药提供依据
151、名词解释 鸟枪法测序(shotgun method)
点击查看答案
本题答案:一种测序方法,包括从基因组中获得随机的、已测序的克隆片
本题解析:试题答案一种测序方法,包括从基因组中获得随机的、已测序的克隆片段,并且对初始基因的位置一无所知。
152、单项选择题 利用中国知网文献数据库(中国知网)查找论文题目是“黄瓜无毛突变体叶片叶绿体超微结构与光合特性”第一作者是()。
A.曹辰兴
B.张松
C.郭红芸
D.郭延奎
点击查看答案
本题答案:A
本题解析:暂无解析
153、问答题 DNA双螺旋结构模型的意义
点击查看答案
本题答案:(1)为合理解释遗传物质的各种功能、解释生物的遗传和变
本题解析:试题答案(1)为合理解释遗传物质的各种功能、解释生物的遗传和变异、揭示自然界色彩纷纭的生命现象奠定了理论基础;
(2)揭示了生命世界多样性和生命本质的一致性的辨正统一;
(3)现代生命科学的里程碑。
154、问答题 什么事件大大促进了生物信息学的发展?
点击查看答案
本题答案:20世纪90年代后
HGP促进生物信息学的迅
本题解析:试题答案20世纪90年代后
HGP促进生物信息学的迅速发展
155、单项选择题 Entrez使用几种逻辑运算符对检索关键词做最基本的限制?()
A.1种
B.2种
C.3种
D.4种
点击查看答案
本题答案:C
本题解析:暂无解析
156、单项选择题 GenBank中分类码PLN表示是()。
A.哺乳类序列
B.细菌序列
C.噬菌体序列
D.植物、真菌和藻类序列
点击查看答案
本题答案:D
本题解析:暂无解析
157、单项选择题 生物芯片分析中使用的聚类分析输出图形主要以下列哪种方式表现?()
A.以彩色小方块阵列表示
B.以蜂窝形状表示
C.以黑白圆点表示
D.以彩色线条表示
点击查看答案
本题答案:A
本题解析:暂无解析
158、问答题 EST能否代表一个新的基因?为什么?
点击查看答案
本题答案:不能,由于不是所有与数据库不匹配的EST都代表不同基因
本题解析:试题答案不能,由于不是所有与数据库不匹配的EST都代表不同基因,其中包含两种可能。一种可能:该EST是一个CDS,而数据库内尚无它的同源序列。另一种可能:该EST是一段数据库内没有收录的非编码序列。
159、名词解释 SCOP数据库
点击查看答案
本题答案:提供关于已知结构的蛋白质之间结构和进化关系的详细描述,
本题解析:试题答案提供关于已知结构的蛋白质之间结构和进化关系的详细描述,包括蛋白质结构数据库PDB中的所有条目。SCOP数据库除了提供蛋白质结构和进化关系信息外,对于每一个蛋白质还包括下述信息:到PDB的连接,序列,参考文献,结构的图像等。可以按结构和进化关系对蛋白质分类,分类结果是一个具有层次结构的树, 其主要的层次依次是类(class)、折叠子(fold)、超家族(superfamily)、家族(family)、单个PDB蛋白结构记录。
160、名词解释 非信息位点
点击查看答案
本题答案:对于最大简约法来说没有意义的点。
本题解析:试题答案对于最大简约法来说没有意义的点。
161、问答题 试述SWISS-PROT中的数据来源。
点击查看答案
本题答案:(1)从核酸数据库经过翻译推导而来;
(2)从蛋
本题解析:试题答案(1)从核酸数据库经过翻译推导而来;
(2)从蛋白质数据库PIR挑选出合适的数据;
(3)从科学文献中摘录;
(4)研究人员直接提交的蛋白质序列数据。
162、单项选择题 基本局部比对搜素工具是()。
A.Mega
B.ClustalW
C.BLAST
D.GCG
点击查看答案
本题答案:C
本题解析:暂无解析
163、问答题 序列分析的任务和目的分别是什么?
点击查看答案
本题答案:任务
(1)发现序列之间的相似性;
本题解析:试题答案任务
(1)发现序列之间的相似性;
(2)辨别序列之间的差异。
目的:
(1)相似序列:相似的结构,相似的功能
(2)判别序列之间的同源性
(3)推测序列之间的进化关系
164、名词解释 折叠子(Fold)
点击查看答案
本题答案:在两个或更多的蛋白质中具有相似二级结构的大区域,这些大
本题解析:试题答案在两个或更多的蛋白质中具有相似二级结构的大区域,这些大区域具有特定的空间取向。
165、名词解释 CpG island
点击查看答案
本题答案:是DNA上的一个区域,富含GC,两者以磷酸酯键相连,长
本题解析:试题答案是DNA上的一个区域,富含GC,两者以磷酸酯键相连,长度约几百到几千bp不等,常出现在管家基因或频繁表达的基因的启动子附近,在这些部位,CpG岛具有阻止序列甲基化的作用。
166、名词解释 空位罚分
点击查看答案
本题答案:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中
本题解析:试题答案空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。
167、单项选择题 UTR的含义是()。
A.编码区
B.非编码区
C.低复杂度区域
D.开放阅读框
点击查看答案
本题答案:B
本题解析:暂无解析
168、单项选择题 EMBL的含义是()。
A.美国国家生物信息中心
B.欧洲分子生物学实验室
C.日本DNA数据库
D.中国国家基因组研究中心
点击查看答案
本题答案:B
本题解析:暂无解析
169、名词解释 homology modeling
点击查看答案
本题答案:是目前最为成功且实用的蛋白质结构预测方法,它的前提是已
本题解析:试题答案是目前最为成功且实用的蛋白质结构预测方法,它的前提是已知一个或多个同源蛋白质的结构。当两个蛋白质的序列同源性高于35%,一般情况下认为他们的三维结构基本相同。
170、单项选择题 PDB是蛋白质的()。
A.分类数据库
B.结构数据库
C.模体数据库
D.结构域数据库
点击查看答案
本题答案:B
本题解析:暂无解析
171、单项选择题 被誉为“生物信息学之父”的科学家是()。
A.Dulbecco
B.Sanger
C.吴瑞
D.林华安
点击查看答案
本题答案:D
本题解析:暂无解析
172、单项选择题 DNA中Tm值与()含量成正比。
A.G+A
B.G+C
C.T+C
D.A+T
点击查看答案
本题答案:B
本题解析:暂无解析
173、名词解释 一致树(consensus tree)
点击查看答案
本题答案:在同一算法中产生多个最优树,合并这些最优树得到的树即一
本题解析:试题答案在同一算法中产生多个最优树,合并这些最优树得到的树即一致树。
174、问答题 以下软件的主要用途是什么?
点击查看答案
本题答案:RepeatMasker, CpGPlot, Spli
本题解析:试题答案RepeatMasker, CpGPlot, Splice View, Genscan, ORF finder, neural network promoter prediction.
答:RepeatMasker:是对重复序列进行分析的软件
GpGPlot:用来查找一条DNA序列中CpG岛,使用Gardine-Garden和Frommer描述的方法
Splice View:是对一段序列进行剪接位点的分析即其中的受体和供体位点
Genscan:是一种从头分析工具
ORF finder:是用来分析序列ORF的工具
neural networkpromoter prediction:神经网络启动子预测是另外一种分析启动子的方法
175、名词解释 空位(gap)
点击查看答案
本题答案:在序列比对时,由于序列长度不同,需要插入一个或几个位点
本题解析:试题答案在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。
176、名词解释 生物信息学
点击查看答案
本题答案:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以
本题解析:试题答案研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型;利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。
177、名词解释 序列模式(Motif)
点击查看答案
本题答案:蛋白质序列中短的保守区域,它们是结构域中保守性很高的部分。
本题解析:试题答案蛋白质序列中短的保守区域,它们是结构域中保守性很高的部分。
178、单项选择题 ORF的含义是()。
A.调控区
B.非编码区
C.低复杂度区域
D.开放阅读框
点击查看答案
本题答案:D
本题解析:暂无解析
179、单项选择题 NCBI中人类无冗余基因数据库是()。
A.UniGene
B.UniPro
C.UniRef
D.URF
点击查看答案
本题答案:A
本题解析:暂无解析
180、名词解释 E值
点击查看答案
本题答案:衡量序列之间相似性是否显著的期望值。E值大小说明了可以
本题解析:试题答案衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义。
181、填空题 常用的序列搜索方法:()和()
点击查看答案
本题答案:FASTA;BLAST
本题解析:试题答案FASTA;BLAST
182、问答题 试述PSI-BLAST搜索的5个步骤。
点击查看答案
本题答案:[1]选择待查序列(query)和蛋白质数据库;
本题解析:试题答案[1]选择待查序列(query)和蛋白质数据库;
[2]PSI-BLAST构建一个多序列比对,然后创建一个序列表谱(profile)又称特定位置打分矩阵(PSSM);
[3]PSSM被用作query搜索数据库
[4]PSI-BLAST估计统计学意义(eva lues)
[5]重复[3]和[4],直到没有新的序列发现。
183、名词解释 打分矩阵(scoring matrix)
点击查看答案
本题答案:在相似性检索中对序列两两比对的质量评估方法。包括基于理
本题解析:试题答案在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。
184、单项选择题 basepair的含义是()。
A.基序
B.跨叠克隆群
C.碱基对
D.结构域
点击查看答案
本题答案:C
本题解析:暂无解析
185、名词解释 FASTA序列格式
点击查看答案
本题答案:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨
本题解析:试题答案是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。
186、单项选择题 根据大量EST具有相互重叠的性质,通过计算机算法获得cDNA全长序列,这种克隆基因的方法是()。
A.重叠克隆
B.电子克隆
C.基因步移
D.基因重组
点击查看答案
本题答案:B
本题解析:暂无解析
187、问答题 简述KEGG的PATHWAYS数据库中包括的哪6种数据库?
点击查看答案
本题答案:GENES/SSDB/KOdatabases/COMP
本题解析:试题答案GENES/SSDB/KOdatabases/COMPOUND/GLYCAN/REACTION
188、多项选择题 下面序列哪些为反向重复序列()
A.…GCACTTG…GCACTTG…
B.…GCACTTGCAAGTGC…;…CGTGAAC…CGTGAAC…;…CGTGAACGTTCACG…
C.…GCACTTG…CAAGTGC…
D.…GCACTAGCTAGCGG…;…CGTGAAC…GTTCACG…;…CGTGATCGATCGCC…
点击查看答案
本题答案:B, D
本题解析:暂无解析
189、单项选择题 在真核生物的一个基因内含子两端,即外显子/内含子拼接边界处,其符合()规则。
A.Kozak
B.AU…AG
C.SD
D.Poly(A)n
点击查看答案
本题答案:B
本题解析:暂无解析
190、问答题 试述SCOP蛋白质分类方案
点击查看答案
本题答案:SCOP将PDB数据库中的蛋白质按传统分类方法分成α型、β型
本题解析:试题答案SCOP将PDB数据库中的蛋白质按传统分类方法分成α型、β型、α/β型、α+β型,并将多结构域蛋白、膜蛋白和细胞表面蛋白、N蛋白单独分类,一共分成7种类型,并在此基础上,按折叠类型、超家族、家族三个层次逐级分类。对于具有不同种属来源的同源蛋白家族,SCOP数据库按照种属名称将它们分成若干子类,一直到蛋白质分子的亚基。
191、单项选择题 algorithm的含义是()。
A.登录号
B.算法
C.比对
D.类推
点击查看答案
本题答案:B
本题解析:暂无解析
192、单项选择题 contig的含义是()。
A.基序
B.跨叠克隆群
C.碱基对
D.结构域
点击查看答案
本题答案:B
本题解析:暂无解析
193、名词解释 SRS(sequence retrieva l system)
点击查看答案
本题答案:序列查询系统,是EBI提供的多数据库查询工具之一。有与Ent
本题解析:试题答案序列查询系统,是EBI提供的多数据库查询工具之一。有与Entrez类似的功能外,还提供了一系列的序列分析工具,可以直接进行在线序列分析处理。
194、问答题 生物分子数据类型有哪些?
点击查看答案
本题答案:DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功
本题解析:试题答案DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功能数据
195、名词解释 相似性
点击查看答案
本题答案:是可以量化的参数,是一种直接的数量关系,是量的判断,可
本题解析:试题答案是可以量化的参数,是一种直接的数量关系,是量的判断,可多可少,如百分之几。
196、名词解释 保守序列(conserved sequence)
点击查看答案
本题答案:指DNA分子中的一个核苷酸片段或者蛋白质中氨基酸片段,
本题解析:试题答案指DNA分子中的一个核苷酸片段或者蛋白质中氨基酸片段,它们在进化过程中基本保持不变。
197、名词解释 无根树
点击查看答案
本题答案:只表明节点间的关系,无进化发生方向的信息,通过引入外群或外部
本题解析:试题答案只表明节点间的关系,无进化发生方向的信息,通过引入外群或外部参考物种,可以在无根树中指派根节点。
198、问答题 什么简约信息位点Pi?
点击查看答案
本题答案:指基于DNA或蛋白质序列,应用最大简约法构建系统发育树
本题解析:试题答案指基于DNA或蛋白质序列,应用最大简约法构建系统发育树时,如果某个位点的状态存在两种或两种以上,每种状态出现两次或两次以上,这样的位点称简约信息位点。
199、名词解释 MMDB(Molecular Modeling Database)
点击查看答案
本题答案:是(NCBI)所开发的生物信息数据库集成系统Entre
本题解析:试题答案是(NCBI)所开发的生物信息数据库集成系统Entrez的一个部分,数据库的内容包括来自于实验的生物大分子结构数据。与PDB相比,对于数据库中的每一个生物大分子结构,MMDB具有许多附加的信息,如分子的生物学功能、产生功能的机制、分子的进化历史等,还提供生物大分子三维结构模型显示、结构分析和结构比较工具。
200、问答题 简述BLAST搜索的算法思想。
点击查看答案
本题答案:BLAST是一种局部最优比对搜索算法,将所查询的序列打
本题解析:试题答案BLAST是一种局部最优比对搜索算法,将所查询的序列打断成许多小序列片段,然后小序列逐步与数据库中的序列进行比对,这些小片段被叫做字”word”;当一定长度的的字(W)与检索序列的比对达到一个指定的最低分(T)后,初始比对就结束了;一个序列的匹配度由各部分匹配分数的总和决定,获得高分的序列叫做高分匹配片段(HSP),程序将最好的HSP双向扩展进行比对,直到序列结束或者不再具有生物学显著性,最后所得到的序列是那些在整体上具有最高分的序列,即,最高分匹配片段(MSP),这样,BLAST既保持了整体的运算速度,也维持了比对的精度。
题库试看结束后
微信扫下方二维码即可打包下载完整版《
★生物学》题库
手机用户可保存上方二维码到手机中,在微信扫一扫中右上角选择“从相册选取二维码”即可。
题库试看结束后
微信扫下方二维码即可打包下载完整版《
生物学:生物信息学》题库,
分栏、分答案解析排版、小字体方便打印背记!经广大会员朋友实战检验,此方法考试通过率大大提高!绝对是您考试过关的不二利器!
手机用户可
保存上方二维码到手机中,在
微信扫一扫中右上角选择“从
相册选取二维码”即可。