手机用户可
保存上方二维码到手机中,在
微信扫一扫中右上角选择“从
相册选取二维码”即可。
1、单项选择题 没有直接参与完成人类基因组计划的国家是()。
A.英国
B.中国
C.俄罗斯
D.德国
点击查看答案
本题答案:C
本题解析:暂无解析
2、问答题 掌握蛋白质结构有什么意义?为什么要进行蛋白质结构预测?
点击查看答案
本题答案:(1)研究蛋白质的结构意义重大,分析蛋白质结构、功能及其关系
本题解析:试题答案(1)研究蛋白质的结构意义重大,分析蛋白质结构、功能及其关系是蛋白质组计划中的一个重要组成部分。研究蛋白质结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相互作用,这无论是对于生物学还是对于医学和药学,都是非常重要的。
(2)对于未知功能或者新发现的蛋白质分子,通过结构分析,可以进行功能注释,指导设计进行功能确认的生物学实验。通过分析蛋白质的结构,确认功能单位或者结构域,可以为遗传操作提供目标,为设计新的蛋白质或改造已有蛋白质提供可靠的依据,同时为新的药物分子设计提供合理的靶分子结构。
3、问答题 MEGA2如何将其它多序列比对格式文件转化为MEGE格式的多序列比对文件?
点击查看答案
本题答案:(1)选择菜单file,
(2)选择Text
本题解析:试题答案(1)选择菜单file,
(2)选择Text File Editorand Format Coverter工具,
(3)调入需要转换的序列和相应的格式,
(4)获得转换后的MEGA格式的文件并保存。
4、名词解释 比较基因组学
点击查看答案
本题答案:是在基因组图谱和测序的基础上,利用某个基因组研究获得的信息推
本题解析:试题答案是在基因组图谱和测序的基础上,利用某个基因组研究获得的信息推测其他原核生物、真核生物类群中的基因数目、位置、功能、表达机制和物种进化的学科。
5、问答题 简述BLAST搜索的算法思想。
点击查看答案
本题答案:BLAST是一种局部最优比对搜索算法,将所查询的序列打
本题解析:试题答案BLAST是一种局部最优比对搜索算法,将所查询的序列打断成许多小序列片段,然后小序列逐步与数据库中的序列进行比对,这些小片段被叫做字”word”;当一定长度的的字(W)与检索序列的比对达到一个指定的最低分(T)后,初始比对就结束了;一个序列的匹配度由各部分匹配分数的总和决定,获得高分的序列叫做高分匹配片段(HSP),程序将最好的HSP双向扩展进行比对,直到序列结束或者不再具有生物学显著性,最后所得到的序列是那些在整体上具有最高分的序列,即,最高分匹配片段(MSP),这样,BLAST既保持了整体的运算速度,也维持了比对的精度。
6、名词解释 GenPept
点击查看答案
本题答案:是由GenBank中的DNA序列翻译得到的蛋白质序列。
本题解析:试题答案是由GenBank中的DNA序列翻译得到的蛋白质序列。数据量很大,且随核酸序列数据库的更新而更新,但它们均是由核酸序列翻译得到的序列,未经试验证实,也没有详细的注释。
7、名词解释 最大似然法(ML)
点击查看答案
本题答案:它对每个可能的进化位点分配一个概率,然后综合所有位点,找到概
本题解析:试题答案它对每个可能的进化位点分配一个概率,然后综合所有位点,找到概率最大的进化树。最大似然法允许采用不同的进化模型对变异进行分析评估,并在此基础上构建系统发育树。
8、名词解释 homology modeling
点击查看答案
本题答案:是目前最为成功且实用的蛋白质结构预测方法,它的前提是已
本题解析:试题答案是目前最为成功且实用的蛋白质结构预测方法,它的前提是已知一个或多个同源蛋白质的结构。当两个蛋白质的序列同源性高于35%,一般情况下认为他们的三维结构基本相同。
9、问答题 简述人类基因组研究计划的历程。
点击查看答案
本题答案:通过国际合作,用15年时间(1990-2005)至少投
本题解析:试题答案通过国际合作,用15年时间(1990-2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA的全部核苷酸序列,定位约10万基因,并对其他生物进行类似研究。
1990,人类基因组计划正式启动。
1996,完成人类基因组计划的遗传作图,启动模式生物基因组计划。
1998完成人类基因组计划的物理作图,开始人类基因组的大规模测序。Celera公司加入,与公共领域竞争启动水稻基因组计划。
1999,第五届国际公共领域人类基因组测序会议,加快测序速度。
2000,Celera公司宣布完成果蝇基因组测序,国际公共领域宣布完成第一个植物基因组——拟南芥全基因组的测序工作。
2001,人类基因组“中国卷”的绘制工作宣告完成。
2003,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的.目标全部实现。
2004,人类基因组完成图公布
10、填空题 检测系统发育树可靠性的技术:()和()
点击查看答案
本题答案:bootstrapping;Jack-knifing
本题解析:试题答案bootstrapping;Jack-knifing
11、填空题 高分值局部联配的BLAST参数是()(高分值片段对),()(期望值)
点击查看答案
本题答案:HSPs;E
本题解析:试题答案HSPs;E
12、问答题 引物设计的基本原则有哪些,有哪些基本参数要考虑,最常用的引物设计软件是什么?
点击查看答案
本题答案:引物设计的基本原则:引物与模板的序列要紧密互补;引物与
本题解析:试题答案引物设计的基本原则:引物与模板的序列要紧密互补;引物与引物之间避免形成稳定的二聚体或发夹结构;引物不能在模板的非目的位点引发DNA聚合反应(即错配)。有如下这些基本参数要考虑:引物长度,产物长度,序列Tm值,引物与模板形成双链的内部稳定性(用?G值反映),形成引物二聚体及发夹结构的能值,在错配位点的引发效率,引物及产物的GC含量,等等。最常用的引物设计软件是:Primer Premier.
13、名词解释 FASTA
点击查看答案
本题答案:是第一个被广泛使用的数据库相似性搜索算法,这个程序通过
本题解析:试题答案是第一个被广泛使用的数据库相似性搜索算法,这个程序通过扫描序列中“词”的小配对,从而寻找最优局部比对
14、名词解释 邻接片段
点击查看答案
本题答案:一组在染色体上有重叠区域的DNA片段的克隆
本题解析:试题答案一组在染色体上有重叠区域的DNA片段的克隆
15、问答题 蛋白质二级结构有哪些?
点击查看答案
本题答案:(1)螺旋
(2)b折叠–平行折
本题解析:试题答案(1)螺旋
(2)b折叠–平行折叠反平行折叠
(3)b转角–连接作用”U”型结构(大多Phe,Gly组成)
(4)无规卷曲-没有确定规律性的肽链构象,但仍是紧密有序的稳定结构
(5)无序结构多肽链中有60%的区段为a螺旋和b折叠
16、问答题 假设你得到一段未知蛋白的氨基酸序列,从你学习到的生物信息学分析方法和软件,设计一个分析流程来分析该未知蛋白的功能和家族类别以及其结构预测。
点击查看答案
本题答案:1、用该序列进行BLASTP搜索。
2、再对
本题解析:试题答案1、用该序列进行BLASTP搜索。
2、再对其进行蛋白质结构域、功能域的搜索,可以用Znterproscan、Pfam,并对其进行结构分析。
3、再用ClustW进行多序列比对。
4、用人工神经网络的方法对其结构进行结构预测。
17、名词解释 旁系同源(paralogous)
点击查看答案
本题答案:是通过类似基因复制的机制产生的同源序列。
本题解析:试题答案是通过类似基因复制的机制产生的同源序列。
18、问答题 先导化合物的来源有四种来源
点击查看答案
本题答案:1)通过偶然性观察发现的先导化合物(这个方法最著名的例
本题解析:试题答案1)通过偶然性观察发现的先导化合物(这个方法最著名的例子就是亚历山大.弗莱明发现的青霉素,今天所用的许多抗生素皆由其发展出来)
2)也可以通过替代疗法的药物开发中发现的药物副作用来识别先导化合物(例如,镇定剂氯化物丙嫀是在试验中发现用在抗组胺剂时被发现的)
3)先导化合物也可以来自传统医药学(如奎宁化合物就来自金鸡纳的树皮)
4)先导化合物也可以来自天然的底物或是配体(比如说,肾上腺素作为舒喘宁的类似物用来治疗哮喘)
19、名词解释 反式调控元件
点击查看答案
本题答案:远离所调控的编码序列,通常位于不同的染色体上。
本题解析:试题答案远离所调控的编码序列,通常位于不同的染色体上。
20、名词解释 查询序列(query sequence)
点击查看答案
本题答案:也称被检索序列,用来在数据库中检索并进行相似性比较的序
本题解析:试题答案也称被检索序列,用来在数据库中检索并进行相似性比较的序列。
21、单项选择题 蛋白质基序(motif)中[ST]的含义是()。
A.氨基酸为ST
B.氨基酸为S和T
C.氨基酸为S或T
D.除掉S和T之外的任意氨基酸
点击查看答案
本题答案:C
本题解析:暂无解析
22、名词解释 GenBank
点击查看答案
本题答案:是美国全国卫生研究所维护的基因序列数据库,汇集并注释了
本题解析:试题答案是美国全国卫生研究所维护的基因序列数据库,汇集并注释了所有公开的核酸序列,与日本的DNA数据库DDBJ以及欧洲分子实验室核酸序列数据库EMBL一起,都是国际核苷酸序列数据库合作的成员。
23、名词解释 直系同源(Orthologous)
点击查看答案
本题答案:指不同种类的同源序列,他们是在物种的形成事件中从一个祖
本题解析:试题答案指不同种类的同源序列,他们是在物种的形成事件中从一个祖先序列独立进化而成的,可能有相似功能,也可能没有。
24、问答题 给定一条序列,简述使用BLAST进行序列比对分析的策略
点击查看答案
本题答案:1)获得查询序列,以FASTA格式黏贴到BLAST文本
本题解析:试题答案1)获得查询序列,以FASTA格式黏贴到BLAST文本框中;
2)选择一个BLAST程序(blastp,blastn,blastx,tblastx,tblastn);
3)选择一个用于搜索的数据库;
4)为搜索和输出格式选择可选的参数;
5)Search,结果分析。
25、名词解释 旁系(并系)同源
点击查看答案
本题答案:指同一个物种中具有共同祖先,通过基因重复产生的一组基因
本题解析:试题答案指同一个物种中具有共同祖先,通过基因重复产生的一组基因,这些基因在功能上可能发生了改变。(书:由于基因重复事件产生的相似序列。)
26、问答题 如何查找由Rao Y 实验室于2005以后发表的,文章主题中与brain有关的文献,写出检索语言。
点击查看答案
本题答案:Brain[ti] AND RaoY[au] AND
本题解析:试题答案Brain[ti] AND RaoY[au] AND 2005:2013[dp]
27、问答题 UniGene数据库主要收集什么样的数据?
点击查看答案
本题答案:UniGene数据库称得上是一个实验性质的系统,它通过
本题解析:试题答案UniGene数据库称得上是一个实验性质的系统,它通过程序自动将GenBank中的基因序列划分到某个非冗余的基于基因的集合中。这样,每个UniGene集合就代表了一个独特的基因,并包含了与这个基因相关的信息。
28、问答题 序列的相似性与同源性有什么区别与联系?
点击查看答案
本题答案:相似性是指序列之间相关的一种量度,两序列的的相似性可以
本题解析:试题答案相似性是指序列之间相关的一种量度,两序列的的 91Exam.org相似性可以基于序列的一致性的百分比;而同源性是指序列所代表的物种具有共同的祖先,强调进化上的亲缘关系。
29、问答题 什么是动态规划算法?
点击查看答案
本题答案:动态规划算法(Dynamic Programming
本题解析:试题答案动态规划算法(Dynamic Programming Algorithm)是一种计算方法,它的主要思路是把一个问题分成若干个小问题来解决,在序列比对尤其是双序列比对中非常重要,因为其提供了序列间最优的对位排列。在生物学中应用的两种动态规划算法:Needleman-Wunsch算法(全局比对)和Smith-Waterman算法(局部比对)。
30、名词解释 序列模式(Motif)
点击查看答案
本题答案:蛋白质序列中短的保守区域,它们是结构域中保守性很高的部分。
本题解析:试题答案蛋白质序列中短的保守区域,它们是结构域中保守性很高的部分。
31、名词解释 基因预测(geneprediction)
点击查看答案
本题答案:用计算机程序对可能的基因所做的预测,它是基于DNA片段
本题解析:试题答案用计算机程序对可能的基因所做的预测,它是基于DNA片段与已知基因序列的匹配程度的。
32、问答题 简述在蛋白质三级结构预测中同源建模法的步骤。
点击查看答案
本题答案:(1)搜索与目标蛋白序列相似的模板蛋白
(2
本题解析:试题答案(1)搜索与目标蛋白序列相似的模板蛋白
(2)目标序列与模板序列比对
(3)建立骨架(将模板结构叠加起来,找结构保守区域)
(4)构建目标蛋白质的侧链
(5)构建目标蛋白质的环区(从已知的环区构象中选出一最优的构象)
(6)优化模型(找出结构中异常的构象)
33、名词解释 距离法
点击查看答案
本题答案:首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推
本题解析:试题答案首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。其次基于这个矩阵中的进化距离关系构建进化树。
34、问答题 我国自主知识产权的主要基因组测序计划有哪些?
点击查看答案
本题答案:水稻(2002),家鸡(2004),家蚕(2007),
本题解析:试题答案水稻(2002),家鸡(2004),家蚕(2007),家猪(2012),大熊猫(2010)
35、名词解释 分子途径
点击查看答案
本题答案:是指一组连续起作用以达到共同目标的蛋白质。
本题解析:试题答案是指一组连续起作用以达到共同目标的蛋白质。
36、问答题 如何处理BLAST后过少或过多的结果?
点击查看答案
本题答案:如何处理过多的结果:限定数据库:Refseq;限定生物
本题解析:试题答案如何处理过多的结果:限定数据库:Refseq;限定生物体;利用序列的特定部分搜索;调整打分矩阵;调整E值。处理过少的结果:去掉数据库限定,进行多个数据库搜索;提高E值;尝试更高的PAM矩阵和更低的BLOSUM矩阵;去掉物种限制;进行高级比对搜索。
37、问答题 简述PCR引物设计的基本原则及其注意要点
点击查看答案
本题答案:原则:首先引物与模板的序列要紧密互补,其次引物与引物之间避免
本题解析:试题答案原则:首先引物与模板的序列要紧密互补,其次引物与引物之间避免形成稳定的二聚体或发夹结构,再次引物不能再模板的非等位点引发DNA聚合反应(即错配)。
注意要点:
1、引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适合于TaqDNA聚合酶进行反应。
2、引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发几率增加。
3、引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。
4、引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。
5、引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有很多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(thenearestneighbormethod)。
6、G值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端G值较低(绝对值不超过9),而在5’端和中间G值相对较高的引物。引物的3’端的G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。
7、引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。
8、对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。
38、名词解释 替换(substitution)
点击查看答案
本题答案:在指定的位置不相同的氨基酸进行连配,如果联配的残基有相
本题解析:试题答案在指定的位置不相同的氨基酸进行连配,如果联配的残基有相似的物化性质,那么替换是保守的。
39、问答题 什么是序列比对中使用的PAM矩阵和BLOSUM矩阵,它们的作用是什么,一般BLAST选择使用的矩阵是什么
点击查看答案
本题答案:PAM矩阵和BLOSUM矩阵都是用于序列相似性的记分矩
本题解析:试题答案PAM矩阵和BLOSUM矩阵都是用于序列相似性的记分矩阵(scoring matrix)。记分矩阵中含有对齐时具体使用的数值。一般FASTA和BLAST都提供BLOSUM或PAM系列矩阵供选择,若要进行突变性质的进化分析时可以使用PAM,FASTA缺省推荐BLOSUM50矩阵。
PAM矩阵(Point Accepted Mutation)基于进化的点突变模型,如果两种氨基酸替换频繁,说明自然界接受这种替换,那么这对氨基酸替换得分就高。一个PAM就是一个进化的变异单位, 即1%的氨基酸改变,但这并不意味100次PAM后,每个氨基酸都发生变化,因为其中一些位置可能会经过多次突变,甚至可能会变回到原来的氨基酸。
模块替换矩阵BLOSUM(BLOcks Substitution Matrix)首先寻找氨基酸模式,即有意义的一段氨基酸片断(如一个结构域及其相邻的两小段氨基酸序列),分别比较相同的氨基酸模式之间氨基酸的保守性(某种氨基酸对另一种氨基酸的取代数据),然后,以所有 60%保守性的氨基酸模式之间的比较数据为根据,产生BLOSUM60;以所有80%保守性的氨基酸模式之间的比较数据为根据,产生BLOSUM80。
40、问答题 生物信息学研究意义?
点击查看答案
本题答案:(1)认识生物本质
了解生物分子信息的组织和
本题解析:试题答案(1)认识生物本质
了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。
(2)改变生物学的研究方式
改变传统研究方式,引进现代信息学方法
(3)在医学上的重要意义
为疾病的诊断和治疗提供依据,为设计新药提供依据
41、名词解释 SRS(sequence retrieva l system)
点击查看答案
本题答案:序列查询系统,是EBI提供的多数据库查询工具之一。有与Ent
本题解析:试题答案序列查询系统,是EBI提供的多数据库查询工具之一。有与Entrez类似的功能外,还提供了一系列的序列分析工具,可以直接进行在线序列分析处理。
42、名词解释 顺式调控元件
点击查看答案
本题答案:位于起始点上游(基因5‘端)控制转录的DN
本题解析:试题答案位于起始点上游(基因5‘端)控制转录的DNA序列,靠近它所调控的编码序列;其结构是模块化的,即DNA序列能被分成各个单元。
43、填空题 表达序列标签是从()中生成的一些很短的序列(300-500bp),它们代表在特定组织或发育阶段表达的基因。
点击查看答案
本题答案:mRNA
本题解析:试题答案mRNA
44、多项选择题 下列哪些分子类型属于非蛋白质编码区()
A.内含子
B.卫星DNA
C.伪基因
D.启动子
E.增强子
点击查看答案
本题答案:A, B, C, D, E
本题解析:暂无解析
45、名词解释 heptad repeat
点击查看答案
本题答案:七肽重复区是典型的卷曲螺旋结构类型之一,由多个七肽单元
本题解析:试题答案七肽重复区是典型的卷曲螺旋结构类型之一,由多个七肽单元连接而成的重复序列。
46、名词解释 structure domain
点击查看答案
本题答案:结构域,是在蛋白质三级结构中介于二级和三级结构之间的可
本题解析:试题答案结构域,是在蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元,每个结构域自身形成紧实的三维结构,可以独立存在或折叠,但结构域与结构域之间关系较为松散。
47、名词解释 TrEMBL
点击查看答案
本题答案:是与SWISS-PROT相关的一个数据库。包含从EMBL核酸
本题解析:试题答案是与SWISS-PROT相关的一个数据库。包含从EMBL核酸数据库中根据编码序列(CDS)翻译而得到的蛋白质序列,并且这些序列尚未集成到SWISS-PROT数据库中。
48、问答题 你认为生物信息学有什么用?对你的生活、研究有影响吗?
点击查看答案
本题答案:(1)主要用于:
在基因组分析方面:生物序列相似
本题解析:试题答案(1)主要用于:
在基因组分析方面:生物序列相似性比较及其数据库搜索、基因预测、基因组进化和分子进化、蛋白质结构预测等
在医药方面:新药物设计、基因芯片疾病快速诊断、流行病学研究:SARS、人类基因组计划、基因组计划:基因芯片。
(2)指导研究和实验方案,减少操作性实验的量;验证实验结果;为实验结果提供更多的支持数据等材料。
49、单项选择题 DNA中Tm值与()含量成正比。
A.G+A
B.G+C
C.T+C
D.A+T
点击查看答案
本题答案:B
本题解析:暂无解析
50、名词解释 算法(algorithm)
点击查看答案
本题答案:在计算机程序中包含的一种固定过程。
本题解析:试题答案在计算机程序中包含的一种固定过程。
51、单项选择题 HTGS的含义是()。
A.表达序列标签
B.序列标签位点
C.高通量基因组序列
D.人工合成序列
点击查看答案
本题答案:C
本题解析:暂无解析
52、问答题 预测蛋白质三级结构的三种方法
点击查看答案
本题答案:1)同源建模法:依据蛋白质与已知结构蛋白比对信息构建3
本题解析:试题答案1)同源建模法:依据蛋白质与已知结构蛋白比对信息构建3D模型;
2)折叠识别法:寻找与未知蛋白最合适的模板,进行序列与结构比对,最终建立结构模型;
3)从头预测法:根据序列本身从头预测蛋白质结构。
53、单项选择题 生物信息学主要是利用哪种工具实现对生命科学研究中生物信息的存储、检索和分析的?()
A.计算机
B.iPhone
C.人造卫星
D.手机
点击查看答案
本题答案:A
本题解析:暂无解析
54、问答题 什么叫contig?
点击查看答案
本题答案:Contig:重叠群,基因组测序中将许多序列片段经过比
本题解析:试题答案Contig:重叠群,基因组测序中将许多序列片段经过比对找到重叠区,从而连接成的长片段。
55、问答题 生物信息学数据库的组成包括哪些部分?数据库有哪些类型?
点击查看答案
本题答案:生物信息学数据库的组成包括一级数据库和二级数据库。数据
本题解析:试题答案生物信息学数据库的组成包括一级数据库和二级数据库。数据库的类型包括核算和蛋白质一级结构序列数据库、基因组数据库、生物大分子三维空间结构数据库、以上述3类数据库和文献资料为基础构建的二次数据库。
56、名词解释 权重矩阵(序列轮廓)
点击查看答案
本题答案:它们表示完全结构域序列,多序列联配中每个位点的氨基酸都
本题解析:试题答案它们表示完全结构域序列,多序列联配中每个位点的氨基酸都有分值,并且特定位置插入或缺失的可能性均有一定的衡量方法(课件定义)。基础上针对特定的应用目标而建立的数据库。
57、名词解释 模块替换矩阵(BLUSUM)
点击查看答案
本题答案:在替换矩阵中,每个位置的打分是在相关蛋白局部比对模块中
本题解析:试题答案在替换矩阵中,每个位置的打分是在相关蛋白局部比对模块中观察到的替换的频率而获得的,每个矩阵被修改成一个特殊的进化距离。
58、问答题 简述DNA计算实现方式中,表面方式与试管方式相比具有哪些优点?
点击查看答案
本题答案:试管方式:就是在一个或多个试管的溶液里进行生化反应;<
本题解析:试题答案试管方式:就是在一个或多个试管的溶液里进行生化反应;
表面方式:是将对应的解空间的DNA分子固定在一块固体上,其次进行各种生化反应,或是在表面逐步形成解空间,然后根据具体问题对所有可能的解进行筛选,最后得到运算结果。
(1)操作简单,易于实现自动化操作;
(2)减少人为操作过程中造成的DNA分子的丢失及其它操作失误;
(3)减少分子在表面上的相互作用,同时增强分子间的特异性结合;
(4)信息储存密度大,据估计,10毫克DNA表面上的储存密度是传统计算姬的10的8次方倍,而在溶液中仅为10的5次方倍;
(5)结果易于纯化。
59、问答题 假设你得到一段未知蛋白氨基酸序列,从你学习到的生物信息学分析方法和软件,设计一个分析流程来分析该未知蛋白质的功能和家族类别以及其结构预测.
点击查看答案
本题答案:1、用该序列进行BLASTP搜索。
2、再对
本题解析:试题答案1、用该序列进行BLASTP搜索。
2、再对其进行蛋白质结构域、功能域的搜索,可以用Znterproscan、Pfam,并对其进行结构分析。
3、再用ClustW进行多序列比对。
4、用人工神经网络的方法对其结构进行结构预测
60、问答题 如何进行BLAST结果显著性判断?
点击查看答案
本题答案:结果显著性判断:查看E值列表;查看比对情况。
本题解析:试题答案结果显著性判断:查看E值列表;查看比对情况。
(1.E值是不是显著;
2.两个蛋白质是不是具有近似的大小;
3.两个蛋白质是否有共同的模体或信号序列;
4.两个蛋白质是不是一个合理的多序列比对的一部分;
5.两个蛋白质是否有一个相似的生物学功能;
6.两个蛋白质是否具有相似的3维结构。
7.如果一个BLAST搜索得到一个对另一个蛋白质的边缘匹配,以这个具有较远亲缘关系的蛋白质作为查询项再进行一次新的BLAST搜索。)
61、问答题 为什么要构建生物分子数据库。
点击查看答案
本题答案:(1)生物分子数据高速增长
(2)分子生物学
本题解析:试题答案(1)生物分子数据高速增长
(2)分子生物学及相关领域研究人员迅速获得最新实验数据。
62、填空题 系统发育树的构建方法:()
点击查看答案
本题答案:距离矩阵法,最大简约法和最大似然法
本题解析:试题答案距离矩阵法,最大简约法和最大似然法
63、名词解释 标度树
点击查看答案
本题答案:分支长度与相邻节点对的差异程度成正比的树。
本题解析:试题答案分支长度与相邻节点对的差异程度成正比的树。
64、名词解释 虚拟细胞
点击查看答案
本题答案:一种建模手段,把细胞定义为许多结构,分子,反应和物质流
本题解析:试题答案一种建模手段,把细胞定义为许多结构,分子,反应和物质流的集合体。
65、名词解释 EMBL
点击查看答案
本题答案:EMBL实验室—欧洲分子生物学实验室,EM
本题解析:试题答案EMBL实验室—欧洲分子生物学实验室,EMBL数据库—是非盈利性学术组织EMBL建立的综合性数据库,EMBL核酸数据库是欧洲最重要的核酸序列数据库,它定期地与美国的GenBank、日本的DDBJ数据库中的数据进行交换,并同步更新。
66、单项选择题 TAIR(AtDB)数据库是()。
A.线虫基因组
B.果蝇基因组
C.拟南芥数据库
D.大肠杆菌基因组
点击查看答案
本题答案:C
本题解析:暂无解析
67、问答题 生物信息学的目标和任务?
点击查看答案
本题答案:收集和管理生物分子数据;数据分析和挖掘;开发分析工具和
本题解析:试题答案收集和管理生物分子数据;数据分析和挖掘;开发分析工具和实用软件:生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。
68、填空题 初级序列数据库:()
点击查看答案
本题答案:GenBank,EMBL和DDBJ
本题解析:试题答案GenBank,EMBL和DDBJ
69、单项选择题 从cDNA文库中获得的短序列是()。
A.STS
B.UTR
C.CDS
D.EST
点击查看答案
本题答案:D
本题解析:暂无解析
70、单项选择题 algorithm的含义是()。
A.登录号
B.算法
C.比对
D.类推
点击查看答案
本题答案:B
本题解析:暂无解析
71、填空题 二级结构的三种状态:(),()和()
点击查看答案
本题答案:α螺旋;β折叠;β转角
本题解析:试题答案α螺旋;β折叠;β转角
72、名词解释 BioEdit
点击查看答案
本题答案:BioEdit是一个序列编辑器与分析工具软件。功能包括
本题解析:试题答案BioEdit是一个序列编辑器与分析工具软件。功能包括:序列编辑、外挂分析程序、RNA分析、寻找特征序列、支持超过20000个序列的多序列文件、基本序列处理功能、质粒图绘制等等。
73、名词解释 coiled coil
点击查看答案
本题答案:卷曲螺旋,是蛋白质中由2~7条α螺旋链相互
本题解析:试题答案卷曲螺旋,是蛋白质中由2~7条α螺旋链相互缠绕形成类似麻花状结构的总称。卷曲螺旋是控制蛋白质寡聚化的元件,在机体内执行着分子识别、代谢调控、细胞分化、肌肉收缩、膜通道等生物学功能。
74、名词解释 分子钟
点击查看答案
本题答案:认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通
本题解析:试题答案认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通过分子进化推断出物种起源的时 间。
75、问答题 预测基因的一般步骤是什么?
点击查看答案
本题答案:⑴获取DNA目标序列
⑵查找ORF并将目标序
本题解析:试题答案⑴获取DNA目标序列
⑵查找ORF并将目标序列翻译成蛋白质序列,利用相应工具查找ORF并将DNA序列翻译成蛋白质序列
⑶在数据库中进行序列搜索,利用BLAST进行ORF核苷酸序列和ORF翻译的蛋白质序列搜索
⑷进行目标序列与搜索得到的相似序列的全局对比
⑸查找基因家族进行多序列比对,获得比对区段的基因家族信息
⑹查找目标序列中的特定模序,分别在Prosite、BLOCK、Motif数据库中进行profile、模块(block)、模序(motif)检索⑺预测目标序列蛋白质结构,利用PredictProtein(EMBL)、NNPREDICT等预测目标序列的蛋白质二级结构。
76、问答题 简述常用的引物设计软件的名称和各自特点。
点击查看答案
本题答案:首先是引物分析评论功能,该功能只有少数商业版软件能够做
本题解析:试题答案首先是引物分析评论功能,该功能只有少数商业版软件能够做到,其中以“Oligo6”最优秀;其次是引物的自动搜索功能,各种软件在这方面的侧重点不同,因此自动搜索的结果也不尽相同。自动搜索功能以“PremierPrimer”为最强且方便实用,“Oligo6”其次,其他软件如“VectorNTISuit”、“Dnasis”、“Omiga”和“Dnastar”都带有引物自动搜索功能,但搜索结果不是十分理想。要想得到效果很好的引物,在自动搜索的基础上还要辅以人工分析。
77、名词解释 PROSITE
点击查看答案
本题答案:是蛋白质家族和结构域数据库,包含具有生物学意义的位点、模式、
本题解析:试题答案是蛋白质家族和结构域数据库,包含具有生物学意义的位点、模式、可帮助识别蛋白质家族的统计特征。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;PROSITE还包括根据多序列比对而构建的序列统计特征,能更敏感地发现一个序列是否具有相应的特征。
78、名词解释 系统发育分析
点击查看答案
本题答案:通过一组相关的基因或者蛋白质的多序列比对或其他性状,可
本题解析:试题答案通过一组相关的基因或者蛋白质的多序列比对或其他性状,可以研究推断不同物种或基因之间的进化关系。
79、名词解释 非标度树
点击查看答案
本题答案:只表示亲缘关系无差异程度信息。
本题解析:试题答案只表示亲缘关系无差异程度信息。
80、名词解释 邻接法(neighbor-joining method)
点击查看答案
本题答案:是一种不仅仅计算两两比对距离,还对整个树的长度进行最小
本题解析:试题答案是一种不仅仅计算两两比对距离,还对整个树的长度进行最小化,从而对树的拓扑结构进行限制,能够克服UPGMA算法要求进化速率保持恒定的缺陷。
81、多项选择题 20世纪三大著名计划包括()
A.阿波罗登月计划
B.卫星计划
C.HGP
D.肿瘤计划
E.曼哈顿原子弹计划
点击查看答案
本题答案:A, C, E
本题解析:暂无解析
82、名词解释 SCOP数据库
点击查看答案
本题答案:提供关于已知结构的蛋白质之间结构和进化关系的详细描述,
本题解析:试题答案提供关于已知结构的蛋白质之间结构和进化关系的详细描述,包括蛋白质结构数据库PDB中的所有条目。SCOP数据库除了提供蛋白质结构和进化关系信息外,对于每一个蛋白质还包括下述信息:到PDB的连接,序列,参考文献,结构的图像等。可以按结构和进化关系对蛋白质分类,分类结果是一个具有层次结构的树,其主要的层次依次是类(class)、折叠子(fold)、超家族(superfamily)、家族(family)、单个PDB蛋白结构记录。
83、单项选择题 单核苷酸标记是()。
A.RFLP
B.SNP
C.SSR
D.RAPD
点击查看答案
本题答案:A
本题解析:暂无解析
84、单项选择题 如果我们试图做蛋白质亚细胞定位分析,应使用()。
A.NDB数据库
B.PDB数据库
C.GenBank数据库
D.SWISS-PROT数据库
点击查看答案
本题答案:D
本题解析:暂无解析
85、单项选择题 STS的含义是()。
A.表达序列标签
B.序列标签位点
C.高通量基因组序列
D.人工合成序列
点击查看答案
本题答案:B
本题解析:暂无解析
86、多项选择题 RFLP是DNA多态性中最多见的一种,它产生的机制包括()
A.DNA分子产生突变,使某些酶切位点数增加
B.DNA分子产生突变,使某些酶切位点数减少
C.限制性酶切位点之间重复序列数目变异
D.限制性酶星活性
E.限制性酶切位点前后的DNA片断发生插入或删除
点击查看答案
本题答案:A, B, E
本题解析:暂无解析
87、问答题 简述KEGG的PATHWAYS数据库中包括的哪6种数据库?
点击查看答案
本题答案:GENES/SSDB/KOdatabases/COMP
本题解析:试题答案GENES/SSDB/KOdatabases/COMPOUND/GLYCAN/REACTION
88、名词解释 自举法检验(Bootstrap)
点击查看答案
本题答案:放回式抽样统计法。通过对数据集多次重复取样,构建多个进
本题解析:试题答案放回式抽样统计法。通过对数据集多次重复取样,构建多个进化树,用来检查给定树的分枝可信度。
89、名词解释 序列的比对
点击查看答案
本题答案:是一种关于序列相似性的定性描述:在什么区域相似,在什么
本题解析:试题答案是一种关于序列相似性的定性描述:在什么区域相似,在什么区域存在差别。最优比对:揭示两条序列的最大相似程度。(又叫序列联配,其意义在于从核酸、氨基酸的层次分析序列的相似性,推测其结构功能及进化上的联系,是基因识别、分子进化、生命起源研究的基础。
90、填空题 用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括()
点击查看答案
本题答案:输入层,隐含层和输出层
本题解析:试题答案输入层,隐含层和输出层
91、问答题 在基因组序列分析方面,科学家关注哪些信息?
点击查看答案
本题答案:就人类基因组而言,编码区域在人类基因组所占的比例不超过
本题解析:试题答案就人类基因组而言,编码区域在人类基因组所占的比例不超过3%。其余97%是非编码序列。对于非编码序列,人们了解得比较少,尚不清楚其含义或功能。然而,非编码区域对于生命活动具有重要的意义。这部分序列主要包括内含子、简单重复序列、移动元件(mobileelement)及其遗留物、伪基因(pseudogene)等。
92、名词解释 表达序列标签(EST)
点击查看答案
本题答案:一种短的DNA片段,是cDNA分子的一部分,可用来鉴定基因,
本题解析:试题答案一种短的DNA片段,是cDNA分子的一部分,可用来鉴定基因,通常用于基因定位和基因图谱中。
93、问答题 简述DNA计算机的基本原理
点击查看答案
本题答案:1)以编码生命信息的遗传物质—DNA序列,
本题解析:试题答案1)以编码生命信息的遗传物质—DNA序列,作为信息编码的载体,利用DNA分子的双螺旋结构和碱基互补配对的性质,将所要处理的问题映射为特定的DNA分子;
2)在生物酶的作用下,通过可控的生化反应生成问题的解空间;最后利用各种现代分子生物技术如聚合酶链反应RCR、超声波降解、亲和层析、分子纯化、电泳、磁珠分离等手段破获运算结果。
DNA计算机优点:低能耗、存储容量高、运算速度快,可真正实现并行工作。
94、问答题 基因芯片对于生物分子信息检测的作用和意义?
点击查看答案
本题答案:在生命科学领域中,基因芯片为分子生物学、生物医学等研究
本题解析:试题答案在生命科学领域中,基因芯片为分子生物学、生物医学等研究提供了强有力的手段。利用基因芯片技术,可研究生命体系中不同部位、不同生长发育阶段的基因表达,比较不同个体或物种之间的基因表达,比较正常和疾病状态下基因及其表达的差异。基因芯片技术也有助于研究不同层次的多基因协同作用的生命过程,发现新的基因功能,研究生物体在进化、发育、遗传过程中的规律。
95、名词解释 一致树(consensus tree)
点击查看答案
本题答案:在同一算法中产生多个最优树,合并这些最优树得到的树即一
本题解析:试题答案在同一算法中产生多个最优树,合并这些最优树得到的树即一致树。
96、单项选择题 在真核生物中,一个基因cDNA的5′端起始密码子AUG的前后序列符合()规则。
A.Kozak
B.AU…AG
C.SD
D.Poly(A)n
点击查看答案
本题答案:A
本题解析:暂无解析
97、问答题 生物分子数据类型有哪些?
点击查看答案
本题答案:DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功
本题解析:试题答案DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功能数据
98、问答题 生物信息指哪些?
点击查看答案
本题答案:主要有从DNA序列、蛋白质序列、蛋白质结构和功能研究中
本题解析:试题答案主要有从DNA序列、蛋白质序列、蛋白质结构和功能研究中解读的:遗传信息、进化信息、结构和功能信息。
99、单项选择题 限制性片段长度多态性标记是()。
A.RFLP
B.SNP
C.SSR
D.RAPD
点击查看答案
本题答案:A
本题解析:暂无解析
100、问答题 简述除权配对法(UPGMA)的算法思想。
点击查看答案
本题答案:通过两两比对聚类的方法进行,在开始时,每个序列分为一类
本题解析:试题答案通过两两比对聚类的方法进行,在开始时,每个序列分为一类,分别作为一个树枝的生长点,然后将最近的两序列合并,从而定义出一个节点,将这个过程不断的重复,直到所有的序列都被加入,最后得到一棵进化树。
101、单项选择题 ORF的含义是()。
A.调控区
B.非编码区
C.低复杂度区域
D.开放阅读框
点击查看答案
本题答案:D
本题解析:暂无解析
102、问答题 试述PSI-BLAST搜索的5个步骤。
点击查看答案
本题答案:[1]选择待查序列(query)和蛋白质数据库;
本题解析:试题答案[1]选择待查序列(query)和蛋白质数据库;
[2]PSI-BLAST构建一个多序列比对,然后创建一个序列表谱(profile)又称特定位置打分矩阵(PSSM);
[3]PSSM被用作query搜索数据库
[4]PSI-BLAST估计统计学意义(eva lues)
[5]重复[3]和[4],直到没有新的序列发现。
103、问答题 简述生物类的数据库类别分为有哪两种及其定义
点击查看答案
本题答案:一级数据库:数据库中的数据直接来源于实验获得的原始数据
本题解析:试题答案一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释(投稿文章首先要将核苷酸序列或蛋白质序列提交到相应的数据库中)
二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。
104、单项选择题 EMBL的含义是()。
A.美国国家生物信息中心
B.欧洲分子生物学实验室
C.日本DNA数据库
D.中国国家基因组研究中心
点击查看答案
本题答案:B
本题解析:暂无解析
105、问答题 TrEMBL哪两个部分?
点击查看答案
本题答案:(1)SP-TrEMBL(SWISS-PROTTrEM
本题解析:试题答案(1)SP-TrEMBL(SWISS-PROTTrEMBL)
包含最终将要集成到SWISS-PROT的数据,所有的SP-TrEMBL序列都已被赋予SWISS-PROT的登录号。
(2)REM-TrEMBL(REMainingTrEMBL)
包括所有不准备放入SWISS-PROT的数据,因此这部分数据都没有登录号。
106、单项选择题 Blast结果中HSP的含义是()。
A.空位
B.期望值
C.过滤
D.高分配对片段
点击查看答案
本题答案:D
本题解析:暂无解析
107、问答题 下列数据库分别是什么类型的数据库?
点击查看答案
本题答案:序列数据库中的核酸数据库(GenBankPIRDDBJ
本题解析:试题答案序列数据库中的核酸数据库(GenBankPIRDDBJSWISS-PROTEMBL)
结构数据库(PDB)
108、问答题 国际上权威的核酸序列数据库有那些?
点击查看答案
本题答案:(1)欧洲分子生物学实验室的EMBL。
(2
本题解析:试题答案(1)欧洲分子生物学实验室的EMBL。
(2)美国生物技术信息中心的GenBank。
(3)日本遗传研究所的DDBJ。
109、填空题 质谱的两个数据库搜索工具:()和()
点击查看答案
本题答案:SEQEST;Lutkefish
本题解析:试题答案SEQEST;Lutkefish
110、名词解释 DDBJ
点击查看答案
本题答案:日本DNA数据库,主要向研究者收集DNA序列信息并赋予
本题解析:试题答案日本DNA数据库,主要向研究者收集DNA序列信息并赋予其数据存取号,信息来源主要是日本的研究机构,也接受其他国家呈递的序列。
111、单项选择题 利用PubMed文献数据查找论文“Enhancing phytoremediation through the use of transgenics and endophytes”发表的期刊是()。
A.New Phytol
B.Gene
C.Nature
D.Plant Phsiol
点击查看答案
本题答案:A
本题解析:暂无解析
112、名词解释 相似性
点击查看答案
本题答案:是可以量化的参数,是一种直接的数量关系,是量的判断,可
本题解析:试题答案是可以量化的参数,是一种直接的数量关系,是量的判断,可多可少,如百分之几。
113、名词解释 聚类分析
点击查看答案
本题答案:就是将数据分成若干簇(cluster),簇内最大程度相
本题解析:试题答案就是将数据分成若干簇(cluster),簇内最大程度相似,簇间最大程度相异。某一状态的出现概率仅取决于其前驱的k个状态,k阶马尔可夫模型
114、问答题 什么简约信息位点Pi?
点击查看答案
本题答案:指基于DNA或蛋白质序列,应用最大简约法构建系统发育树
本题解析:试题答案指基于DNA或蛋白质序列,应用最大简约法构建系统发育树时,如果某个位点的状态存在两种或两种以上,每种状态出现两次或两次以上,这样的位点称简约信息位点。
115、名词解释 MMDB(Molecular Modeling Database)
点击查看答案
本题答案:是(NCBI)所开发的生物信息数据库集成系统Entre
本题解析:试题答案是(NCBI)所开发的生物信息数据库集成系统Entrez的一个部分,数据库的内容包括来自于实验的生物大分子结构数据。与PDB相比,对于数据库中的每一个生物大分子结构,MMDB具有许多附加的信息,如分子的生物学功能、产生功能的机制、分子的进化历史等,还提供生物大分子三维结构模型显示、结构分析和结构比较工具。
116、单项选择题 在真核生物的一个基因内含子两端,即外显子/内含子拼接边界处,其符合()规则。
A.Kozak
B.AU…AG
C.SD
D.Poly(A)n
点击查看答案
本题答案:B
本题解析:暂无解析
117、问答题 如何选择合适的评分矩阵?
点击查看答案
本题答案:一般来说,在局部相似性搜索上,BLOSUM矩阵较PAM
本题解析:试题答案一般来说,在局部相似性搜索上,BLOSUM矩阵较PAM要好
当比较距离相近的蛋白时,应选择低的PAM或高的BLOSUM矩阵;当比较距离较远的蛋白时,应选择高的PAM或低的BLOSUM矩阵
对于数据库搜索来说一般选择BLOSUM62矩阵
PAM矩阵可用于寻找蛋白质的进化起源,BLOSUM矩阵用于发现蛋白质的保守域
118、填空题 系统发育学的研究方法有:()
点击查看答案
本题答案:表现型分类法,遗传分类法和进化分类法
本题解析:试题答案表现型分类法,遗传分类法和进化分类法
119、单项选择题 Bioinformatics的含义是()。
A.生物信息学
B.基因组学
C.蛋白质组学
D.表观遗传学
点击查看答案
本题答案:A
本题解析:暂无解析
120、单项选择题 OMIM是()。
A.在线人类孟德尔遗传数据库
B.国家核酸数据库
C.人类基因组计划
D.水稻基因组计划
点击查看答案
本题答案:A
本题解析:暂无解析
121、名词解释 一致序列
点击查看答案
本题答案:这些序列是指把多序列联配的信息压缩至单条序列,主要的缺
本题解析:试题答案这些序列是指把多序列联配的信息压缩至单条序列,主要 91EXAM.org的缺点是除了在特定位置最常见的残基之外,它们不能表示任何概率信息。
122、问答题 如何用BLAST发现新基因?
点击查看答案
本题答案:从一个一直蛋白质序列开始,通过tBLASTn工具搜索一个DN
本题解析:试题答案从一个一直蛋白质序列开始,通过tBLASTn工具搜索一个DNA数据库,可以找到相应的匹配,如与DNA编码的已知蛋白质的匹配或者与DNA编码的相关蛋白质的匹配。然后通过BLASTx或BLASTp在蛋白质数据库中搜索DNA或蛋白质序列来“确定”一个新基因。
123、问答题 真核基因结构识别主要包含哪些内容?
点击查看答案
本题答案:(1)ORF识别及其可靠性验证:确定DNA序列的编码区
本题解析:试题答案(1)ORF识别及其可靠性验证:确定DNA序列的编码区
(2)启动子及转录因子结合位点分析:CAP序列、识别区、解旋区、转录起始位点
(3)重复序列分析:哺乳动物基因组中存在大量重复序列,由于重复序列的大量存在常会影响序列的正确分析,因此在对真核基因进行分析前,最好能把重复序列找出来,并从序列中屏蔽掉
(4)CpGisland:可以为基因及其启动子的预测提供重要的线索
(5)3’UTR区:真核生物的转录终止信号是在3’UTR区
124、问答题 系统发育树的构建步骤是什么?
点击查看答案
本题答案:①多序列比对(自动比对、手工比对)
②建立取
本题解析:试题答案①多序列比对(自动比对、手工比对)
②建立取代模型(建树的方法)
③建立进化树
④进化树的评估
125、单项选择题 利用PubMed文献数据查找发表在“Nature,2012,487(7405):43-45”上的论文题目是()。
A.A map of the cis-regulatory sequences in the mouse genome
B.The human CST complex is a terminator of telomerase activity
C.Tumours: Less lactation may explain cancer rise
D.Stem cells: a sporadic super state
点击查看答案
本题答案:D
本题解析:暂无解析
126、单项选择题 隐马尔科夫模型的代号是()。
A.HMM
B.CDD
C.HTGS
D.GSS
点击查看答案
本题答案:A
本题解析:暂无解析
127、问答题 生物信息学研究有什么意义?
来源:91考试网 91ExaM.org
点击查看答案
本题答案:(1)认识生物本质,了解生物分子信息的组织和结构,破译
本题解析:试题答案(1)认识生物本质,了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系
(2)改变生物学的研究方式
(3)改变传统研究方式,引进现代信息学方法
(4)在医学上的重要意义
为疾病的诊断和治疗提供依据
为设计新药提供依据
128、问答题 简述GenBank数据库中GBFF格式的结构?
点击查看答案
本题答案:GenBank flatfile(GBFF)是GenB
本题解析:试题答案GenBank flatfile(GBFF)是GenBank数据库的基本信息单位,也是最广泛地用以表示生物序列的格式之一。GBFF可以分成三个部分,头部包含关于整个记录的信息(描述符);第二部分包含了注释这一记录的特性;第三部分是核苷酸序列自身。所有的核苷酸数据库记录(DDBJ/EMBL/GenBank)都在最后一行以//结尾.
129、填空题 ()和()中的注释所涉及的问题是不同的
点击查看答案
本题答案:原核生物;真核生物基因组
本题解析:试题答案原核生物;真核生物基因组
130、名词解释 质谱(MS)
点击查看答案
本题答案:是一种准确测定真空中离子的分子质量/电荷比(m/z)的
本题解析:试题答案是一种准确测定真空中离子的分子质量/电荷比(m/z)的方法,从而使分子质量的准确确定成为可能。
质谱分析的两个工具
131、问答题 指出下列特殊标识符的格式?
点击查看 答案
本题答案:①序列辨认号(GI):一串阿拉伯数字
②Ge
本题解析:试题答案①序列辨认号(GI):一串阿拉伯数字
②GenBank/EMBL/DDBJ序列接受号:
1个字母+5个阿拉伯数字;1个字母+6个阿拉伯数字
③RefSeq序列接受号:带“-”
mRNA记录(NM*);完整的基因组或染色体(NC*)
④PDB序列接受号:1个阿拉伯数字+3个字母
132、问答题 试述SWISS-PROT中的数据来源。
点击查看答案
本题答案:(1)从核酸数据库经过翻译推导而来;
(2)从蛋
本题解析:试题答案(1)从核酸数据库经过翻译推导而来;
(2)从蛋白质数据库PIR挑选出合适的数据;
(3)从科学文献中摘录;
(4)研究人员直接提交的蛋白质序列数据。
133、名词解释 超家族
点击查看答案
本题答案:进化上相关,功能可能不同的一类蛋白质。
本题解析:试题答案进化上相关,功能可能不同的一类蛋白质。
134、单项选择题 NCBI中人类无冗余基因数据库是()。
A.UniGene
B.UniPro
C.UniRef
D.URF
点击查看答案
本题答案:A
本题解析:暂无解析
135、问答题 简要介绍GenBank中的DNA序列格式。
点击查看答案
本题答案:GenBank中的DNA序列格式可以分成三个部分,第一
本题解析:试题答案GenBank中的DNA序列格式可以分成三个部分,第一部分为描述符,从第一行LOCUS行到ORIGIN行,包含了关于整个记录的信息;第二部分为特性表,从FEATURES行开始,包含了注释这一纪录的特性,是条目的核心,中间使用一批关键字;第三部分是核苷酸序列的本身。
136、名词解释 genbank序列格式
点击查看答案
本题答案:是GenBank数据库的基本信息单位,是最为广泛的生物信息学
本题解析:试题答案是GenBank数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。
137、单项选择题 构建系统发生树,应使用()。
A.BLAST
B.FASTA
C.UPGMA
D.FTP
点击查看答案
本题答案:C
本题解析:暂无解析
138、问答题 双序列比对方法有哪些?
点击查看答案
本题答案:①点阵序列比较(Dot Matrix Sequence
本题解析:试题答案①点阵序列比较(Dot Matrix Sequence Comparison)
②动态规划算法(Dynamic Programming Algorithm)
③词或K串方法(Word or K-tuple Methods)
④贝叶斯统计方法(Bayesian Statistical Methods)
139、名词解释 基因预测的从头分析
点击查看答案
本题答案:依据综合利用基因的特征,如剪接位点,内含子与外显子边界
本题解析:试题答案依据综合利用基因的特征,如剪接位点,内含子与外显子边界,调控区,预测基因组序列中包含的基因。
140、名词解释 E值
点击查看答案
本题答案:衡量序列之间相似性是否显著的期望值。E值大小说明了可以
本题解析:试题答案衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义。
141、名词解释 序列表谱(profile)
点击查看答案
本题答案:是一种特殊位点或模体序列,在多序列比较的基础上,氨基酸
本题解析:试题答案是一种特殊位点或模体序列,在多序列比较的基础上,氨基酸的权值和空位罚分的表格。
142、问答题 NCBI维护的核苷酸数据库由哪几部分组成的,其主要的内容是什么?
点击查看答案
本题答案:由三部分组成:表达序列标签序列、基因组测序序列、核心核
本题解析:试题答案由三部分组成:表达序列标签序列、基因组测序序列、核心核苷酸序列。
143、名词解释 Gene Ontology 协会
点击查看答案
本题答案:编辑一组动态的、可控的基因产物不同方面性质的字汇的协会
本题解析:试题答案编辑一组动态的、可控的基因产物不同方面性质的字汇的协会。从3个方面描述基因产物的性质,即,分子功能,生物过程,细胞区室。
144、单项选择题 利用中国知网文献数据库(中国知网)查找论文题目是“黄瓜无毛突变体叶片叶绿体超微结构与光合特性”第一作者是()。
A.曹辰兴
B.张松
C.郭红芸
D.郭延奎
点击查看答案
本题答案:A
本题解析:暂无解析
145、名词解释 折叠子(Fold)
点击查看答案
本题答案:在两个 或更多的蛋白质中具有相似二级结构的大区域,这些大
本题解析:试题答案在两个或更多的蛋白质中具有相似二级结构的大区域,这些大区域具有特定的空间取向。
146、问答题 BLAST套件的blastn、blastp、blastx、tblastn和tblastx子工具的用途什么?
点击查看答案
本题答案:blastn是将给定的核酸序列与核酸数据库中的序列进行
本题解析:试题答案blastn是将给定的核酸序列与核酸数据库中的序列进行比较;Blastp是使用蛋白质序列与蛋白质数据库中的序列进行比较,可以寻找较远的关系;Blastx将给定的核酸序列按照六种阅读框架将其翻译成蛋白质与蛋白质数据库中的序列进行比对,对分析新序列和EST很有用;Tblastn将给定的氨基酸序列与核酸数据库中的序列(双链)按不同的阅读框进行比对,对于寻找数据库中序列没有标注的新编码区很有用;Tblastx只在特殊情况下使用,它将DNA被检索的序列和核酸序列数据库中的序列按不同的阅读框全部翻译成蛋白质序列,然后进行蛋白质序列比对。
147、名词解释 PIR
点击查看答案
本题答案:是一个集成了关于蛋白质功能预测数据的公共资源的数据库,
本题解析:试题答案是一个集成了关于蛋白质功能预测数据的公共资源的数据库,其目的是支持基因组蛋白质研究
148、单项选择题 利用中国知网文献数据库(中国知网)查找论文题目是“扩张蛋白家族蛋白序列分析”发表在期刊“生物信息学”2008年第7卷第3期上()。
A.第3-5页
B.第93-95页
C.第193-195页
D.第293-295页
点击查看答案
本题答案:C
本题解析:暂无解析
149、名词解释 EST
点击查看答案
本题答案:表达序列标签—是从一个随机选择的cDNA克
本题解析:试题答案表达序列标签—是从一个随机选择的cDNA克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA部分序列,代表一个完整基因的一小部分
150、单项选择题 UTR的含义是()。
A.编码区
B.非编码区
C.低复杂度区域
D.开放阅读框
点击查看答案
本题答案:B
本题解析:暂无解析
151、名词解释 linux operating system
点击查看答案
本题答案:linux操作系统,Linux是一类Unix计算机操作
本题解析:试题答案linux操作系统,Linux是一类Unix计算机操作系统的统称。Linux操作系统也是自由软件和开放源代码发展中最著名的例子。
152、名词解释 表谱(PSSM)
点击查看答案
本题答案:指一张基于多序列比对的打分表,表示一个蛋白质家族,可以
本题解析:试题答案指一张基于多序列比对的打分表,表示一个蛋白质家族,可以用来搜索序列数据库。
153、单项选择题 根据研究发现,人类基因组中真正编码蛋白质的区域仅占DNA序列的()。
A.1-2%
B.3-5%
C.5-10%
D.10-20%
点击查看答案
本题答案:B
本题解析:暂无解析
154、名词解释 开放阅读框(ORF)
点击查看答案
本题答案:开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱
本题解析:试题答案开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列。
155、名词解释 序列注释
点击查看答案
本题答案:是指从原始序列数据中获得有用的生物学信息。这主要是指基
本题解析:试题答案是指从原始序列数据中获得有用的生物学信息。这主要是指基因组DNA中寻找基因和其他功能元件(结构注释),并给出这些序列的功能(功能注释)。
156、名词解释 RefSeq
点击查看答案
本题答案:给出了对应于基因和蛋白质的索引号码,对应于最稳定、最被人承认
本题解析:试题答案给出了对应于基因和蛋白质的索引号码,对应于最稳定、最被人承认的Genbank序列。
157、填空题 常用的序列搜索方法:()和()
点击查看答案
本题答案:FASTA;BLAST
本题解析:试题答案FASTA;BLAST
158、问答题 简述最大似然法(ML)的算法思想。
点击查看答案
本题答案:是一种基于离散特征的进化树算法。该法首先选择一个合适的进化模
本题解析:试题答案是一种基于离散特征的进化树算法。该法首先选择一个合适的进化模型,然后对所有可能的进化树进行评估,通过对每个进化位点的替代分配一个概率,最后找出概率最大的进化树。
159、问答题 简要介绍FASTA序列格式
点击查看答案
本题答案:FASTA格式,又叫Pearson格式,是最简单的,使
本题解析:试题答案FASTA格式,又叫Pearson格式,是最简单的,使用最多的格式。它的基本形式分为三个部分:
⑴第一行:大于号(﹥)表示一个新的序列文件的开始,为标记符。后面可以加上文字说明,gi号,GenBank检索号,LOCUS名称等信息。
⑵第二行:序列本身,为DNA的标准符号,通常大小写均可。
⑶结束:无特殊标志,但建议多留一个空行,以便将序列和其他内容区分开。
160、问答题 UPGMA构树法不精确的原因是什么?
点击查看答案
本题答案:由个于UPGMA假设在进化过程中所有核苷酸/氨基酸都有
本题解析:试题答案由个于UPGMA假设在进化过程中所有核苷酸/氨基酸都有相同的变异率,也就是存在着一个分子钟;这种算法当所构建的进化树的序列进化速率明显不一致时,得到的进化树相对来说不准确的。
161、名词解释 系统发生(phylogeny)
点击查看答案
本题答案:是指生物种族的进化历史,亦即生物体在整个进化谱
本题解析:试题答案是指生物种族的进化历史,亦即生物体在整个进化谱
162、填空题 提供蛋白质功能注释信息的数据库:()(京都基因和基因组百科全书)和()(蛋白质信息资源)
点击查看答案
本题答案:KEGG;PIR
本题解析:试题答案KEGG;PIR
163、问答题 为什么蛋白质空间结构预测很重要,目前有哪几条途径用于从蛋白质的氨基酸序列预测其空间三维结构?
点击查看答案
本题答案:蛋白质空间结构的预测很重要。研究蛋白质结构,有助于了解
本题解析:试题答案蛋白质空间结构的预测很重要。研究蛋白质结构,有助于了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相互作用,通过分析蛋白质的结构,确认功能单位或者结构域,可以为遗传操作提供目标,为设计新的蛋白质或改造已有蛋白质提供可靠的依据,同时为新的药物分子设计提供合理的靶分子结构。
目前有三条途径用于从蛋白质一级序列预测其空间三维结构:
A、同源建模法。是蛋白质三维结构预测的主要方法。对于一个未知结构的蛋白质,首先通过序列同源分析找到一个已知结构的同源蛋白质,然后,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。前提是必须要有一个已知结构的同源蛋白质。
B、穿针引线法。需建立核心折叠数据库,在预测蛋白质空间结构时将一个待预测结构的蛋白质序列与数据库中核心折叠进行比对,找出比对结果最好的核心折叠,作为构造待预测蛋白质结构模型的根据。
C、从头开始法。在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,直接根据序列本身来预测其结构。该方法先对蛋白质及溶剂作近似处理,再建立能量函数,通过对构象空间进行快速搜索找到与某一全局最小能量相对应的构象。
164、名词解释 FASTA序列格式
点击查看答案
本题答案:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨
本题解析:试题答案是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。
165、问答题 HGP选择作为研究人类的四大“模式生物“有哪些?
点击查看答案
本题答案:酵母、线虫、果蝇、小鼠。
本题解析:试题答案酵母、线虫、果蝇、小鼠。
166、名词解释 系统生物学(systems biology)
点击查看答案
本题答案:是研究一个生物系统中所有组分成分(基因、mRNA、蛋白
本题解析:试题答案是研究一个生物系统中所有组分成分(基因、mRNA、蛋白质等)的构成以及在特定条件下这些组分间的相互关系,并分析生物系统在一定时间内的动力学过程
167、名词解释 直系同源
点击查看答案
本题答案:指由于物种形成事件来自一个共同祖先的不同物种中的同源序
本题解析:试题答案 指由于物种形成事件来自一个共同祖先的不同物种中的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制证据的情况下,具有共同祖先和相同功能的同源基因。)
168、名词解释 motif
点击查看答案
本题答案:又称模体,实序列中局部的保守区域,或者是一组序列中共有
本题解析:试题答案又称模体,实序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。通常由2、3个二级结构单位组成,一般为α螺旋、β折叠和环。motif作为结构域中的亚单位,表现结构域的各种生物学功能。
169、单项选择题 GenBank登录号为SCU49845的序列,其DNA产度是()。
A.1028bp
B.3028bp
C.4028bp
D.5028bp
点击查看答案
本题答案:D
本题解析:暂无解析
170、名词解释 多序列比对(multiple sequence alignment)
点击查看答案
本题答案:三个或多个序列之间的比对,如果序列在同一列有相同结构位
本题解析:试题答案三个或多个序列之间的比对,如果序列在同一列有相同结构位置的残基和(或)祖传的残基,则会在该位置插入空位。
171、填空题 蛋白质结构域家族的数据库有:(),()
点击查看答案
本题答案:Pfam;SMART
本题解析:试题答案Pfam;SMART
172、单项选择题 Entrez使用几种逻辑运算符对检索关键词做最基本的限制?()
A.1种
B.2种
C.3种
D.4种
点击查看答案
本题答案:C
本题解析:暂无解析
173、名词解释 进化树的二歧分叉结构
点击查看答案
本题答案:指在进化树上任何一个分支节点,一个父分支都只能被分成两
本题解析:试题答案指在进化树上任何一个分支节点,一个父分支都只能被分成两个子分支。
174、名词解释 Clustsl X
点击查看答案
本题答案:是CLUSTAL多重序列比对程序的Windows版本,
本题解析:试题答案是CLUSTAL多重序列比对程序的Windows版本,是用来对核酸与蛋白序列进行多序列比较的程序,也可以对来自不同物种的功能或结构相似的序列进行比对和聚类,通过重建系统发生树判断亲缘关系,并对序列在生物进化过程中的保守性进行估计。
175、问答题 序列分析的任务和目的分别是什么?
点击查看答案
本题答案:任务
(1)发现序列之间的相似性;
本题解析:试题答案任务
(1)发现序列之间的相似性;
(2)辨别序列之间的差异。
目的:
(1)相似序列:相似的结构,相似的功能
(2)判别序列之间的同源性
(3)推测序列之间的进化关系
176、单项选择题 EST的含义是()。
A.表达序列标签
B.序列标签位点
C.高通量基因组序列
D.人工合成序列
点击查看答案
本题答案:A
本题解析:暂无解析
177、单项选择题 motif的含义是()。
A.基序
B.跨叠克隆群
C.碱基对
D.结构域
点击查看答案
本题答案:D
本题解析:暂无解析
178、问答题 简述构建进化树的步骤,每一步列举1-2种使用的软件或统计学方法。
点击查看答案
本题答案:(1)多序列比对:ClustalW
(2)校对比
本题解析:试题答案(1)多序列比对:ClustalW
(2)校对比对结果:BIOEDIT
(3)建树:MEGA
(4)评估系统发育信号和进化树的牢固度:自举法(Bootstrap)
179、填空题 常用的三种序列格式:()
点击查看答案
本题答案:NBRF/PIR,FASTA和GDE
本题解析:试题答案NBRF/PIR,FASTA和GDE
180、单项选择题 RGP是()。
A.在线人类孟德尔遗传数据
B.国家核酸数据库
C.人类基因组计划
D.水稻基因组计划
点击查看答案
本题答案:D
本题解析:暂无解析
181、问答题 如何检测DNA序列中潜在的CDS?
点击查看答案
本题答案:对任意一个DNA序列,可能并不知道哪一个碱基代表CDS
本题解析:试题答案对任意一个DNA序列,可能并不知道哪一个碱基代表CDS的起始。这种情况下,不妨试用六框翻译(six-frame translation)。如图4-2给定一个DNA序列,可以利用遗传密码将其翻译为蛋白质序列,这种方式称为概念性翻译(conceptual translation)。与基于生化实验的蛋白质翻译不同的是,概念性翻译仅通过理论推导或计算获得。
六框翻译通过移动阅读框起始碱基,获得6个潜在的蛋白质序列。其中,3个是正向翻译,3个是反向翻译,6种可能的蛋白质中至多只有一种是正确的。
182、填空题 蛋白质质谱数据搜索工具:()
点击查看答案
本题答案:SEQUEST
本题解析:试题答案SEQUEST
183、名词解释 点矩阵(dot matrix)
点击查看答案
本题答案:构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,
本题解析:试题答案构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。
184、单项选择题 CDS的含义是()。
A.编码区
B.非编码区
C.低复杂度区域
D.非调控区
点击查看答案
本题答案:A
本题解析:暂无解析
185、名词解释 近邻
点击查看答案
本题答案:任意一颗无根树中仅被一个内部节点分隔的一对物种。
本题解析:试题答案任意一颗无根树中仅被一个内部节点分隔的一对物种。
186、名词解释 权重矩阵
点击查看答案
本题答案:基础上针对特定的应用目标而建立的数据库。
本题解析:试题答案基础上针对特定的应用目标而建立的数据库。
187、名词解释 分子钟(molecular clock)
点击查看答案
本题答案:对于每一个给定基因(或蛋白质)其分子进化率大致是恒定的
本题解析:试题答案对于每一个给定基因(或蛋白质)其分子进化率大致是恒定的。
188、名词解释 BLAST
点击查看答案
本题答案:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行
本题解析:试题答案基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。
189、名词解释 BLOSUM矩阵
点击查看答案
本题答案:模块替代矩阵。矩阵中的每个位点的分值来自蛋白比对的局部
本题解析:试题答案模块替代矩阵。矩阵中的每个位点的分值来自蛋白比对的局部块中的替代频率的观察。每个矩阵适合特定的进化距离。例如,在BLOSUM62矩阵中,比对的分值来自不超过62%一致率的一组序列。
190、单项选择题 利用PubMed文献数据查找论文“Transgenic plants of Petunia hybrida harboring the CYP2E1 gene efficiently remove benzene and toluene pollutants and improve resistance to formaldehyde”的第一作者是()。
A.XiangT
B.BaoL
C.LiP
D.ZhangD
点击查看答案
本题答案:D
本题解析:暂无解析
191、名词解释 信息位点
点击查看答案
本题答案:由位点产生的突变数目把其中的一课树与其他树区分开的位点
本题解析:试题答案由位点产生的突变数目把其中的一课树与其他树区分开的位点。
192、多项选择题 人类基因组计划要完成的几张图谱分别是()
A.物理图谱
B.遗传图谱
C.序列图谱
D.生物图谱
E.基因图谱
点击查看答案
本题答案:A, B, C, E
本题解析:暂无解析
193、名词解释 Entrez检索系统
点击查看答案
本题答案:是NCBI开发的核心检索系统,集成了NCBI的各种数据
本题解析:试题答案是NCBI开发的核心检索系统,集成了NCBI的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。
194、多项选择题 最常用的序列相似性查询工具是()
A.FASTA
B.BLAST
C.SWISS-PROT
D.PDB
E.PIR
点击查看答案
本题答案:A, B
本题解析:暂无解析
195、单项选择题 analogy的含义是()。
A.登录号
B.算法
C.比对
D.类推
点击查看答案
本题答案:D
本题解析:暂无解析
196、问答题 生物信息学主要研究内容。
点击查看答案
本题答案:(1)生物分子数据的收集与管理;
(2)数据库搜
本题解析:试题答案(1)生物分子数据的收集与管理;
(2)数据库搜索及序列比较;
(3)基因组序列分析;
(4)基因表达数据的分析与处理;
(5)蛋白质结构预测。
197、名词解释 Entrez
点击查看答案
本题答案:是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白
本题解析:试题答案是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。
198、名词解释 gene tree
点击查看答案
本题答案:基因树,表示一组基因或一组DNA顺序进化关系的系统发生
本题解析:试题答案基因树,表示一组基因或一组DNA顺序进化关系的系统发生树。
199、名词解释 ncRNA
点击查看答案
本题答案:非编码RNA,是指没有编码蛋白质功能的所有RNA,它缺乏开放
本题解析:试题答案非编码RNA,是指没有编码蛋白质功能的所有RNA,它缺乏开放阅读框,常由编码蛋白质的基因反转录而来。
200、名词解释 低复杂度区域
点击查看答案
本题答案:BLAST搜索的过滤选项。指序列中包含的重复度高的区域
本题解析:试题答案BLAST搜索的过滤选项。指序列中包含的重复度高的区域,如poly(A)。
题库试看结束后
微信扫下方二维码即可打包下载完整版《
★生物学》题库
手机用户可保存上方二维码到手机中,在微信扫一扫中右上角选择“从相册选取二维码”即可。
题库试看结束后
微信扫下方二维码即可打包下载完整版《
生物学:生物信息学》题库,
分栏、分答案解析排版、小字体方便打印背记!经广大会员朋友实战检验,此方法考试通过率大大提高!绝对是您考试过关的不二利器!
手机用户可
保存上方二维码到手机中,在
微信扫一扫中右上角选择“从
相册选取二维码”即可。