2012生物信息学题库|电子爱好者

admin管理员组
文章数量:1530812

2024年3月26日发(作者：)

一、选择题

以下哪一个是

mRNA

条目序列号：

A. J01536

B. NM_15392

全局比对比对整体序列，而局部比对寻找最佳匹配子序

列

14.

假设你有两条远源相关蛋白质序列。为了比较它们，最好使

用下列哪个

BLOSUM

和

PAM

矩阵：

A. BLOSUM45

和

PAM250

B. BLOSUM45

和

PAM1

C. BLOSUM80

和

PAM250

D. BLOSUM10

和

PAM1

15.

与

PAM

打分矩阵比较，

BLOSUM

打分矩阵的最大区别是：

最好用于比对相关性高的蛋白

它是基于近相关蛋白的全局多序列比对

它是基于远相关蛋白的局部多序列比对

D. HTGS

它结合了全局比对和局部比对

16.

如果有一段

DNA

序列，它可能编码多少种蛋白质序列：

A. 1 B. 2 C. 3

D. 6

17.

要在数据库查询一段与某

DNA

序列编码蛋白质最相似的序

列，应选择：

A. blastn

D. tblastp

B. blastp

E. blastx

C. tblastn

C. NP_52280 D. AAB134506

确定某个基因在哪些组织中表达的最直接获取相关信息方

式是：

B. Entrez

不可能

C. LocusLink D. PCR

A. Unigene

可能

一个基因可能对应两个

Unigene

簇吗？

下面哪种数据库源于

mRNA

信息：

A. dbEST

B. PDB C. OMIM D. HTGS

下面哪个数据库面向人类疾病构建：

A. EST B. PDB

C. OMIM

Refseq

和

GenBank

有什么区别：

A. Refseq

包括了全世界各个实验室和测序项目提交的

DNA

序列

B. GenBank

提供的是非冗余序列

C. Refseq

源于

GenBank

，提供非冗余序列信息

D. GenBank

源于

Refseq

如果你需要查询文献信息，下列哪个数据库是你最佳选择：

A. OMIM B. Entrez

C. PubMed

D. PROSITE

比较从

Entrez

和

ExPASy

中提取有关蛋白质序列信息的方

法，下列哪种说法正确：

因为

GenBank

的数据比

EMBL

更多，

Entrez

给出的搜索

结果将更多

搜索结果很可能一样，因为

GenBank

和

EMBL

的序列数

据实际一样

搜索结果应该相当，但是

ExPASy

中的

SwissProt

记录的

18.

为什么

ClustalW

（一个采用了

Feng-Doolittle

渐进比对算法

的程序）不报告

值：

A. ClustalW

报告

值

使用了局部比对

的依据是：

保证空隙不会引物序列加入而填充

假定进化早期分歧的序列有较高优先级别

假定最近序列空隙应该保留

假定最远序列空隙应该保留

20.

根据分子钟假说：

所有蛋白质都保持一个相同的恒定进化速率

所有蛋白质的进化速率都与化石记录相符合

对于每一个给定的蛋白质，分子进化的速率是逐渐减慢

的，就如同不准时的钟

对于每一个给定的蛋白质，其分子进化的速率在所有的

使用了全局比对

因为是多序列比对

-Doolittle

方法提出“一旦是空隙，永远是空隙”规则

输出格式不同

天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于：

A. N/W/Y

B. Q/W/Y C. F/W/Y D. Q/N/W

10.

直系同源定义为：

不同物种中具有共同祖先的同源序列

具有较小的氨基酸一致性但是有较大的结构相似性的

同源序列

同一物种中由基因复制产生的同源序列

同一物种中具有相似的并且通常是冗余的功能的同源

序列

11.

下列那个氨基酸最不容易突变：

丙氨酸

甲硫氨酸

谷氨酰胺

半胱氨酸

进化分支上大致是恒定的

21.

系统发生树的两个特征是：

进化分支和进化节点

树的拓扑结构和分支长度

进化分支和树根

序列比对和引导检测方法

22.

下列哪一个是基于字母特征的系统发生分析的算法：

邻位连接法（

法）

B. Kimura

算法

最大似然法（

）

非加权平均法（

UPGMA

）

23.

基于字母特征和基于距离的系统发生分析的算法的基本差

异是：

基于字母特征的算法没有定义分支序列的中间数据矩

250

矩阵定义的进化距离为两同源序列在给定的时间

有多少百分比的氨基酸发生改变：

A. 1% B. 20%

C. 80%

的不同：

全局比对通常用于比对

DNA

序列，而局部比对通常用于

比对蛋白质序列

全局比对允许间隙，而局部比对不允许

全局比对寻找全局最大化，而局部比对寻找局部最大化

D. 250%

13.

下列哪个句子最好的描述了两个序列全局比对和局部比对

阵

基于字母特征的算法可应用于

DNA

或者蛋白质序列，

而基于距离仅能用于

DNA

基于字母特征的算法无法运用简约算法

基于字母特征的算法的进化分支与进化时间无关

24.

一个操作分类单元（

OTU

）可指：

多序列比对 B.

蛋白质序列

进化分支

进化节点

25.

构建进化树最直接的错误来源是：

多序列比对错误

采样的算法差异

假设进化分支是单一起源

尝试推测基因的进化关系

26.

第一个被完整测定的基因组序列是：

啤酒酵母的

号染色体

流感病毒 C.

人类基因组

27.

普通的真核生物线粒体基因组编码大约多少个蛋白质：

X174

端粒中

片段复制区域

36.

从头预测真核基因的原因有：

外显子

内含子边界难以确定

内含子长度可能只有几个碱基对

编码区域的

含量并不总是与非编码区相同 D.

以

上三个方面的原因

37.

人类基因组大小大约是多少

：

A. 130

B. 300

C. 3000

D. 30000

38.

各种重复元件在人类基因组中大约占的百分比为：

A. 5%

B. 25%

C. 50%

D. 95%

39.

蛋白质编码区域占人类基因组百分比是：

A. 1-5%

B. 5-10%

C. 10-20%

D. 20-4-%

40.

人类基因组中

含量高的区域：

基因密度相对较低 B.

基因密度相对较高

基

因密度多变

基因所含密码子相对较少

41.

人类复合孟德尔遗传的基因疾病约占疾病基因的：

A. 1%

B. 10%

C. 50%

D. 60%

42.

单基因疾病趋向于：

在普通人群较少见，并且发生时间较早

在普通人群较常见，并且发生时间较早

在普通人群较少见，并且发生时间较晚

在普通人群较常见，并且发生时间较晚

名词解释

A. 10

B. 100

软件太难使用

1000

D. 10000

28.

根据基因组序列预测蛋白质编码基因的算法的最大问题是：

假阳性率太高，许多不是外显子的序列部分被错误指定

假阳性率太高，许多不是外显子功能未知

假阴性率太高，丢失太多外显子位点

29.

HIV

病毒亚型的系统演化研究可以：

证实

HIV

病毒是由牛病毒演化而来

用于指导开发针对保守蛋白的疫苗

证实哪些人类组织最容易遭受病毒侵染

30.

一个典型的细菌基因组大小约为多少

：

A. 20000

B. 200,000

C. 2000000

要原因是：

细菌拥有不同的密码子

细菌没有细胞核

细菌很少有基因与真核同源

细菌

DNA

的基因含量、组成结构很不一样

32.

下列具有最小基因组的原核生物可能是：

嗜极生物

病毒 C.

胞内细菌

杆菌

D. 20000000

31.

细菌基因组与真核生物基因组分析工具存在较大差异的主

生物信息学：

是一门结合生物技术和信息技术从而揭示生物学中新原

理的科学。

鸟枪法测序：

一种测序方法，包括从基因组中获得随机的、已测序的

克隆片段，并且对初始基因的位置一无所知。

BLAST

：

基本局部相似性比对搜索工具。在序列数据库中快速查找与

给定的序列具有最优局部对准结果的序列的一种序列对算法。

整体联配：

对两个核苷酸或蛋白质序列的全长所进行的比对。

FASTA

：

是第一个被广泛使用的数据库相似性搜索算法，这个程序通

过扫描序列中“词”的小配对，从而寻找最优局部比对。

算法：

在计算机程序中包含的一种固定过程。

序列比对：

将两个或多个序列排在一起，以达到最大一致性的过程（对

于氨基酸序列是比较他们的保守性），这样评估序列间的相似性和同源

性。

33.

要证明某大肠杆菌中的某个基因是水平转移而来，需要：

分析该大肠杆菌中该基因的

含量与其他基因是否有

很大差异

分析该大肠杆菌中该基因的密码子使用与其他基因是

否有很大差异

系统发生分析该基因与其他物种中基因的同源关系

获取以上三个方面的信息

34.

值矛盾是指：

某些基因组中核苷酸

的含量少

真核生物基因组大小同编码蛋白质的基因个数没有相关

性

多序列比对：

三个或多个序列之间的比对，如果序列在同一列有相同

结构位置的残基和（或）祖传的残基，则会在该位置插入空位。

最佳联配：

两个序列之间有最高打分值的排列。

10.

空位：

在两条序列比对过程中需要在检测序列或目标序列中引入空位，

以表示插入或删除。

11.

模块替换矩阵：

在替换矩阵中，每个位置的打分是在相关蛋白局部比

对模块中观察到的替换的频率而获得的，每个矩阵被修改成一个特殊的

进化距离。

12.

可接受点突变：

一个用于衡量蛋白质序列的进化突变程度的单位。

13.

互补序列：

能够与其他

DNA

片段根据碱基互补序列（

与

配对，

与

配对）形成两练结构的核苷酸序列。

14.

保守序列：

指

DNA

分子中的一个核苷酸片段或者蛋白质中氨基酸片

段，它们在进化过程中基本保持不变。

真核生物基因组大小同屋中的复杂性相关性很小

真核生物基因组大小同进化上的年龄相关性小

35.

成百上千个

4~8bp

的重复序列单元最可能出现在：

散布性重复序列中

假基因中

真核生物基因组大小同屋中的复杂性相关性很小

15.

邻接片段：

一组在染色体上有重叠区域的DNA片段的克隆；

16.

支架：

由序列重叠群拼接而成。

17.

注释：

对数据库中原始的DNA碱基序列添加相关信息（比如编码的基

因，氨基酸序列等）或其他的注解。

18.

基因预测：

用计算机程序对可能的基因所做的预测，它是基于DNA片

段与已知基因序列的匹配程度的。

19.

直系同源：

指不同种类的同源序列，他们是在物种的形成事件中从一

个祖先序列独立进化而成的，可能有相似功能，也可能没有。

20.

旁系同源：

是通过类似基因复制的机制产生的同源序列。

21.

替换：

在指定的位置不相同的氨基酸进行连配，如果联配的残基有相

似的物化性质，那么替换是保守的。

25.

结构域：

蛋白质在折叠时候与其它部分相独立的一个不连续部分，他

有自己独特的功能。

26.

开放阅读框（

ORF

）：

位于DNA或RNA上起始密码子与终止密码子

之间的序列。

27.

表达谱：

一个显示某个同源家族中指定位置打分值和空位罚分的表格，

可以用于搜索序列数据库。

28.

分子钟：

对于每一个给定基因（或蛋白质）其分子进化率大致是恒定

的。

29.

系统发生：

是指生物种族的进化历史，亦即生物体在整个进化谱

30.

分子进化树：

在研究生物进化和系统分类中，常用一种类似树状分支

的图形来概括各种（类）生物之间的亲缘关系，这种树状分支的图形成

22.

表达序列标签（

EST

）：

一种短的DNA片段，是cDNA分子的一部分，

为系统发育树。

可用来鉴定基因，通常用于基因定位和基因图谱中。

23.

多个个体之间DNA的差异叫多态性。

24.

多态性：

序列模式：

蛋白质序列中短的保守区域，它们是结构域中保守性很高

的部分。

请论述生物信息学的研究内容有哪些？

问答题

1）生物分子数据的收集与管理：①基因组数据

生物信息学的大体定义是什么？其发展历程如

库；②蛋白质序列数据库；③蛋白质结构数据库。

何？

2）数据库搜索及序列比较

（

）以计算机为工具，通过对生物学实验数据的

3）基因组序列分析：①遗传语言分析；②基因组

获取、加工、存储、检索与分析，达到揭示数据结构分析；③基因识别；④基因功能注释；⑤基因

若蕴含的生物学意义从而解读生命活动规律的目调控信息分析；⑥基因组比较。

的的一门工程技术学科，同时是一种重要的研究

4）基因表达数据的分析与处理：分析是目前生物

开发平台与工具。目前主要的研究方向有：序列信息学研究的热点和重点。处理主要是进行聚类

比对、基因识别、基因重组、蛋白质结构预测、分析，将表达模式相似的基因聚为一类，在此基础

基因表达、蛋白质反应的预测，以及建立进化模上寻找相关基因，分析基因的功能。

型。

5）蛋白质结构与功能预测：蛋白质的生物功能由

（

）发展历程：蛋白质的结构所决定，蛋白质结构预测成为了解蛋



世纪

年代，生物信息学开始孕育；



世

白质功能的重要途径。蛋白质结构预测分为：（

）

纪

年代，生物分子信息在概念上将计算生物学二级结构预测；（

）空间结构预测。

和计算机科学联系起来；



世纪

年代，生物

6）基因-蛋白质相互作用网络

信息学的真正开端；④

世纪

年代到

年代

7）整个系统调控网络

初期，出现了一系列著名的序列比较方法和生物

请叙述构建系统进化树的一般步骤。

信息分析方法；⑤

世纪

年代以后，出现一批

1) 选择合适的分子序列——可以用DNA、RNA或

生物信息服务机构和生物信息数据库；⑥

世纪蛋白质序列数据来构建。

90年代后，HGP促进生物信息学的迅速发展。 2) 多序列比对——是生物信息学中的核心问题之

一，也是系统发育分析中的一个基础步骤和关键环

节。„„的结果将直接影响系统发育分析的结论。

3) 选择合适的建树方法——最大简约法主要适用

于序列相似性很高的情况；距离法在序列具有比较

高的相似性时适用；而最大似然法和贝叶斯法可用

于任何相关的数据序列集合。

4) 系统发育树的评估——一棵用距离法、最大简

约法或最大似然法构建的系统发育树可看做是一

个点估计，对这个点估计最好加上一个可靠性测

度，如重复抽样检验，內枝检验。

NCBI

的

Entrez

检索包含了哪些方面的信息：

Entrez是NCBI为用户提供整合的访问序列、定位、

分类及结构数据的搜索和检索的系统，是一个用

以整合

NCBI

数据库中信息的搜寻和检索的工具。

可以检索以下与

NCBI

链接的基因序列数据库的

分子生物数据和书目文献资料——

(1) GenBank、EMBL、

DDBJ

中的DNA序列；

(2) SWISS-PROT、PIR、PRF、PDB

B中的蛋白质序

列以及

DNA

序列数据库中翻译的蛋白质序列；

(3) 基因和染色体图像数据；

(4) PDB以及收入NCBI分子模型数据库(MMDB)

的蛋白质三维结构；

(5) 通过PubMed检索

Medline

和PreMedline数据

库。

BLAST

系列软件分别用哪些数据搜索何种

数据库？

真核基因结构注释包括哪些内容？

电子爱好者 - 最新技术资讯及电子产品介绍！

2012生物信息学题库

更多相关文章

nqo1_基金支持热词逐年推荐_【万方软件创新助手】_20140801

ABO_正反定型不符的白血病患者血型鉴定与临床分析

r语言格兰杰因果关系检验

格兰杰因果关系算法

格兰杰因果关系检验matlab

两品种兔皮肤Shh基因的表达规律研究

蛋白三级结构pdb文件

ITU-RR-Vol.ii-App42中英文

Python之序列化与反序列化（pickle反序列化篇下）

有效的xp sp3 专业版序列码，方便虚拟机xp系统需求

时间序列论文常用数据集

时间序列分类02：数据可视化与问题分析建模流程详解（UCI-HAR）

序列检测器（10010）

php是什么电荷,科学网—蛋白质的表面静电势、ζ-电位和表面电荷 - 朱俊向的博文...

IDM序列激活永久授权版下载 v6.4.1 电脑版

分治算法题:nlgn时间复杂度计算原序列的重要逆序个数

蛋白质结构预测---残基接触的基础知识---接触概念（三）

用MDT 2012为企业部署windows 7（七）--创建标准操作系统部署任务序列

时间序列预测模型实战案例(八)(Informer)个人数据集、详细参数、代码实战讲解

利用Transformer替代MSA从蛋白序列中学习Contact Map

发表评论

推荐文章

不用再找了，吐血整理ChatGPT 论文指令手册~

硬盘安装Win7

amd显卡怎么设置风扇？

AMD CPU电脑安装Android Studio详细步骤以及无法成功install HAXM的解决办法

IntelliJ IDEA 2018安装与破解

热门文章

什么是BT种子、迅雷下载链接、磁力链接

虚拟化linux内存复用技术,【虚拟化实战】VM设计之二内存机制

Ubuntu 24.04 LTS 安装 双系统与Windows共存

滴滴打车的登录方式

Chrome 浏览器如何完美实现滚动截图技巧,在电脑上实现长截屏

CorelDRAW2024激活码揭秘免费获取方法

暴风云视频平台点播SDK使用介绍（三）-- 视频播放（IOS）

安装Windows10系统后，CPU 不再支持虚拟化解决方案

【Linux】Ubuntu下搜狗拼音输入法

华为畅玩5X无Root查看已保存WiFi热点密码教程

最新文章

wifi卡慢延迟高_如何解决WiFi又慢又卡

上位机图像处理和嵌入式模块部署（树莓派4b之wifi切换）

NanoPi NEO Air使用三：OverlayFS、CPU温度和频率、wifi、蓝牙、npi-config

升级到Windows 11 22H2后导致WPA2企业版WIFI认证失败另类解决方案

华为畅玩5X无Root查看已保存WiFi热点密码教程

如何0元搭建一个共享收费Wifi？

搭建手机文件服务器,普通用户的低成本家庭文件服务器(伪NAS)的搭建（手机备份篇）...

普联（TP-LINK）品牌，WiFi6路由器（三频）与WiFi5路由器（双频）组mesh注意事项小记

WIFI模块各种常见的配网方式说明及其比较

简明的wifi通信协议介绍

无线WIFI安全渗透与防御

WPA2-PSK无线密码破解

EBYTE E103-W02 WIFI模块配置总结（TCP+UDP+HTTP+云透传）

【WiFi】基本知识整理

linux输入开机密码后很慢,开机很快但输入密码后进入桌面却非常慢

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Ubuntu 24.04 LTS 安装双系统与Windows共存

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载