一、单选题
1、以下数据库不能用于检索核酸序列的是( )
A. GenBank B. PDB C. EMBL D.DDBJ
2、蛋白质结构数据常保存为下面哪一种格式为后缀的文件( )
A. PDB B. txt C. Seq D. mdb
3、下列格式属于FASTA格式的是 ( )
A. >seq1 B. <seq1 C. ATGCCATA D. > ATGCCATA
ATGCCATA ATGCCATA
二、填空题
1、阅读以下数据格式,写出以下标注的含义:

LOCUS是 ,DEFINITION是 ,
ACCESSION是 ,VERSION是 ,SOURCE是
在论文中使用了NCBI数据库中的该序列,应标注该序列的编号,应填 。

2、阅读以下Prosite中结构基序的示例,说明其中各符号含义:

- 连字符用来 。
[ ] 每个方括号中的残基代表序列基序中某一特殊位置 的残基。
{ } 大括号中的符号代表序列基序中特定位置 的残基。
X 表示 。
(n) 代表某特定残基的 。
3、下面是NCBI中SARS病毒的基因组,请根据以下图说明SARS基因组有 个基因,编码 个蛋白。

4、检索蛋白质序列可使用哪个数据库,试举两例 、 。
5、检索蛋白质结构常使用 数据库。
6、根据以下检索结果说明该蛋白质结构在PDB数据库中的编号为 ,其结构测定方法为 。

名词
一级数据库,二级数据库,Genbank,UniGene,PDB,MMDB格式,EMBL,NCBI,结构浏览器,Rasmal,swiss-pdbviewer,Swiss-model,Prints数据库,Prosite数据库,BankIt,Cn3D,PIR数据库,SCOP数据库,CATH数据库

