admin管理员组

文章数量:1530516

2024年7月21日发(作者:)

字符集合

只是一些非控制型字符,象空格和结束符,出现在PDB文件记录中。也就是:

abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ

1234567890

` - = [ ] ; ' , . / ~ ! @ # $ % ^ & * ( ) _ + { } | : " < > ?

空格和结束符。结束符根据系统而定,Unix用一行字符,而其他的系统可能就用一个回车来表示。

特殊字符

希腊字母就详细的拼写出来。比如:α, β, γ

原子用DOT表示。

右箭头用-->表示。

左箭头用<--表示。

上标用两个等号表示开始和结束。比如:S==2+==

下标用一个等号来表示开始和结束。比如:F=c=

如果等号两边至少有一边有一个空格,那么这个字符就是表示等号。比如:2 + 4 = 6

逗号,冒号和括号用来表示文档中的分界苻,也就是下面几种中的一种:

List

SList

Specification List

Specification

如果逗号,冒号或者括号在任何一片文档中使用不是作为分界苻的话,那么肯定有字符被漏掉了。比如下边例子中第四行的"":

COMPND MOL_ID: 1;

COMPND 2 MOLECULE: GLUTATHIONE SYNTHETASE;

COMPND 3 CHAIN: NULL;

COMPND 4 SYNONYM: GAMMA-L-GLUTAMYL-L-CYSTEINE:GLYCINE LIGASE

COMPND 5 (ADP-FORMING);

COMPND 6 EC: 6.3.2.3;

COMPND 7 ENGINEERED: YES

COMPND MOL_ID: 1;

COMPND 2 MOLECULE: S-ADENOSYLMETHIONINE SYNTHETASE;

COMPND 3 CHAIN: A, B;

COMPND 4 SYNONYM: MAT, ATP:L-METHIONINE S-ADENOSYLTRANSFERASE;

COMPND 5 EC: 2.5.1.6;

COMPND 6 ENGINEERED: YES;

COMPND 7 BIOLOGICAL_UNIT: TETRAMER;

COMPND 8 OTHER_DETAILS: TETRAGONAL MODIFICATION

数据类型-------------------------------------

该部分该部分主要用来描述试验和记录中该大分子的一些基本信息,有

以下几种记录:

HEADER,OBSLTE,TITTITLE,CAVEAT,COMPND,SOURCE,KEYWDS,EXPDTA,

AUTHOR,REVDAT,SPRSDE,JRNL和REMARK部分。以下来具体说明一下各个记录。

记录类型--------------------------------------

按照在记录中出现的频率区分:

SINGLE

一个文件中只出现一次.按字母顺序列出如下:

记录类型 说明

CRYST1 晶胞参数

END 结束

HEADER 分子类,公布日期,ID号

MASTER 版权拥有者

ORIGXn 直角-PDB坐标

SCALEn 直角部分结晶学坐标

如果这些记录在一个记录中重复出现是错误的。

SINGLE CONTINUED

在记录中概念性的只出现一次,但信息内容可能超过了可利用列的数目.因次这些记录在后来的排列中会继续.按字母顺序列出如下:

记录类型 说明

AUTHOR 结构测定者

CAVEAT 可能的错误提示

COMPND 化合物名称

EXPDTA 测定结构所用的试验方法

KEYWDS 关键词

OBSLTE 注明该id号已改为新号

SOURCE 化合物来源

SPRSDE 已撤消或更改的相关记录

TITLE 说明试验方法类型

MULTIPLE

大部分记录类型多次出现,经常出现在这些组中,组中的信息理论上并没有连接,但已呈现为列表的组成部分.这种记录类型中的许多习惯连载可能不

仅仅制定记录还和其他记录相联.按字母顺序列出如下:

记录类型 说明

ANISOU 温度因子

ATOM 标准基因的原子坐标

CISPEP 顺势残基

CONECT 有关记录

DBREF 其他序列库的有关记录

HELIX 螺旋

HET 非标准残基

HETSYM 非标准残基的同义字

HYDBND 氢键

LINK 残基间化学键

MODRES 对标准残基的修饰

MTRIXn 显示非晶相对称

REVDAT 修订日期及相关内容

SEQADV PDB和其它记录的出入

SEQRES 残基序列

SHEET 片层

SIGATM 标准差

SIGUIJ 温度因子

SITE 特性位点

SLTBRG 盐桥

SSBOND 二硫键

TURN 转折

TVECT 转换因子

Multiple Continued

在记录中概念性的出现多次,但信息内容可能超过了可利用列的数目.因次这些记录在后来的排列中会继续.按字母顺序列出如下:

记录类型 说明

FORMUL 非标准残基化学式

HETATM 非标准集团原子坐标

HETNAM 非标准残基的化学名称

Grouping

有三种记录类型用来聚合其他记录. 按字母顺序列出如下:

记录类型 说明

ENDMDL 亚基结束

MODEL 多亚基时,示亚基号

TER 链末端

MODEL/ENDMDL 记录包围着 ATOM, HETATM, SIGATM, ANISOU, SIGUIJ,和 TER 记录. TER 记录预示链的末端.

Other

其他记录类型有详细的内部结构.按字母顺序列出如下:

记录类型 说明

JRNL 发表坐标集的文献

REMARK 注解

记录的表示

PDB数据库中的数据都应按照一定的规定来出现,强制记录类型必须出现在所有的记录中,当强制数据没有提供,记录名必须出现在记录中并以

NULL表示当此条件存在时选择项表就变成强制记录类型。以下表格是对这两种类型的具体划分和描述:

记录类型

HEADER

OBSLTE

TITLE

CAVEAT

COMPND

SOURCE

KEYWDS

EXPDA

AUTHOR

REVDAT

SPRSDE

JRNL

REMARK 1

REMARK 2

说明

强制

可选

强制

可选

强制

强制

强制

强制

强制

强制

可选

可选

可选

强制

变为强制的条件

个别记录中强制

该记录中有错误

在被替代的记录中

出版物描述了该试验

出版物描述了该试验

REMARK 3

REMARK N

DBREF

SEQADV

SEQRES

MODRES

HET

HETNAM

HETSYN

FORMUL

HELIX

SHEET

TURN

SSBOND

LINK

HYDBND

SLTBRG

CISPEP

SITE

CRYST1

ORIGX1 ORIGX2 ORIGX3

SCALE1 SCALE2 SCALE3

MTRIX1 MTRIX2 MTRIX3

TVECT

MODEL

ATOM

SIGATM

ANISOU

SIGUIJ

TER

ENDMDL

CONNECT

MASTER

END

记录部分的划分

强制

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

强制

强制

强制

可选

可选

可选

可选

可选

可选

可选

可选

可选

可选

强制

强制

一定条件下强制,如记录在备注描述

每个缩氨酸链的长度大于十个残基并

且核酸记录存在于核算蛋白库中(NDB)

有序列冲突

ATOM记录存在

有修饰存在

有不标准的残基除了水分子

有不标准的残基除了水分子

有不标准的残基或水

有二硫键存在

完全不对称单元

非晶相对称

记录中多于一个MODEL

有标准的残基存在

有ATOM记录存在

有MODEL存在

不标准的团存在

Title

Remark

大概描述

参考书目,最大分辨率,注解等

一级结构 氨基酸或核苷酸序列和PDB序列和

其他序列库的有关记录

不标准组的描述

二级结构

化学元素连接

大分子的特征

晶体细胞描述

坐标描述

原子坐标数据

HEADER, OBSLTE, TITLE,CAVEAT, COMPND,

SOURCE,KEYWDS, EXPDTA, AUTHOR,REVDAT,

SPRSDE, JRNL

REMARKs 1, 2, 3 and others

Primary structure DBREF, SEQADV, SEQRES,MODRES

Heterogen

Secondary structure

Connectivity annotation

Miscellaneous feature

Crystallographic

Coordinate transformation

Coordinate

HET, HETNAM, HETSYN, FORMUL

HELIX, SHEET, TURN

SSBOND, LINK, HYDBND, SLTBRG,CISPEP

SITE

CRYST1

ORIGXn, SCALEn, MTRIXn, TVECT

MODEL, ATOM, SIGATM,ANISOU, SIGUIJ, TER,

HETATM, ENDMDL

Connectivity

Bookkeeping

化学键连接

概要信息和结束标志

CONECT

MASTER, END

对数据类型的说明

数据类型

Achar

Atom

Character

Continuation

Date

IDcode

Integer

Token

List

Lstring

LString(n)

Real(n,m)

Record name

Residue name

Slist

Specification

Specification list

String

String(n)

SymOP

残基名字

在PDB格式中出现的标准残基的名字:

残基类型

氨基酸

核酸

其他

残基名字

ALA, ARG, ASN, ASP, CYS, GLN, GLU, GLY, HIS, ILE, LEU, LYS

A, C, G, T, U, I, +A, +C, +G, +T, +U, +I

UNK(unknown)

描述

一个英文字母(A-Z,a-z)

原子名

ASCII码和空格

如果一行描述不完用此表示序列号,占两个字符右对齐,第一个用空格

占九个字符dd-mmm-yy, DD表日期,右对齐不足左补零;MMM表月份用常用的三个英文字母表示;YY表20世纪的一

年,他们都必须是有效日期

占四个字符,第一个是阿拉伯数字(0-9),余下的三个由希腊数字组成,字母必须是大写的。若第一个是阿拉伯数

字零则对此蛋白质的描述中没有坐标数据

右对齐,不足的用空格填充的整型数据

由一组没有空格的字符组成,结尾部分紧跟着冒号和空格

一个由逗号分开的字符串

字符串,任何空格都有意义必须保存

有N个字符的Lstring

实型

记录的名字,由六个字符组成,左对齐,不足的用空格补充

右对齐格式标准氨基酸或核苷酸中的一个,后有列表.不标准组分在HET中详细说明

由一些内容组成的字符串,有分号分开

由一些token记录组成的字符串,由冒号分开

由Specifications组成的序列,由分号分开

由字符组成的序列,可能有些空格,但应该详细说明

由N个字符组成String

由4-6个数字组成的整数,右对齐格式.详细资料在Appendix 1

Appendix 4中有更多关于标准残基名和缩写的信息, Appendix 5中有他们的化学式和分子量.

标题部分

HEADER(分子类,公布日期、ID号)

综述

该记录包含三个方面的内容:蛋白质的种类,被该数据库接收的日期和唯一区分该蛋白质的id CODE.

记录格式

列 数据类型 字段名称 定义描述

1 – 6

11 – 50

51 – 59

63 – 66

细节

改分类表示是左对齐的,并且由于分给字符位的限制,有时分类名太长,要用简写表示。在KEYWDS记录中存着改分类的全称。

示例

1 2 3 4 5 6 7

345678934567890

HEADER MUSCLE PROTEIN 02-JUN-93 1MYS

HEADER HYDROLASE (CARBOXYLIC ESTER) 08-APR-93 2PHI

HEADER COMPLEX (LECTIN/TRANSFERRIN) 07-JAN-94 1LGB

OBSLTE (注明此ID号已改为新号)

综述

该记录出现在已经被收回的蛋白质的描述中,可以作为一个标志。任何新的记录都能代替别回收的记录.这个版本允许多个新纪录代替现有记录.

记录格式

1 – 6

9 – 10

12 – 20

22 – 25

32 – 35

37 – 40

42 – 45

47 - 50

52 - 55

57 – 60

62 – 65

67 – 70

细节

只有第一个提交记录的人才有权利收回改蛋白质,所有回收的记录都有研究用途.

示例

1 2 3 4 5 6 7

345678934567890

OBSLTE 31-JAN-94 1MBP 2MBP

TITLE(说明实验方法类型)

综述

该记录描述试验的题目或者对它的一些分析。该记录唯一区分一个蛋白质。

记录格式

1 - 6

9 - 10

11 - 70

细节

数据类型

Record name

Continuation

String

字段名称

"TITLE "

顺序

标题

定义描述

允许多重记录串联表示不同行的顺序号

试验题目

数据类型

Record name

Continuation

Date

IDcode

IDcode

IDcode

IDcode

IDcode

IDcode

IDcode

IDcode

IDcode

字段名称

"OBSLTE"

continuation

repDate

idCode

rIdCode

rIdCode

rIdCode

rIdCode

rIdCode

rIdCode

rIdCode

rIdCode

定义描述

允许多重记录串联表示不同行的顺序号

被替代的日期

该记录的id code

替换的id code

替换的id code

替换的id code

替换的id code

替换的id code

替换的id code

替换的id code

替换的id code

Record name

String(40)

Date

IDcode

"HEADER"

classification

depDate

idCode

该蛋白质的分类

被数据库接收的日期

唯一标识某个蛋白

1. 描述记录内容和区别相似记录得程序或条件,使录入者有机会着重强调做这些特殊试验得根本目的.

2. TITLE可能包括得一些项目: -实验类型

-对突变的描述

-记录中只给出α-碳原子.

示例

1 2 3 4 5 6 7

345678934567890

TITLE RHIZOPUSPEPSIN COMPLEXED WITH REDUCED PEPTIDE INHIBITOR

TITLE BETA-GLUCOSYLTRANSFERASE, ALPHA CARBON COORDINATES ONLY

CAVEAT(可能的错误提示)

综述

警告在蛋白质记录中中出现的错误。

记录格式

列 数据类型 字段名称 定义描述

1 - 6 Record name "CAVEAT"

9 - 10 Continuation continuation 允许多重记录串联表示不同行的顺序号

12 - 15 IDcode idCode 蛋白质的ID code

20 - 70 String comment 警告的原因

细节

1. PDB在还未回收的错误记录中加此记录,用的比较保守只在外部评论后用.

2. PDB不能核实转化回晶胞时注意此记录,此时分子结构依然正确.

示例

1 2 3 4 5 6

345678934567890

CAVEAT 1ABC THE CRYSTAL TRANSFORMATION IS IN ERROR BUT IS

CAVEAT 2 1ABC UNCORRECTABLE AT THIS TIME

COMPND(化合物分子组成)

综述

描述蛋白质的组成

记录格式

列 数据类型 字段名称 定义描述

1 - 6 Record name "COMPND"

9 - 10 Continuation continuation 允许多重记录串联表示不同行的顺序号

11 - 70 Specification list compound 对分子成分的描述

细节

对蛋白质组成的描述又细分为如下:

记号 确切涵义描述

MOL_ID 每一成分的数目

MOLECULE 分子名

CHAIN 逗号分开链标识符,若空白用"NULL"表示

FRAGMENT 对结构域或具体部分的详细描述

SYNONYM MOLECULE同义部分,逗号分开

EC 酶学委员会相关号码,不止一个时用逗号分开

ENGINEERED 分子通过重组产生或纯化学合成

MUTATION 自野生型突变的描述

BIOLOGICAL_UNIT 完整功能单元描述

7

OTHER_DETAILS 增加的注释

对MUTATION以下举例说明惯用的几种突变类型:

突变类型 描述 形式

简单替代

Asn替代His 57 H57N

只在C链中Asn替代His 57 Chain C, H57[A]N

插入突变 His and Pro 插入Lys 48前 INS(HP-K48)

A链和C链的Arg 141缺失,B链

缺失突变

中的不缺失 Chain A, C, DEL(R141)

His 23到ARG 26缺失 DEL(23-26) DEL(23-26)

只B链的His 23C和Arg 26缺失 Chain B, DEL(H23[C],R26)

如有多于十种突变: - 所有突变在SEQADV记录中列出

- 一些突变可能在COMPND的MUTATION中列出来强调录入者认为最重要的部分.

示例

1 2 3 4 5 6

345678934567890

COMPND MOL_ID: 1;

COMPND 2 MOLECULE: HEMOGLOBIN;

COMPND 3 CHAIN: A, B, C, D;

COMPND 4 ENGINEERED: YES;

COMPND 5 MUTATION: CHAIN B, D, V1A;

COMPND 6 BIOLOGICAL_UNIT: HEMOGLOBIN EXISTS AS AN A1B1/A2B2

COMPND 7 TETRAMER;

COMPND 8 OTHER_DETAILS: DEOXY FORM

COMPND MOL_ID: 1;

COMPND 2 MOLECULE: COWPEA CHLOROTIC MOTTLE VIRUS;

COMPND 3 CHAIN: A, B, C;

COMPND 4 SYNONYM: CCMV;

COMPND 5 MOL_ID: 2;

COMPND 6 MOLECULE: RNA (5'-(*AP*UP*AP*U)-3');

COMPND 7 CHAIN: D, F;

COMPND 8 ENGINEERED: YES;

COMPND 9 MOL_ID: 3;

COMPND 10 MOLECULE: RNA (5'-(*AP*U)-3');

COMPND 11 CHAIN: E;

COMPND 12 ENGINEERED: YES

COMPND MOL_ID: 1;

COMPND 2 MOLECULE: HEVAMINE A;

COMPND 3 CHAIN: NULL;

COMPND 4 EC: 3.2.1.14, 3.2.1.17;

COMPND 5 OTHER_DETAILS: PLANT ENDOCHITINASE/LYSOZYME

SOURCE(化合物来源)

综述

用来详细描述记录中每个生物大分子的生物或化学来源。用习惯命名和系统命名共同描述.

记录格式

列 数据类型 字段名称 定义描述

1 - 6 Record name "SOURCE"

9 - 10 Continuation continuation 允许多重记录串联表示不同行的顺序号

11 - 70 Specification list srcName 分子来源名

细节

同COMPND一样,对SOURCE描述也细分为如下:

记号 确切涵义描述

7

MOL_ID

SYNTHETIC

FRAGMENT

ORGANISM_SCIENTIFIC

ORGANISM_COMMON

STRAIN

VARIANT

CELL_LINE

ATCC

ORGAN

TISSUE

CELL

ORGANELLE

SECRETION

CELLULAR_LOCATION

PLASMID

GENE

EXPRESSION_SYSTEM

EXPRESSION_SYSTEM_STRAIN

EXPRESSION_SYSTEM_VARIANT

EXPRESSION_SYSTEM_CELL_LINE

EXPRESSION_SYSTEM_ATCC_NUMBER

EXPRESSION_SYSTEM_ORGAN

EXPRESSION_SYSTEM_TISSUE

EXPRESSION_SYSTEM_CELL

EXPRESSION_SYSTEM_ORGANELLE

EXPRESSION_SYSTEM_CELLULAR_LOCATION

EXPRESSION_SYSTEM_VECTOR_TYPE

EXPRESSION_SYSTEM_VECTOR

EXPRESSION_SYSTEM_PLASMID

EXPRESSION_SYSTEM_GENE

OTHER_DETAILS

示例

1 2 3

345678934567890

SOURCE MOL_ID: 1;

SOURCE 2 ORGANISM_SCIENTIFIC: AVIAN SARCOMA VIRUS;

SOURCE 3 STRAIN: SCHMIDT-RUPPIN B;

SOURCE 4 EXPRESSION_SYSTEM: ESCHERICHIA COLI;

SOURCE 5 EXPRESSION_SYSTEM_PLASMID: PRC23IN

SOURCE MOL_ID: 1;

SOURCE 2 ORGANISM_SCIENTIFIC: GALLUS GALLUS;

SOURCE 3 ORGANISM_COMMON: CHICKEN;

SOURCE 4 ORGAN: HEART;

SOURCE 5 TISSUE: MUSCLE

KEYWDS(关键词)

综述

该部分主要用来描述关于该蛋白质的一些关键字,用逗号分开。

记录格式

列 数据类型 字段名称

1 - 6 Record name "KEYWDS"

9 - 10 Continuation Continuation

11 – 70 List keywds

分子数目

化学合成来源

分子结构域或片段的详细描述

生物体的系统命名

生物体的习惯命名

标识链

标识参数

实验细胞链

American Type Culture Collection 号码

有特殊功能的组织

一般功能和结构的组织细胞

标识特殊的细胞类型

细胞组织结构

标识分泌物如唾液,尿液,毒液等

标识细胞位置

识别包含基因的质体

标识基因

重组大分子表达系统

生物体的张力

生物体的参数

细胞排列

标识ATCC numbe

标识表达分子的特殊器官

标识表达分子的特殊组织

表示细胞类型

标识细胞器官

标识位置

标识载体类型如质粒,病毒,粘粒等

标识常用载体

在重组试验中常用质粒

重组试验中常用的基因的名

表示别处给出的信息来源

4 5

定义描述

允许多重记录串联表示不同行的顺序号

各个不同的关键字用逗号分开

6 7

细节

在该记录中描述的关键字的内容可以是:功能分类,代谢角色,在生物或化学上的活性,结构分类等。

示例

1 2 3 4 5 6 7

345678934567890

KEYWDS LYASE, TRICARBOXYLIC ACID CYCLE, MITOCHONDRION, OXIDATIVE

KEYWDS 2 METABOLISM

EXPDTA(测定结构所用的实验方法)

综述

该记录用来描述关于试验的一些信息,主要是做试验时用的方法:电子衍射,光纤衍射,荧光传递,中子衍射,NMR(核磁共振),理论模型,X光

衍射等。

记录格式

1 - 6

9 - 10

11 – 70

细节

该记录是必须出现的;如果有多于一种的方法被使用,用分号分开。对某一方法的评论出现在分号前面。

示例

1 2 3 4 5 6 7

345678934567890

EXPDTA X-RAY DIFFRACTION

EXPDTA NEUTRON DIFFRACTION; X-RAY DIFFRACTION

EXPDTA NMR, 32 STRUCTURES

AUTHOR(结构测定者)

综述

该记录存储有关科学家的名字信息。多个名字用逗号分开。

记录格式

1 - 6

9 - 10

11 - 70

细节

个人姓名的表示: -First names和middle names在姓之前大写于词首,后跟一句点.

-只有作者的姓完整给出.

-若为作者名字的一部分可用连字号.

-姓可用省略符号表示

- Junior不是简略.

-变音或其他字符修改都未给出

个人姓名的结构: -词首大写字母和其后的句点后么没有空格.

-空格只用在姓中或姓和Junior, II,或 III之间

-缩写作为姓的一部分如St.或 Ste.和其后的姓的下一部分之间有一句点和空格.

集体名字的表示: -所有作者的团体名字应该完整拼写.

-大团体的名称应在其细分名称之前,如某所大学的化学系.

特殊情况: -名字若有英文译本就用英文表示,否则就用不本土语言,必要时可音译.

数据类型

Record name

Continuation

List

字段名称

"AUTHOR"

Continuation

authorList

定义描述

允许多重记录串联表示不同行的顺序号

作者的名字,用逗号分开

数据类型

Record name

Continuation

SList

字段名称

"EXPDTA"

Continuation

technique

定义描述

允许多重记录串联表示不同行的顺序号

试验用的方法

示例

1 2 3 4 5 6 7

345678934567890

AUTHOR ,,BACK,,,

AUTHOR 2 PS JUNIOR,. STEVENS

AUTHOR C.-N,T-CLEWS, DI SANSAVERINO

REVDAT(修订日期及相关内容)

综述

该记录用来描述曾经修改过的历史记录。

记录格式

列 数据类型 字段名称 定义描述

1 - 6 Record name "REVDAT"

8 – 10 Integer modNum 修改的号码

11 - 12 Continuation continuation 允许多重记录串联表示不同行的顺序号

14 - 22 Date modDate 更改的日期,不再重复

24 - 28 String(5) modId 标识这个特殊修改

32 Integer modType 用一个整数来表示更改的类型

40 - 45 LString(6) record 更改的记录的名字

47 - 52 LString(6) record 更改的记录的名字

54 - 59 LString(6) record 更改的记录的名字

61 - 66 LString(6) record 更改的记录的名字

细节

对蛋白质的每一次修改,标识其修改的号码就增一;该记录出现的次序是递减的,最近的修改先出现。修改类型用数字表示如下:

0 最初发布的记录

1 混杂的

2 修改CONECT记录.

3 修饰坐标或构型

4 - 9 没有定义

示例

1 2 3 4 5 6

345678934567890

REVDAT 3 15-OCT-89 1PRCB 1 REMARK

REVDAT 2 19-APR-89 1PRCA 2 CONECT

REVDAT 1 09-JAN-89 1PRC 0

SPRSDE(已撤销或更改的相关记录)

综述

存储已经作废了的ID code及替换的ID code.一条记录可能代替很多,只有结构的主要调查人才有权收回它.

记录格式

列 数据类型 字段名称 定义描述

1 - 6 Record name "SPRSDE"

9 – 10 Continuation continuation 允许多重记录串联表示不同行的顺序号

12 - 20 Date sprsdeDate 替换日期,不重复

22 - 25 IDcode idCode 原来的ID code,不重复

32 - 35 IDcode sIdCode 替换的ID code

37 - 40 IDcode sIdCode 替换的ID code

42 - 45 IDcode sIdCode 替换的ID code

47 - 50 IDcode sIdCode 替换的ID code

52 - 55 IDcode sIdCode 替换的ID code

57 - 60 IDcode sIdCode 替换的ID code

7

62 - 65

67 - 70

细节

ID code列表在第一个空白的sIDcode区域结束

示例

1 2 3 4 5 6 7

IDcode

IDcode

sIdCode

sIdCode

替换的ID code

替换的ID code

345678934567890

SPRSDE 17-JUL-84 4HHB 1HHB

SPRSDE 27-FEB-95 1GDJ 1LH4 2LH4

JRNL(发表坐标集的文献)

JRNL(发表坐标集的文献)

综述

存储用来描述试验的文献引用。

记录格式

列 数据类型 字段名称

1 - 6 Record name "JRNL "

13 - 70 LString text

细节

如下表格用来描述该记录的亚记录,细分为:

1. AUTHOR(作者)

包含引用的著明出版刊物上的论文或投稿的作者的列表.

列 数据类型 字段名称

1 - 6 Record name "JRNL "

13 - 16 LString(4) "AUTH"

17 - 18 Continuation continuation

20 - 70 List authorList

2. TITL(参考书的标题)

详细说明参考书目的标题.

列 数据类型 字段名称

1 - 6 Record name "JRNL "

13 - 16 LString(4) "TITL"

17 - 18 Continuation continuation

20 - 70 LString title

3. EDIT(编辑)

编辑非定期刊物上的相关参考.

列 数据类型 字段名称

1 - 6 Record name "JRNL "

13 - 16 LString(4) "EDIT"

17 - 18 Continuation continuation

20 - 70 List editorList

定义描述

看下面的详细描述

定义描述

出现在所有连续记录中

允许多重记录串联表示不同行的顺序号

作者名单

定义描述

允许多重记录串联表示不同行的顺序号

文章的标题

定义描述

允许多重记录串联表示不同行的顺序号

编者的名单

4. REF(参考)

分两种情况:

4a. 如果参考书目还没有被出版,亚记录类型有如下格式:

1 - 6

13 - 16

17 - 18

数据类型

Record name

LString(3)

LString(15)

字段名称

"JRNL "

"REF"

"TO BE PUBLISHED"

定义描述

4b. 参考书目已经出版了,REF亚记录类型包括适当领域关于出版物名称,附录,报告,卷,页,年等的信息.

列 数据类型

1 - 6 Record name

13 - 16 LString(3)

17 - 18 Continuation

20 - 47 LString

50 - 51 LString(2)

52 - 55 String

57 - 61 String

63 - 66 Integer

5. PUBL(出版者的名字或出版的地方)

列 数据类型

1 - 6 Record name

13 - 16 LString(4)

17 - 18 Continuation

20 - 70 LString

6. REFN(对引用参考书目的编码)

分两种情况:

4a. 引用没有被出版REFN亚记录类型的格式:

列 数据类型

1 - 6 Record name

13 - 16 LString(4)

67 - 70 LString(4)

4b. 引用被出版REFN亚记录类型的格式:

列 数据类型

1 - 6 Record name

13 - 16 LString(4)

20 - 23 LString(4)

25 - 30 LString(6)

33 - 34 LString(2)

36 - 39 LString(4)

41 - 65 Lstring

67 - 70 LString(4)

示例

1 2

7

字段名称

"JRNL "

"REF"

continuation

pubName

"V."

volume

page

year

字段名称

"JRNL "

"PUBL"

continuation

pub

字段名称

"JRNL "

"REFN"

"0353"

字段名称

"JRNL "

"REFN"

"ASTM"

astm

country

"ISBN" or "ISSN"

isbn

coden

3

定义描述

允许多重记录串联表示不同行的顺序号

N出版物的名字

只出现在第一个亚记录中

右对齐空格补足

说明: 只出现在第一个亚记录中

文章的第一页, 出现在第一个亚记录中

出版的时间, 出现在第一个亚记录中

定义描述

允许多重记录串联表示不同行的顺序号

出版的城市和出版者的名字

定义描述

未出版著作的CCDC/PDB分类编号

定义描述

ASTM 设计分类编号

在OCLC/MARC目录形式中详细说明的出版国家(可选随

意)

国际标准书名号或"ISSN"国际标准序号

ISSN or ISBN号码(最后一个数字可能是字母并包含一

个或多个破折号).

CCDC/PDB分类编号列表代码.

5 6 4

345678934567890

JRNL AUTH ,,ING,,

JRNL AUTH 2 ELLI,KSON,IVONGS,

JRNL AUTH 3 ER

JRNL TITL CRYSTAL STRUCTURE OF A COMPLEX OF HIV-1 PROTEASE

JRNL TITL 2 WITH A DIHYDROETHYLENE-CONTAINING INHIBITOR:

JRNL TITL 3 COMPARISONS WITH MOLECULAR MODELING

JRNL REF TO BE PUBLISHED

JRNL REFN

0353

JRNL AUTH ,,N,

JRNL TITL THE CRYSTAL STRUCTURE OF HUMAN DEOXYHAEMOGLOBIN AT

JRNL TITL 2 1.74 A RESOLUTION

JRNL REF . V. 175 159 1984

JRNL REFN ASTM JMOBAK UK ISSN 0022-2836 0070

REMARK

综述

该记录用来描述试验细节,注解,评论和别的记录上没有的信息。

1 - 6

8 - 10

12 - 70

数据类型

Record name

Integer

LString

字段名称

"REMARK"

REMARK码

定义描述

REMARK 号码

左边是一个空格

REMARK 1(有关文献)

该记录用来列举重要出版物有关的信息。每个REMARK记录的首行用作空格有助阅读.具体又细分为如下:

1. REFERENCE

表示记录中的参考号

1 - 6

10

12 - 20

22 - 70

2. AUTH

表示参考书目的作者的名字

1 - 6

10

13 - 16

17 – 18

20 - 70

3. TITL

表示参考书目的标题

1 - 6

10

数据类型

Record name

LString(1)

字段名称

"REMARK"

"1"

定义描述

数据类型

Record name

LString(1)

LString(4)

Continuation

List

字段名称

"REMARK"

"1"

"AUTH"

Continuation

authorList

定义描述

出现在所有连续记录中

允许一个长的作者名单

作者名单.

数据类型

Record name

LString(1)

LString(9)

Integer

字段名称

"REMARK"

"1"

"REFERENCE"

refNum

定义描述

参考书目序号从一开始并逐一增加

13 - 16 LString(4)

17 – 18 Continuation

20 - 70 LString

4. EDIT

表示非定期刊物相关参考编者的有关信息

列 数据类型

1 - 6 Record name

10 LString(1)

13 - 16 LString(4)

17 – 18 Continuation

20 - 70 LString

5. REF

记录出版物的名字,分两种情况:

5a. 还没有被发表

列 数据类型

1 - 6 Record name

10 LString(1)

13 - 16 LString(3)

20 - 34 LString(15)

5b. 已经出版了

列 数据类型

1 - 6 Record name

10 LString(1)

13 - 16 LString(3)

17 - 18 Continuation

20 - 47 Lstring

50 - 51 LString(2)

52 - 55 String

57 - 61 String

63 - 66 Integer

6. PUBL

出版者的名字或出版的地方

列 数据类型

1 - 6 Record name

10 LString(1)

13 - 16 LString(4)

17 - 18 Continuation

20 - 70 LString

7. REFN

对参考书目的编码,分两种情况如下:

7a. 引用没有被出版

列 数据类型

1 - 6 Record name

10 LString(1)

13 - 16 LString(4)

67 - 70 LString(4)

"TITL"

Continuation

title

字段名称

"REMARK"

"1"

"EDIT"

Continuation

editorList

字段名称

"REMARK"

"1"

"REF"

"TO BE PUBLISHED"

字段名称

"REMARK"

"1"

"REF"

Continuation

pubName

"V."

volume

page

year

字段名称

"REMARK"

"1"

"PUBL"

Continuation

pub

字段名称

"REMARK"

"1"

"REFN"

"0353"

出现在所有连续记录中

允许多重记录串联表示不同行的顺序号

文章的标题.

定义描述

出现在所有连续记录中

允许多重记录串联表示不同行的顺序号

编者名单

定义描述

定义描述

准许长的出版物名称

出版物的名字

仅在55列被占据时只出现在第一个记录中

右对齐空格补足

说明: 只出现在第一的亚记录中

文章的第一页, 只出现在第一的亚记录中

出版的日期

定义描述

出现在所有连续记录中

允许多重记录串联表示不同行的顺序号

出版者的名字和出版的城市

定义描述

为出版著作的PDB分类编码.

7b. 引用没有被出版

1 - 6

10

13 - 16

20 - 23

25 - 30

33 - 34

36 - 39

41 - 65

68 - 70

数据类型

Record name

LString(1)

LString(4)

LString(4)

LString

LString

LString(4)

LString

LString(4)

字段名称

"REMARK"

"1"

"REFN"

"ASTM"

astm

country

"ISBN" or"ISSN"

isbn

coden

定义描述

如果没有用空格表示

ASTM 文件编码.

由两个阿拉伯数字缩写表示出版的国家

ISSN 或ISBN 号.

剑桥结晶学数据中心分类编号列表号码

示例

1 2 3 4

345678934567890

REMARK 1

REMARK 1 REFERENCE 1

REMARK 1 AUTH ,NN,CHS,S,

REMARK 1 AUTH 2 N

REMARK 1 TITL "ENSEMBLE" ITERATIVE RELAXATION MATRIX APPROACH:

REMARK 1 TITL 2 A NEW NMR REFINEMENT PROTOCOL APPLIED TO THE

REMARK 1 TITL 3 SOLUTION STRUCTURE OF CRAMBIN

REMARK 1 REF PROTEINS: STRUCT.,FUNCT., V. 15 385 1993

REMARK 1 REF 2 GENET.

REMARK 1 REFN ASTM PSFGEY US ISSN 0887-3585

REMARK 1 REFERENCE 2

REMARK 1 AUTH NN,,S,N

REMARK 1 TITL STRUCTURE DETERMINATION BY NMR - APPLICATION TO

REMARK 1 TITL 2 CRAMBIN

REMARK 1 EDIT SIS,

REMARK 1 REF COMPUTATION OF BIOMOLECULAR 1 1992

REMARK 1 REF 2 STRUCTURES; ACHIEVEMENTS,

REMARK 1 REF 3 PROBLEMS, AND PERSPECTIVES

REMARK 1 PUBL BERLIN : SPRINGER-VERLAG

REMARK 1 REFN GW ISBN 3540559515

REMARK 1 REFERENCE 3

REMARK 1 AUTH CHS

REMARK 1 REF 2D NMR STUDIES OF

REMARK 1 REF 2 BIOMOLECULES: PROTEIN

REMARK 1 REF 3 STRUCTURE AND PROTEIN-DNA

REMARK 1 REF 4 INTERACTIONS

REMARK 1 PUBL UTRECHT : UNIVERSITY OF UTRECHT (THESIS)

REMARK 1 REFN NE

REMARK 2(最大分辨率)

该记录用来描述分辨率,用埃构筑模型.

对衍射试验:

列 数据类型 字段名称 定义描述

1 - 6 Record name "REMARK"

10 LString(1) "2"

12 - 22 LString(11) "RESOLUTION."

23 - 27 Real(5.2) resolution 决定

29 - 38 LString(10) "ANGSTROMS."

不是衍射试验:

列 数据类型 字段名称

1 - 6 Record name "REMARK"

10 LString(1) "2"

12 - 38 LString(28) "RESOLUTION. NOT APPLICABLE."

5

0867

2010

1989

定义描述

2011

6 7

41 - 70

一些说明:

1 - 6

10

12 - 22

24 - 70

示例

1 2 3 4 5 6 7

345678934567890

REMARK 2

REMARK 2 RESOLUTION. 1.74 ANGSTROMS.

REMARK 2

REMARK 2 RESOLUTION. NOT APPLICABLE.

REMARK 2

REMARK 2 RESOLUTION. NOT APPLICABLE.

REMARK 2 THIS EXPERIMENT WAS CARRIED OUT USING FLUORESCENCE TRANSFER

REMARK 2 AND THEREFORE NO RESOLUTION CAN BE CALCULATED.

REMARK 3(用到的程序和统计方法)

该记录用来描述提纯用的方法和相关统计数据。

下面介绍用不同提纯的方法时的模板:

用X-PLOR方法:

REMARK 3

REMARK 3 REFINEMENT.

REMARK 3 PROGRAM : X-PLOR

REMARK 3 AUTHORS : BRUNGER

REMARK 3

REMARK 3 DATA USED IN REFINEMENT.

REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :

REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :

REMARK 3 DATA CUTOFF (SIGMA(F)) :

REMARK 3 DATA CUTOFF HIGH (ABS(F)) :

REMARK 3 DATA CUTOFF LOW (ABS(F)) :

REMARK 3 COMPLETENESS (WORKING+TEST) (%) :

REMARK 3 NUMBER OF REFLECTIONS :

REMARK 3

REMARK 3 FIT TO DATA USED IN REFINEMENT.

REMARK 3 CROSS-VALIDATION METHOD :

REMARK 3 FREE R VALUE TEST SET SELECTION :

REMARK 3 R VALUE (WORKING SET) :

REMARK 3 FREE R VALUE :

REMARK 3 FREE R VALUE TEST SET SIZE (%) :

REMARK 3 FREE R VALUE TEST SET COUNT :

REMARK 3 ESTIMATED ERROR OF FREE R VALUE :

REMARK 3

REMARK 3 FIT IN THE HIGHEST RESOLUTION BIN.

REMARK 3 TOTAL NUMBER OF BINS USED :

REMARK 3 BIN RESOLUTION RANGE HIGH (A) :

REMARK 3 BIN RESOLUTION RANGE LOW (A) :

REMARK 3 BIN COMPLETENESS (WORKING+TEST) (%) :

REMARK 3 REFLECTIONS IN BIN (WORKING SET) :

REMARK 3 BIN R VALUE (WORKING SET) :

REMARK 3 BIN FREE R VALUE :

REMARK 3 BIN FREE R VALUE TEST SET SIZE (%) :

REMARK 3 BIN FREE R VALUE TEST SET COUNT :

REMARK 3 ESTIMATED ERROR OF BIN FREE R VALUE :

数据类型

Record name

LString(1)

LString(11)

String

字段名称

"REMARK"

"2"

"RESOLUTION."

comment

定义描述

注释

String comment 注释

REMARK 3

REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.

REMARK 3 PROTEIN ATOMS :

REMARK 3 NUCLEIC ACID ATOMS :

REMARK 3 HETEROGEN ATOMS :

REMARK 3 SOLVENT ATOMS :

REMARK 3

REMARK 3 B VALUES.

REMARK 3 FROM WILSON PLOT (A**2) :

REMARK 3 MEAN B VALUE (OVERALL, A**2) :

REMARK 3 OVERALL ANISOTROPIC B VALUE.

REMARK 3 B11 (A**2) :

REMARK 3 B22 (A**2) :

REMARK 3 B33 (A**2) :

REMARK 3 B12 (A**2) :

REMARK 3 B13 (A**2) :

REMARK 3 B23 (A**2) :

REMARK 3

REMARK 3 ESTIMATED COORDINATE ERROR.

REMARK 3 ESD FROM LUZZATI PLOT (A) :

REMARK 3 ESD FROM SIGMAA (A) :

REMARK 3 LOW RESOLUTION CUTOFF (A) :

REMARK 3

REMARK 3 CROSS-VALIDATED ESTIMATED COORDINATE ERROR.

REMARK 3 ESD FROM C-V LUZZATI PLOT (A) :

REMARK 3 ESD FROM C-V SIGMAA (A) :

REMARK 3

REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES.

REMARK 3 BOND LENGTHS (A) :

REMARK 3 BOND ANGLES (DEGREES) :

REMARK 3 DIHEDRAL ANGLES (DEGREES) :

REMARK 3 IMPROPER ANGLES (DEGREES) :

REMARK 3

REMARK 3 ISOTROPIC THERMAL MODEL :

REMARK 3

REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS. RMS SIGMA

REMARK 3 MAIN-CHAIN BOND (A**2) : ;

REMARK 3 MAIN-CHAIN ANGLE (A**2) : ;

REMARK 3 SIDE-CHAIN BOND (A**2) : ;

REMARK 3 SIDE-CHAIN ANGLE (A**2) : ;

REMARK 3

REMARK 3 NCS MODEL :

REMARK 3

REMARK 3 NCS RESTRAINTS. RMS SIGMA/WEIGHT

REMARK 3 GROUP 1 POSITIONAL (A) : ;

REMARK 3 GROUP 1 B-FACTOR (A**2) : ;

REMARK 3 GROUP 2 POSITIONAL (A) : ;

REMARK 3 GROUP 2 B-FACTOR (A**2) : ;

REMARK 3 GROUP 3 POSITIONAL (A) : ;

REMARK 3 GROUP 3 B-FACTOR (A**2) : ;

REMARK 3 GROUP 4 POSITIONAL (A) : ;

REMARK 3 GROUP 4 B-FACTOR (A**2) : ;

REMARK 3

REMARK 3 PARAMETER FILE 1 :

REMARK 3 PARAMETER FILE 2 :

REMARK 3 PARAMETER FILE 3 :

REMARK 3 PARAMETER FILE 4 :

REMARK 3 PARAMETER FILE 5 :

REMARK 3 PARAMETER FILE 6 :

REMARK 3 TOPOLOGY FILE 1 :

REMARK 3 TOPOLOGY FILE 2 :

REMARK 3 TOPOLOGY FILE 3 :

REMARK 3 TOPOLOGY FILE 4 :

REMARK 3 TOPOLOGY FILE 5 :

REMARK 3 TOPOLOGY FILE 6 :

REMARK 3

REMARK 3 OTHER REFINEMENT REMARKS:

用NUCLSQ方法:

REMARK 3

REMARK 3 REFINEMENT.

REMARK 3 PROGRAM : X-PLOR

REMARK 3 AUTHORS : BRUNGER

REMARK 3

REMARK 3 DATA USED IN REFINEMENT.

REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :

REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :

REMARK 3 DATA CUTOFF (SIGMA(F)) :

REMARK 3 DATA CUTOFF HIGH (ABS(F)) :

REMARK 3 DATA CUTOFF LOW (ABS(F)) :

REMARK 3 COMPLETENESS (WORKING+TEST) (%) :

REMARK 3 NUMBER OF REFLECTIONS :

REMARK 3

REMARK 3 FIT TO DATA USED IN REFINEMENT.

REMARK 3 CROSS-VALIDATION METHOD :

REMARK 3 FREE R VALUE TEST SET SELECTION :

REMARK 3 R VALUE (WORKING SET) :

REMARK 3 FREE R VALUE :

REMARK 3 FREE R VALUE TEST SET SIZE (%) :

REMARK 3 FREE R VALUE TEST SET COUNT :

REMARK 3 ESTIMATED ERROR OF FREE R VALUE :

REMARK 3

REMARK 3 FIT IN THE HIGHEST RESOLUTION BIN.

REMARK 3 TOTAL NUMBER OF BINS USED :

REMARK 3 BIN RESOLUTION RANGE HIGH (A) :

REMARK 3 BIN RESOLUTION RANGE LOW (A) :

REMARK 3 BIN COMPLETENESS (WORKING+TEST) (%) :

REMARK 3 REFLECTIONS IN BIN (WORKING SET) :

REMARK 3 BIN R VALUE (WORKING SET) :

REMARK 3 BIN FREE R VALUE :

REMARK 3 BIN FREE R VALUE TEST SET SIZE (%) :

REMARK 3 BIN FREE R VALUE TEST SET COUNT :

REMARK 3 ESTIMATED ERROR OF BIN FREE R VALUE :

REMARK 3

REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.

REMARK 3 PROTEIN ATOMS :

REMARK 3 NUCLEIC ACID ATOMS :

REMARK 3 HETEROGEN ATOMS :

REMARK 3 SOLVENT ATOMS :

REMARK 3

REMARK 3 B VALUES.

REMARK 3 FROM WILSON PLOT (A**2) :

REMARK 3 MEAN B VALUE (OVERALL, A**2) :

REMARK 3 OVERALL ANISOTROPIC B VALUE.

REMARK 3 B11 (A**2) :

REMARK 3 B22 (A**2) :

REMARK 3 B33 (A**2) :

REMARK 3 B12 (A**2) :

REMARK 3 B13 (A**2) :

REMARK 3 B23 (A**2) :

REMARK 3

REMARK 3 ESTIMATED COORDINATE ERROR.

REMARK 3 ESD FROM LUZZATI PLOT (A) :

REMARK 3 ESD FROM SIGMAA (A) :

REMARK 3 LOW RESOLUTION CUTOFF (A) :

REMARK 3

REMARK 3 CROSS-VALIDATED ESTIMATED COORDINATE ERROR.

REMARK 3 ESD FROM C-V LUZZATI PLOT (A) :

REMARK 3 ESD FROM C-V SIGMAA (A) :

REMARK 3

REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES.

REMARK 3 BOND LENGTHS (A) :

REMARK 3 BOND ANGLES (DEGREES) :

REMARK 3 DIHEDRAL ANGLES (DEGREES) :

REMARK 3 IMPROPER ANGLES (DEGREES) :

REMARK 3

REMARK 3 ISOTROPIC THERMAL MODEL :

REMARK 3

REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS. RMS SIGMA

REMARK 3 MAIN-CHAIN BOND (A**2) : ;

REMARK 3 MAIN-CHAIN ANGLE (A**2) : ;

REMARK 3 SIDE-CHAIN BOND (A**2) : ;

REMARK 3 SIDE-CHAIN ANGLE (A**2) : ;

REMARK 3

REMARK 3 NCS MODEL :

REMARK 3

REMARK 3 NCS RESTRAINTS. RMS SIGMA/WEIGHT

REMARK 3 GROUP 1 POSITIONAL (A) : ;

REMARK 3 GROUP 1 B-FACTOR (A**2) : ;

REMARK 3 GROUP 2 POSITIONAL (A) : ;

REMARK 3 GROUP 2 B-FACTOR (A**2) : ;

REMARK 3 GROUP 3 POSITIONAL (A) : ;

REMARK 3 GROUP 3 B-FACTOR (A**2) : ;

REMARK 3 GROUP 4 POSITIONAL (A) : ;

REMARK 3 GROUP 4 B-FACTOR (A**2) : ;

REMARK 3

REMARK 3 PARAMETER FILE 1 :

REMARK 3 PARAMETER FILE 2 :

REMARK 3 PARAMETER FILE 3 :

REMARK 3 PARAMETER FILE 4 :

REMARK 3 PARAMETER FILE 5 :

REMARK 3 PARAMETER FILE 6 :

REMARK 3 TOPOLOGY FILE 1 :

REMARK 3 TOPOLOGY FILE 2 :

REMARK 3 TOPOLOGY FILE 3 :

REMARK 3 TOPOLOGY FILE 4 :

REMARK 3 TOPOLOGY FILE 5 :

REMARK 3 TOPOLOGY FILE 6 :

REMARK 3

REMARK 3 OTHER REFINEMENT REMARKS:

用NUCLSQ方法:

REMARK 3

REMARK 3 REFINEMENT.

REMARK 3 PROGRAM : NUCLSQ

REMARK 3 AUTHORS : WESTHOF,DUMAS,MORAS

REMARK 3

REMARK 3 DATA USED IN REFINEMENT.

REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :

REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :

REMARK 3 DATA CUTOFF (SIGMA(F)) :

REMARK 3 COMPLETENESS FOR RANGE (%) :

REMARK 3 NUMBER OF REFLECTIONS :

REMARK 3

REMARK 3 FIT TO DATA USED IN REFINEMENT.

REMARK 3 CROSS-VALIDATION METHOD :

REMARK 3 FREE R VALUE TEST SET SELECTION :

REMARK 3 R VALUE (WORKING + TEST SET) :

REMARK 3 R VALUE (WORKING SET) :

REMARK 3 FREE R VALUE :

REMARK 3 FREE R VALUE TEST SET SIZE (%) :

REMARK 3 FREE R VALUE TEST SET COUNT :

REMARK 3

REMARK 3 FIT/AGREEMENT OF MODEL WITH ALL DATA.

REMARK 3 R VALUE (WORKING + TEST SET, NO CUTOFF) :

REMARK 3 R VALUE (WORKING SET, NO CUTOFF) :

REMARK 3 FREE R VALUE (NO CUTOFF) :

REMARK 3 FREE R VALUE TEST SET SIZE (%, NO CUTOFF) :

REMARK 3 FREE R VALUE TEST SET COUNT (NO CUTOFF) :

REMARK 3 TOTAL NUMBER OF REFLECTIONS (NO CUTOFF) :

REMARK 3

REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.

REMARK 3 PROTEIN ATOMS :

REMARK 3 NUCLEIC ACID ATOMS :

REMARK 3 HETEROGEN ATOMS :

REMARK 3 SOLVENT ATOMS :

REMARK 3

REMARK 3 B VALUES.

REMARK 3 FROM WILSON PLOT (A**2) :

REMARK 3 MEAN B VALUE (OVERALL, A**2) :

REMARK 3 OVERALL ANISOTROPIC B VALUE.

REMARK 3 B11 (A**2) :

REMARK 3 B22 (A**2) :

REMARK 3 B33 (A**2) :

REMARK 3 B12 (A**2) :

REMARK 3 B13 (A**2) :

REMARK 3 B23 (A**2) :

REMARK 3

REMARK 3 ESTIMATED COORDINATE ERROR.

REMARK 3 ESD FROM LUZZATI PLOT (A) :

REMARK 3 ESD FROM SIGMAA (A) :

REMARK 3 LOW RESOLUTION CUTOFF (A) :

REMARK 3

REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES.

REMARK 3 DISTANCE RESTRAINTS. RMS SIGMA

REMARK 3 SUGAR-BASE BOND DISTANCE (A) : ;

REMARK 3 SUGAR-BASE BOND ANGLE DISTANCE (A) : ;

REMARK 3 PHOSPHATE BONDS DISTANCE (A) : ;

REMARK 3 PHOSPHATE BOND ANGLE, H-BOND (A) : ;

REMARK 3

REMARK 3 PLANE RESTRAINT (A) : ;

REMARK 3 CHIRAL-CENTER RESTRAINT (A**3) : ;

REMARK 3

REMARK 3 NON-BONDED CONTACT RESTRAINTS.

REMARK 3 SINGLE TORSION CONTACT (A) : ;

REMARK 3 MULTIPLE TORSION CONTACT (A) : ;

REMARK 3

REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS. RMS SIGMA

REMARK 3 SUGAR-BASE BONDS (A**2) : ;

REMARK 3 SUGAR-BASE ANGLES (A**2) : ;

REMARK 3 PHOSPHATE BONDS (A**2) : ;

REMARK 3 PHOSPHATE BOND ANGLE, H-BOND (A**2) : ;

REMARK 3

REMARK 3 OTHER REFINEMENT REMARKS:

用PROLSQ, CCP4, PROFFT, GPRLSA,和其他方法:

REMARK 3

REMARK 3 REFINEMENT.

REMARK 3 PROGRAM :

REMARK 3 AUTHORS :

REMARK 3

REMARK 3 DATA USED IN REFINEMENT.

REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :

REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :

REMARK 3 DATA CUTOFF (SIGMA(F)) :

REMARK 3 COMPLETENESS FOR RANGE (%) :

REMARK 3 NUMBER OF REFLECTIONS :

REMARK 3

REMARK 3 FIT TO DATA USED IN REFINEMENT.

REMARK 3 CROSS-VALIDATION METHOD :

REMARK 3 FREE R VALUE TEST SET SELECTION :

REMARK 3 R VALUE (WORKING + TEST SET) :

REMARK 3 R VALUE (WORKING SET) :

REMARK 3 FREE R VALUE :

REMARK 3 FREE R VALUE TEST SET SIZE (%) :

REMARK 3 FREE R VALUE TEST SET COUNT :

REMARK 3

REMARK 3 FIT/AGREEMENT OF MODEL WITH ALL DATA.

REMARK 3 R VALUE (WORKING + TEST SET, NO CUTOFF) :

REMARK 3 R VALUE (WORKING SET, NO CUTOFF) :

REMARK 3 FREE R VALUE (NO CUTOFF) :

REMARK 3 FREE R VALUE TEST SET SIZE (%, NO CUTOFF) :

REMARK 3 FREE R VALUE TEST SET COUNT (NO CUTOFF) :

REMARK 3 TOTAL NUMBER OF REFLECTIONS (NO CUTOFF) :

REMARK 3

REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.

REMARK 3 PROTEIN ATOMS :

REMARK 3 NUCLEIC ACID ATOMS :

REMARK 3 HETEROGEN ATOMS :

REMARK 3 SOLVENT ATOMS :

REMARK 3

REMARK 3 B VALUES.

REMARK 3 FROM WILSON PLOT (A**2) :

REMARK 3 MEAN B VALUE (OVERALL, A**2) :

REMARK 3 OVERALL ANISOTROPIC B VALUE.

REMARK 3 B11 (A**2) :

REMARK 3 B22 (A**2) :

REMARK 3 B33 (A**2) :

REMARK 3 B12 (A**2) :

REMARK 3 B13 (A**2) :

REMARK 3 B23 (A**2) :

REMARK 3

REMARK 3 ESTIMATED COORDINATE ERROR.

REMARK 3 ESD FROM LUZZATI PLOT (A) :

REMARK 3 ESD FROM SIGMAA (A) :

REMARK 3 LOW RESOLUTION CUTOFF (A) :

REMARK 3

REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES.

REMARK 3 DISTANCE RESTRAINTS. RMS SIGMA

REMARK 3 BOND LENGTH (A) : ;

REMARK 3 ANGLE DISTANCE (A) : ;

REMARK 3 INTRAPLANAR 1-4 DISTANCE (A) : ;

REMARK 3 H-BOND OR METAL COORDINATION (A) : ;

REMARK 3

REMARK 3 PLANE RESTRAINT (A) : ;

REMARK 3 CHIRAL-CENTER RESTRAINT (A**3) : ;

REMARK 3

REMARK 3 NON-BONDED CONTACT RESTRAINTS.

REMARK 3 SINGLE TORSION (A) : ;

REMARK 3 MULTIPLE TORSION (A) : ;

REMARK 3 H-BOND (X...Y) (A) : ;

REMARK 3 H-BOND (Y) (A) : ;

REMARK 3

REMARK 3 CONFORMATIONAL TORSION ANGLE RESTRAINTS.

REMARK 3 SPECIFIED (DEGREES) : ;

REMARK 3 PLANAR (DEGREES) : ;

REMARK 3 STAGGERED (DEGREES) : ;

REMARK 3 TRANSVERSE (DEGREES) : ;

REMARK 3

REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS. RMS SIGMA

REMARK 3 MAIN-CHAIN BOND (A**2) : ;

REMARK 3 MAIN-CHAIN ANGLE (A**2) : ;

REMARK 3 SIDE-CHAIN BOND (A**2) : ;

REMARK 3 SIDE-CHAIN ANGLE (A**2) : ;

REMARK 3

REMARK 3 OTHER REFINEMENT REMARKS:

用SHELXL方法:

REMARK 3

REMARK 3 REFINEMENT.

REMARK 3 PROGRAM : SHELXL

REMARK 3 AUTHORS : ICK

REMARK 3

REMARK 3 DATA USED IN REFINEMENT.

REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :

REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :

REMARK 3 DATA CUTOFF (SIGMA(F)) :

REMARK 3 COMPLETENESS FOR RANGE (%) :

REMARK 3 CROSS-VALIDATION METHOD :

REMARK 3 FREE R VALUE TEST SET SELECTION :

REMARK 3

REMARK 3 FIT TO DATA USED IN REFINEMENT (NO CUTOFF).

REMARK 3 R VALUE (WORKING + TEST SET, NO CUTOFF) :

REMARK 3 R VALUE (WORKING SET, NO CUTOFF) :

REMARK 3 FREE R VALUE (NO CUTOFF) :

REMARK 3 FREE R VALUE TEST SET SIZE (%, NO CUTOFF) :

REMARK 3 FREE R VALUE TEST SET COUNT (NO CUTOFF) :

REMARK 3 TOTAL NUMBER OF REFLECTIONS (NO CUTOFF) :

REMARK 3

REMARK 3 FIT/AGREEMENT OF MODEL FOR DATA WITH F>4SIG(F).

REMARK 3 R VALUE (WORKING + TEST SET, F>4SIG(F)) :

REMARK 3 R VALUE (WORKING SET, F>4SIG(F)) :

REMARK 3 FREE R VALUE (F>4SIG(F)) :

REMARK 3 FREE R VALUE TEST SET SIZE (%, F>4SIG(F)) :

REMARK 3 FREE R VALUE TEST SET COUNT (F>4SIG(F)) :

REMARK 3 TOTAL NUMBER OF REFLECTIONS (F>4SIG(F)) :

REMARK 3

REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.

REMARK 3 PROTEIN ATOMS :

REMARK 3 NUCLEIC ACID ATOMS :

REMARK 3 HETEROGEN ATOMS :

REMARK 3 SOLVENT ATOMS :

REMARK 3

REMARK 3 MODEL REFINEMENT.

REMARK 3 OCCUPANCY SUM OF NON-HYDROGEN ATOMS :

REMARK 3 OCCUPANCY SUM OF HYDROGEN ATOMS :

REMARK 3 NUMBER OF DISCRETELY DISORDERED RESIDUES :

REMARK 3 NUMBER OF LEAST-SQUARES PARAMETERS :

REMARK 3 NUMBER OF RESTRAINTS :

REMARK 3

REMARK 3 RMS DEVIATIONS FROM RESTRAINT TARGET VALUES.

REMARK 3 BOND LENGTHS (A) :

REMARK 3 ANGLE DISTANCES (A) :

REMARK 3 SIMILAR DISTANCES (NO TARGET VALUES) (A) :

REMARK 3 DISTANCES FROM RESTRAINT PLANES (A) :

REMARK 3 ZERO CHIRAL VOLUMES (A**3) :

REMARK 3 NON-ZERO CHIRAL VOLUMES (A**3) :

REMARK 3 ANTI-BUMPING DISTANCE RESTRAINTS (A) :

REMARK 3 RIGID-BOND ADP COMPONENTS (A**2) :

REMARK 3 SIMILAR ADP COMPONENTS (A**2) :

REMARK 3 APPROXIMATELY ISOTROPIC ADPS (A**2) :

REMARK 3

REMARK 3 BULK SOLVENT MODELING.

REMARK 3 METHOD USED:

REMARK 3

REMARK 3 STEREOCHEMISTRY TARGET VALUES :

REMARK 3 SPECIAL CASE:

REMARK 3

REMARK 3 OTHER REFINEMENT REMARKS:

用TNT方法:

REMARK 3

REMARK 3 REFINEMENT.

REMARK 3 PROGRAM : TNT

REMARK 3 AUTHORS : TRONRUD,TEN EYCK,MATTHEWS

REMARK 3

REMARK 3 DATA USED IN REFINEMENT.

REMARK 3 RESOLUTION RANGE HIGH (ANGSTROMS) :

REMARK 3 RESOLUTION RANGE LOW (ANGSTROMS) :

REMARK 3 DATA CUTOFF (SIGMA(F)) :

REMARK 3 COMPLETENESS FOR RANGE (%) :

REMARK 3 NUMBER OF REFLECTIONS :

REMARK 3

REMARK 3 USING DATA ABOVE SIGMA CUTOFF.

REMARK 3 CROSS-VALIDATION METHOD :

REMARK 3 FREE R VALUE TEST SET SELECTION :

REMARK 3 R VALUE (WORKING + TEST SET) :

REMARK 3 R VALUE (WORKING SET) :

REMARK 3 FREE R VALUE :

REMARK 3 FREE R VALUE TEST SET SIZE (%) :

REMARK 3 FREE R VALUE TEST SET COUNT :

REMARK 3

REMARK 3 USING ALL DATA, NO SIGMA CUTOFF.

REMARK 3 R VALUE (WORKING + TEST SET, NO CUTOFF) :

REMARK 3 R VALUE (WORKING SET, NO CUTOFF) :

REMARK 3 FREE R VALUE (NO CUTOFF) :

REMARK 3 FREE R VALUE TEST SET SIZE (%, NO CUTOFF) :

REMARK 3 FREE R VALUE TEST SET COUNT (NO CUTOFF) :

REMARK 3 TOTAL NUMBER OF REFLECTIONS (NO CUTOFF) :

REMARK 3

REMARK 3 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT.

REMARK 3 PROTEIN ATOMS :

REMARK 3 NUCLEIC ACID ATOMS :

REMARK 3 OTHER ATOMS :

REMARK 3

REMARK 3 WILSON B VALUE (FROM FCALC, A**2) :

REMARK 3

REMARK 3 RMS DEVIATIONS FROM IDEAL VALUES. RMS WEIGHT COUNT

REMARK 3 BOND LENGTHS (A) : ; ;

REMARK 3 BOND ANGLES (DEGREES) : ; ;

REMARK 3 TORSION ANGLES (DEGREES) : ; ;

REMARK 3 PSEUDOROTATION ANGLES (DEGREES) : ; ;

REMARK 3 TRIGONAL CARBON PLANES (A) : ; ;

REMARK 3 GENERAL PLANES (A) : ; ;

REMARK 3 ISOTROPIC THERMAL FACTORS (A**2) : ; ;

REMARK 3 NON-BONDED CONTACTS (A) : ; ;

REMARK 3

REMARK 3 INCORRECT CHIRAL-CENTERS (COUNT) :

REMARK 3

REMARK 3 BULK SOLVENT MODELING.

REMARK 3 METHOD USED :

REMARK 3 KSOL :

REMARK 3 BSOL :

REMARK 3

REMARK 3 RESTRAINT LIBRARIES.

REMARK 3 STEREOCHEMISTRY :

REMARK 3 ISOTROPIC THERMAL FACTOR RESTRAINTS :

REMARK 3

REMARK 3 OTHER REFINEMENT REMARKS:

非衍射的研究方法:

1 2 3

345678934567890

REMARK 3

REMARK 3 REFINEMENT.

REMARK 3 PROGRAM :

REMARK 3 AUTHORS :

REMARK 3

REMARK 3 FREE TEXT

示例

1 2 3

345678934567890

REMARK 3

REMARK 3 REFINEMENT.

4

4

5 6 7

5 6 7

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

REMARK

3 PROGRAM : X-PLOR 3.1

3 AUTHORS : BRUNGER

3

3 STRUCTURAL STATISTICS:

3 25 SA

3 STRUCTURES SAAVEMIN

3 RMS DEVIATIONS FROM EXP. RESTRAINTS[A]

3 NOE DISTANCE RESTRAINTS (1430) 0.0451 A 0.044 A

3 DIHEDRAL ANGLE RESTRAINTS (130) 0.551 DEG 0.660 DEG

3 DEVIATIONS FROM IDEAL GEOMETRY

3 BONDS 0.004 A 0.004 A

3 ANGLES 0.661 DEG 0.650 DEG

3 IMPROPERS 0.371 DEG 0.380 DEG

3 X-PLOR ENERGIES (IN KCAL MOL-1)[B]

3 ENOE 167 158

REMARK 3 ECDIH 2.6

REMARK 3 ENCS 0.01

REMARK 3 EREPEL 54

REMARK 3 EBOND 36

REMARK 3 EANGLE 263

REMARK 3 EIMPROPER 22

REMARK 3 ETOTAL 545

REMARK 3 ATOMIC RMS DIFFERENCES[C]

REMARK 3 BACKBONE(N, CA, C') + LIGAND ATOMS 0.53+/-0.09 A

REMARK 3 ALL HEAVY ATOMS 0.91+/-0.08 A

REMARK 4-999(其他注解)

REMARK 4:格式

该记录用来描述内容向导2.2版本的格式。

模板

REMARK 4

REMARK 4 XXXX COMPLIES WITH FORMAT V. 2.2, 16-DEC-1996

XXX表示记录的ID idcode

N.M表示版本号

DD-MMM-YYYY表示格式译本的发布日期.分别表实日,月,年.

示例

1 2 3 4

345678934567890

REMARK 4

REMARK 4 1ABC COMPLIES WITH FORMAT V. 2.1, 25-OCT-1996

REMARK 5:警告

该记录用来描述警告信息,和CAVEAT记录的内容一样,并且还有接收者的评论。

模板

1 2 3 4

345678934567890

REMARK 5

REMARK 5 WARNING

REMARK 5 XXXX: FREE TEXT GOES HERE.

XXX来表示记录的ID code

示例

1 2 3 4

345678934567890

REMARK 5

REMARK 5 WARNING

3.4

0.01

50

33

256

23

523

6

6

6

5 7

5 7

5 7

REMARK 5 1ABC: THE CRYSTAL TRANSFORMATION IS IN ERROR BUT IS

REMARK 5 UNCORRECTABLE AT THIS TIME.

REMARK 6 - 99:未赋值

该记录用来表示不标准的注释,不清楚的说明。

REMARK 100 - 199:核酸

该记录用来表示核酸结构。

REMARK 200-250:试验细节

该记录用来表示试验细节。

REMARK 200:表示X光衍射试验的细节。

Remark 205:光纤衍射和光纤标本衍射。

Remarks 210 and 215: 核磁共振试验细节。

Remarks 220 and 225: 理论模型试验细节。

Remark 230:种子衍射试验细节

Remark 240:电子衍射试验细节。

Remark 250:别的类型的试验细节。

REMARK 280:晶体。

REMARK 285: 描述CRYST1记录.

REMARK 290: 对称结晶体。

REMARK 295:不对称结晶体。

REMARK 300:生物分子。

REMARK 350:生物分子的产生。

REMARK 375:特殊位置。

REMARK 400:成分。

REMARK 450:来源。

REMARK 460:Non-IUPAC Names。

REMARK 470:缺少的原子。

REMARK 500:几何学和立体化学。

REMARK 525:溶剂。

REMARK 550:SEGID,描述片段标识符.

REMARK 600:杂原子。

REMARK 650:螺旋。

REMARK 700:折叠。

REMARK 750:转角。

REMARK 800:位置

REMARK 850:发布前对坐标的修正

REMARK 860:在发表以后的改正。

REMARK 900:有关系的记录。

REMARK 999:序列。

3.一级结构

PDB文件里的一级结构包括蛋白大分子每条链上的残基序列。记录了链的标识符和序列号以便和其他记录相链接。一共分DBREF,SEQADV,SEQRES

和MODRES四部分来进行描述。

DBREF (其他序列库的有关记录)

综述

提供了PDB序列和相应的数据库记录的链接。数据库的对照参考需要不少于10个残基的肽链。当相应记录在NDB中时,对核酸来说DBREF记录就

会被强制指向核酸数据库Nucleic Acid Database (NDB)中。

记录格式

1 - 6

8 – 11

13

15 - 18

19

数据类型

Record name

Idcode

Character

Integer

AChar

字段名称

"DBREF "

idCode

chainID

seqBegin

insertBegin

定义描述

记录的ID号

链的标识符

PDB序列片段的起始序列号

PDB序列片段的起始插入代码

21 - 24

25

27 - 32

34 - 41

43 - 54

56 - 60

61

63 – 67

68

细节

1. PDB记录包括多联分子,其序列可能是不定类型,变量或人造的。序列也可能经点突变实验修饰。大量PDB记录报告了拆自大分子的结构

域结构。

2. 它通过提供出PDB ATOM 记录所给出的邻近片段和数据库序列记录之间的清晰关系说明体现出其间的区别差异。有些情况下只是简单通过

DBREF中数据库中的指示表现出来。PDB记录包含杂原子聚合体,链接到不同的序列数据库记录中。一些情况下象PDB记录中包含的免疫

球蛋白Fab片段每条链都链接到两个不同的SWISS-PROT, PIR, and/or GenBank记录中。这种便利的需要是因为这些数据库用各式各样的

免疫球蛋白结构域作为单独的记录表现序列。PDB也可以表现经点突变改变基因(融合基因,改变序列,诱变基因或循环序列改变)的分

子。这种设计诱额外的优势,那就是它可能构建指示器和相关联的数据库相连,如Nucleic Acid Database核酸数据库,BioMagResBank,

和 描述基序序列的数据库 (如 PROSITE, BLOCKS).

3. 数据库名称和它们在DBREF records相应的缩写:

数据库名称

BioMagResBank

BLOCKS

European Molecular Biology Laboratory

GenBank

Genome Data Base

Nucleic Acid Database

PROSITE

Protein Data Bank

Protein Identification Resource

SWISS-PROT

TREMBL

4.

5.

6.

7.

数据库缩写(27 - 32列)

BMRB

BLOCKS

EMBL

GB

GDB

NDB

PROSIT

PDB

PIR

SWS

TREMBL

Integer

AChar

LString

LString

LString

Integer

AChar

Integer

AChar

seqEnd

insertEnd

Database

dbAccession

dbIdCode

dbseqBegin

idbnsBeg

dbseqEnd

dbinsEnd

PDB序列片段的终止序列号

PDB序列片段的终止插入代码

序列数据库名称如PDB,SWS,当一个相应的序列数据库记录还未识

别时即存放PDB

序列数据库的访问号码,如对于GenBank来说即是NCBI gi

序列数据库的识别密码,对GB来说即是访问号码

数据库片段的起始序列号

涉及到PDB的话,存放片段起始残基的插入代码

数据库片段的终止序列号

涉及到PDB的话,存放片段终止残基的插入代码。

DBREF记录呈现PDB ATOM记录和相应的PIR, GenBank,或SWISS-PROT等序列相关性.

PDB并不能保证列出的数据库能提供所有可能的参考.多数情况下,只能提供一种数据数据库的一种相关参考.

当序列数据库中没有参考,PDB自身就会给出相关参考.

对连接到PDB记录的适当序列数据库登陆是的选择是以序列和其生物学来源为基础的.可能出现在记录分配上的疑问可通过咨询数据库职

员来解决.

示例

1 2 3 4 5 6 7

345678934567890

DBREF 1ABC B 1B 36 PDB 1ABC 1ABC 1B 36

DBREF 3AKY 3 220 SWS P07170 KAD1_YEAST 5 222

DBREF 1HAN 2 288 GB 397884 X66122 1 287

DBREF 3HSV A 1 92 SWS P22121 HSF_KLULA 193 284

DBREF 3HSV B 1 92 SWS P22121 HSF_KLULA 193 284

DBREF 1ARL 1 307 SWS P00730 CBPA_BOVIN 111 417

DBREF 249D A 1 12 NDB BDL070 BDL070 1 12

DBREF 249D B 13 24 NDB BDL070 BDL070 13 24

DBREF 249D C 26 36 NDB BDL070 BDL070 26 36

DBREF 249D D 37 48 NDB BDL070 BDL070 37 48

1-5列存放记录名即DBREF;8-11列存放记录的ID号如1ABC;13列存放链的标识符如A链B链C链D链;18列存放PDB序列片段的起始序列

号如1;19列存放PDB序列片段的起始插入代码如B;23-24列存放PDB序列片段的终止序列号如36;25列存放PDB序列片段的终止插入代码;

27-29列存放序列数据库名称如PDB,SWS,当一个相应的序列数据库记录还未识别时即存放PDB;34-37列存放序列数据库的访问号码如1ABC;

如对于GenBank来说即是NCBI gi;43-46列存放序列数据库的识别密码如1ABC,对GB来说即是访问号码;60列存放数据库片段的起始序列号

1;涉及到PDB的话,61列存放片段起始残基的插入代码B;66-67列存放数据库片段的终止序列号36;涉及到PDB的话,68列存放片段终止残

基的插入代码。

SEQADV ( PDB和其他记录的出入)

综述

提供识别PDB记录ATOM记录中的序列信息和DBREF提供的序列数据库记录之间的出入。需要注意的是这些记录是用来识别不同而并非错误。很多

情况下记录了PDB记录和PIR或SWS记录间的出入。有很多的可能原因如自然突变,序列多态性或实验结果的模糊或出入。PDB可能包括REMARK

记录记录中反映录入者关于哪个数据库存有正确序列的观点。

记录格式

1 - 6

8 - 11

13 - 15

17

19 - 22

23

25 - 28

30 - 38

40 - 42

50 - 70

示例

1 2 3 4 5 6 7

345678934567890

SEQADV 1ABC ASN A 100A SWS P10725 ASP 100 1994-300-1200-0070

SEQADV 2ABC ASN A 100A SWS P10725 ASP 100 PDB: 1ABC

SEQADV 3ABC MET A -1 SWS P10725 CLONING ARTIFACT

SEQADV 3ABC GLY A 50 SWS P10725 VAL 50 ENGINEERED

就第一行来说,1-6列存放记录名即SEQADV;8-11列存放记录的ID号1ABC;13-15列存放出入的PDB残基名ASN;17列存放PDB链的标识符A;

20-22列存放PDB中的序号100;23列存放PDB插入代码A;25-28列存放序列数据库名称SWS;30-35列存放序列数据库的访问号码P10725;

40-42列存放序列数据库SWS中的残基名ASP;46-48列存放SWS中的的序号;就是说A链上第100个氨基酸残基在PDB中是天冬酰胺ASN而在 SWS

中是天冬胺酸ASP。最后是对出入的注释。

SEQRES (残基序列)

综述

包括所研究的大分子每条链的氨基酸或核酸残基序列。

记录格式

1 - 6

9 - 10

12

14 - 17

20 - 22

24 - 26

28 - 30

32 - 34

36 - 38

40 - 42

44 - 46

数据类型

Record name

Integer

Character

Integer

Residue name

Residue name

Residue name

Residue name

Residue name

Residue name

Residue name

字段名称

"SEQRES"

serNum

chainID

numRes

resName

resName

resName

resName

resName

resName

resName

定义描述

SEQRES记录中当前链的序号,从1开始逐一增加,另一条链从1重新

安排

链的标识符,这可能是任何一个专一合法的特征。如只有一条链可空

缺。

链上的残基号,每行都重复

残基名称

残基名称

残基名称

残基名称

残基名称

残基名称

残基名称

数据类型

Record name

IDcode

Residue name

Character

Integer

AChar

LString

LString

Residue name

LString

字段名称

"SEQADV"

idCode

resName

chainID

seqNum

iCode

Database

dbIdCode

dbRes

Conflict

定义描述

记录的ID号

出入的PDB残基名

PDB链的标识符

PDB序号

PDB 插入代码

序列数据库名称

序列数据库的访问号码

序列数据库的残基名称

出入的注释

48 - 50

52 - 54

56 - 58

60 - 62

64 - 66

68 - 70

细节

PDB条目用3个字母的缩写来作为氨基酸名称,用一个字母代码表示核酸且核糖和脱氧核糖没有区别。所有出现的标准氨基酸或核酸残基都列在

SEQRES中,且都在分子研究水平上。整合到链骨架上的杂原子也作为链的一部分包括在SEQRES中。在不标准的情况下,一个hetID等于三个文

字数字的特征。一般普通HET名称都出现在HET 字典中.每套SEQRES记录和HET group都分配到一个组成号,这个组成号从1开始作为第一套SEQRES

记录连续增加.这个号码在FORMUL记录清晰的给出,而在SEQRES记录中只是隐含的。

示例

1 2 3 4 5 6 7

345678934567890

SEQRES 1 A 21 GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU

SEQRES 2 A 21 TYR GLN LEU GLU ASN TYR CYS ASN

SEQRES 1 B 30 PHE VAL ASN GLN HIS LEU CYS GLY SER HIS LEU VAL GLU

SEQRES 2 B 30 ALA LEU TYR LEU VAL CYS GLY GLU ARG GLY PHE PHE TYR

SEQRES 3 B 30 THR PRO LYS ALA

SEQRES 1 C 21 GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU

SEQRES 2 C 21 TYR GLN LEU GLU ASN TYR CYS ASN

SEQRES 1 D 30 PHE VAL ASN GLN HIS LEU CYS GLY SER HIS LEU VAL GLU

SEQRES 2 D 30 ALA LEU TYR LEU VAL CYS GLY GLU ARG GLY PHE PHE TYR

SEQRES 3 D 30 THR PRO LYS ALA

前两行存放了一条链A链的氨基酸序列。1-6列存放SEQRES;10列存放的1,2表示A链用两行存放,16-17列存放的数字21表示A链共有21

个氨基酸残基,从第20列开始存放氨基酸序列。

MODRES (对标准残基的修饰)

综述

提供了对蛋白质和核酸残基修饰的描述,比如化学修饰或等等。包括PDB记录中的残基名和标准残基之间的映射。

记录格式

1 - 6

8 – 11

13 - 15

17

19 - 22

23

25 - 27

30 - 70

细节

1. 在MODRES记录中对残基的修饰包括翻译后修饰,酶解修饰或特意修饰等。在这种情况下,在PDB要选择用不标准残基名的地方MODRES

提供出相应于原始标准残基名的映射。

2. MODERS是用来托管记录中存在的标准残基的修饰。但当同等记录并没供给修饰残基时它并不是必需的。以下是几个修饰描述的例子:

糖基化位点;翻译后修饰;专一化学修饰;磷酸化作用;N-末端的钝化;C-末端的氨化;右旋构型;肽链的剪切等。

3. D-氨基酸有他们自己的残基名resName 如用DAL表示D-alanine。这个resName出现在SEQRES记录中, 还和 SEQADV, MODRES, HET和

FORMUL记录相关联.相关内容在有ATOM记录的 HETATMs中给出并出现在链的正确顺序中,这种顺序是规定的记录顺序的例外情况。

4. 当用一个标准残基名描述修饰位点时,resName (13-15列) 和stdRES ( 25-27列) 包含同样的内容。

5. MODRES 和其他记录类型的联系是它连接了 ATOMan和 HETATM记录中对标准残基名的记录SEQADV, HET和FORMUL可能也出现其中。

示例

1 2 3 4 5 6 7

345678934567890

MODRES 1ABC ASN A 22A ASN GLYCOSYLATION SITE

数据类型

Record name

IDcode

Residue name

Character

Integer

Achar

Residue name

String

字段名称

"MODRES"

idCode

resName

chainID

seqNum

iCode

stdRes

comment

定义描述

记录的ID号

这个记录所用的残基名

链的标识符

序号

插入代码

标准残基名

对残基修饰的描述

Residue name

Residue name

Residue name

Residue name

Residue name

Residue name

resName

resName

resName

resName

resName

resName

残基名称

残基名称

残基名称

残基名称

残基名称

残基名称

MODRES 2ABC TTQ A 50A TRP POST-TRANSLATIONAL MODIFICATION

MODRES 3ABC DAL A 32 ALA POST-TRANSLATIONAL MODIFICATION,D-ALANINE

MODRES 3ABC DAL B 32 ALA POST-TRANSLATIONAL MODIFICATION,D-ALANINE

就第一行来说,表示ID号为1ABC的A链第22位氨基酸ASN有糖基化位点;第三四行表示ID号为3ABC的A链和B链第32位ALA经翻译后修饰

为右旋的ALA。

4.杂因子

对记录中非标准残基的完整描述.

HET(非标准残基)

综述

HET记录用来描述非标准残基,如抑制剂,溶解分子和已给出坐标的离子.

以下包含在HET中:-不是标准氨基酸中的一员;

-不是核酸(C, G, A, T, U, and I)中的一员;

-不是修饰了的核酸(+C, +G, +A, +T, +U, and +I)中的一员;

-不是UNK中还未说明残基名的不知道的氨基酸或核酸。

Het记录还描述了对其化学特性还不太了解的杂因子,这种情况就被分配到hetID UNK。

记录格式

1 - 6

8 - 10

13

14 - 17

18

21 - 25

31 - 70

细节

1. 每个HET分配到一个含至多三个文字数字字符的 hetID 。记录中出现的每个HET group都给出了序号,链标识符,插入代码和同等的记

录号码。HET group中的化学名称 由HETNAM记录给出,化学名称的同意字在 HETSYN记录中。

2. 记录中所出现的每个 HET group都有单独的HET记录。

3. 一个特殊的HET group用一个唯一的hetID描绘在PDB档案中。

4. 但PDB记录中没有水分子的HET记录。

5. 正文部分描述材料。PART_OF用来指出HET group是已用个别成分表现出来的一大组的一部分。(如:放线菌素的一部分)片段标识符,

73 - 76列的 ATOM/HETATM 记录也用来记述一巨大的HET group中的个别成分。

6. 不知道的原子或离子将用化学式X1表现UNX。

7. 如果可使用的话,对记录中出现的每个het group,PDB都核实相应的HET, HETNAM, HETSYN, FORMUL, HETATM,和CONECT记录。HET记录

由PDB用 het group dictionary和 HETATM记录中的信息自动产生。

8. 每个唯一的hetID代表一个唯一的分子。

示例

1 2 3 4 5 6 7

345678934567890

HET TRS 975 8

HET STA I 4 25 PART_OF: HIV INHIBITOR;

HET FUC Y 1 10 PART_OF: NONOATE COMPLEX; L-FUCOSE

HET GAL Y 2 11 PART_OF: NONOATE COMPLEX

HET NAG Y 3 15 PART_OF: NONOATE COMPLEX

HET FUC Y 4 10 PART_OF: NONOATE COMPLEX

HET NON Y 5 12 PART_OF: NONOATE COMPLEX

HET UNX A 161 1 PSEUDO CARBON ATOM OF UNKNOWN LIGAND

HET UNX A 162 1 PSEUDO CARBON ATOM OF UNKNOWN LIGAND

HET UNX A 163 1 PSEUDO CARBON ATOM OF UNKNOWN LIGAND

数据类型

Record name

LString(3)

Character

Integer

AChar

Integer

String

字段名称

"HET "

hetID

ChainID

seqNum

iCode

numHetAtoms

text

定义描述

Het 标识符, 右对齐

链标识符

序号

插入代码

HATATM记录对当前记录的记录号

Het group描述的正文.

就第二行来说,1-3列存放HET;8-10列存放HET标识符STA(而在后面对还不清楚的假碳原子就存UNX);I链第四位在HATATM记录中记为

25,是艾滋病病毒抑制剂的一部分。

HETNAM(非标准残基的名称)

综述

给出有hetID的化合物的化学名称。

记录格式

1 - 6

9 - 10

12 - 14

16 - 70

细节

1.

2.

3.

4.

5.

示例

1 2 3 4 5 6 7

345678934567890

HETNAM GLC GLUCOSE

HETNAM SAD BETA-METHYLENE SELENAZOLE-4-CARBOXAMIDE ADENINE

HETNAM 2 SAD DINUCLEOTIDE

HETNAM UNX UNKNOWN ATOM OR ION

如第一行1-6列存放HETNAM,Het标识符为SAD,只包括一个化学名称葡萄糖。

HETSNY (非标准残基的同义字)

综述

这部分对相应的HETNAM记录中的化合物提供所有的同意字,这使搜寻HET groups有更大的机动性。

记录格式

1 - 6

9 - 10

12 - 14

16 - 70

细节

1. 这并不能保证是对所有可能同义字的完整列表,但通过PDB统一起来。新的同义字可以加入。这个列表可继续附加在HETSYN记录。即使

相同的hetID出现在不止一个HET记录中。

2. 对于一个给出的hetID只能包括一个HETSYN记录。

3. 对记录中的每个HETSYN记录,相应的 HET, HETNAM, FORMUL, HETATM和CONECT 记录一定出现。LINK记录也可能出现。

示例

1 2 3 4 5 6 7

345678934567890

HETSYN NAD NICOTINAMIDE ADENINE DINUCLEOTIDE

HETSYN COA COA

HETSYN CMP CYCLIC AMP; CYCLIC ADENOSINE MONOPHOSPHATE

数据类型

Record name

Continuation

LString(3)

SList

字段名称

"HETSYN"

Continuation

hetID

hetSynonyms

定义描述

允许多条记录串连表示不同行的顺序号.

Het 标识符,右对齐

同义字

在HETNAM记录中每个hetID赋一个唯一的化学名称。

其他名字在HETSYN记录中。

PDB 依据IUPAC/IUB(国际理论和使用化学联合会)命名惯例对这组进行系统描述。

允许在原来基础上附加化学名称。

对于一个给出的hetID只能包括一个HETNAM记录,即使相同的hetID出现在不止一个HET记录中。

数据类型

Record name

Continuation

LString(3)

String

字段名称

"HETNAM"

Continuation

hetID

text

定义描述

允许多条记录串连表示不同行的顺序号.

Het 标识符,右对齐

化学名称

HETSYN TRS TRIS BUFFER; TRISAMINE;

HETSYN 2 TRS TRIS(HYDROXYMETHYL)AMINOMETHANE; TRIMETHYLOL

HETSYN 3 TRS AMINOMETHANE

1-6列存放HETSYN,如NAD同义名称为NICOTINAMIDE ADENINE DINUCLEOTIDE(烟酰腺嘌呤二核苷酸)。还允许多条记录串连,如第五行TRS就

有TRIS(HYDROXYMETHYL)AMINOMETHANE核和TRIMETHYLOL两条记录。

FORMOL(非标准残基的化学式)

综述

介绍化学式和非标准部分。(标准残基的化学式在Appendix 5中)

记录格式

1 - 6

9 - 10

13 - 15

17 - 18

19

20 - 70

细节

1. 化学式中的元素按C,H,N的顺序给出,其他元素接着按字母顺序排列,之间用空格分开。

2. 每个原子的数目紧跟着化学符号无空格。

3. 每套SEQRES记录和每个T group在记录中都分到一个成分号,这些号码是续分配的,从1开始作为第一套SEQRES记录。另外,

-如果一个HET group出现在一个SEQRES记录中,它的FORMUL分配给它所出现链的成分号。

-如果HET group 出现不止一个且不出现在SEQRES记录中,第一个出现的成分号即为所用。

4. ET group一条链所有内容用系数聚合在一起,剩余的也是如此。这个系数的总数数目相当于记录中所出现的HET group的次数。

5. 如果HET group是水和UNX,19列就用“*”表示,象征应排除分子量计算。

6. 附加区域需要更多的空间来放化学式。17-18列用来保持现有格式的连续性。

7. 对记录中所出的het group相应的 HET, HETNAM, FORMUL, HETATM和CONECT记录一定出现。FORMUL记录由PDB处理程序用het group

模板文件和来自HETATM 记录的信息自动产生。

示例

1 2 3 4 5 6 7

345678934567890

FORMUL 2 SO4 2(O4 S1 2-)

FORMUL 3 GLC C6 H12 O6

FORMUL 3 FOL 2(C19 H17 N7 O6 2-)

FORMUL 4 CL 2(CL1 1-)

FORMUL 5 CA CA1 2+

FORMUL 6 HOH *429(H2 O1)

FORMUL 3 UNX *3(X1)

FORMUL 4 HOH *256(H2 O1)

FORMUL 1 ACE C2 H3 O1

FORMUL 2 ACE C2 H3 O1

就第二行来说1-6列存放FORMUL,有两个葡萄糖分子,化学式为C6H12O6。

5.二级结构

PDB文件二级结构部分描述了蛋白质和多肽中的螺旋(HELIX)、折叠片(SHEET)和转角(TURN)结构。下面分别介绍PDB文件中对这三类结构

的说明。

HELIX(螺旋)

综述

数据类型

Record name

Integer

LString(3)

Integer

Character

String

字段名称

"FORMUL"

compNum

hetID

continuation

asterisk

text

定义描述

成分数目

Het 标识符

延长数目

"*" 代表水分子

化学式

HELIX记录是用来标识蛋白质分子中螺旋结构的部分,并且在这部分对分子中的螺旋结构都进行了编号和命名,也注释出各个螺旋的起始和终止

氨基酸残基以及螺旋的长度。以下是PDB的HELIX部分的记录格式,

记录格式

1 - 6

8 - 10

12 - 14

16 - 18

20

22 - 25

26

28 - 30

32

34 - 37

38

39 - 40

41 - 70

72 - 76

细节

1. 如果螺旋中出现多于一个螺旋,那么HELIX记录中要用不同的系列编号和标识符。

2. 螺旋的起始残基是氮末端残基。

3. 螺旋分类号:

螺旋类型

右手α-螺旋(默认)

右手ω-螺旋

右手π-螺旋

右手γ-螺旋

右手310螺旋

左手α-螺旋

左手ω-螺旋

左手γ-螺旋

27 RIBBON/螺旋

多聚脯氨酸

和其他记录类型的关系可以在REMARK中找到。

示例

1 2 3 4 5 6 7

345678934567890123456

HELIX 1 HA GLY A 86 GLY A 94 1 9

HELIX 2 HB GLY B 86 GLY B 94 1 9

如此例,1-5列是记录名HELIX,10列是HELIX编号,HA是代表A链中的HELIX,16-18列是起始残基,这里GLY是甘氨酸,后面20列是链代码,

这里是A链,即此螺旋起始残基所在是A链,24-25列是残基所在位点编号,这里的起始残基GLY所在为A链第86位。同样道理,后面数列描述

的是此螺旋的末端残基,为甘氨酸,所在链为A链94位。第40列数字是螺旋类型代码,这里数字1是代表α-螺旋。第76位数字意义为螺旋长

度,这里是9个残基长。

SHEET(折叠片)

综述

折叠片记录项标识了折叠片在分子中的位置,以及起始和终止残基,并对每个折叠片进行了命名和编号。

记录格式

1 - 6

数据类型

Record name

字段名称

"SHEET "

定义描述

分类编号(39-40)列

1

2

3

4

5

6

7

8

9

10

数据类型

Record name

Integer

LString(3)

Residue name

Character

Integer

AChar

Residue name

Character

Integer

AChar

Integer

String

Integer

字段名称

"HELIX "

serNum

helixID

initResName

initChainID

initSeqNum

initICode

endResName

endChainID

endSeqNum

endICode

helixClass

comment

length

定义描述

螺旋的次序号。从1开始顺次增加编号。

螺旋标识。用来补充说明螺旋的次序号,每个螺旋用一个单字母来

做为其标识。

起始残基的名称。

用来标识此螺旋所在的链。

描述起始残基在序列中的排号。

起始残基的插入代码。

螺旋中的末端残基名称。

用来标识此螺旋所在的链。

描述末端残基在序列中的排号。

末端残基的插入代码。

螺旋的分类号。

有关此螺旋的评论。

螺旋的长度。

8 - 10

12 - 14

15 - 16

18 - 20

22

23 - 26

27

29 - 31

33

34 - 37

38

39 - 40

42 - 45

46 - 48

50

51 - 54

55

57 - 60

61 - 63

65

66 - 69

70

细节

1. 分支链的起始残基为氮末端残基,39-70描述的是分支链的标识信息。列出的分支链从折叠片的一边开始,后续为和其空间上相临近的其

他分支链。

2. 39-40列阐述了分支链相对顺反的意义,分支链n相对和n-1如果是顺式,则赋值为1,反之,分支链n相对分支链n-1如果是反式,则

赋值为-1,而此折叠片的第一分支链就赋值为0。

3. 42-70列详细说明了n和n-1的每对分支链间的一个氢键,这在当前链和前导链间均给出。主链的第一前导链没有此标识信息。

4. 对于一个闭合的折叠片(β桶)结构,第一条分支链就是最后一条分支链,可以在REMARK部分看到解释性的说明。

5. 分离的分支链或者是有两个或多个氨基酸序列不连续部分残基的趋向的分支链也被列出,并且在REMARK部分有关于它的描述。

示例

示例1:

1 2

345678934567890

SHEET 1 A 5 THR A 107 ARG A 110 0

SHEET 2 A 5 ILE A 96 THR A 99 -1

SHEET 3 A 5 ARG A 87 SER A 91 -1

SHEET 4 A 5 TRP A 71 ASP A 75 -1

SHEET 5 A 5 GLY A 52 PHE A 56 -1

SHEET 1 B 5 THR B 107 ARG B 110 0

SHEET 2 B 5 ILE B 96 THR B 99 -1

SHEET 3 B 5 ARG B 87 SER B 91 -1

SHEET 4 B 5 TRP B 71 ASP B 75 -1

SHEET 5 B 5 GLY B 52 ILE B 55 -1

Integer

LString(3)

Integer

Residue name

Character

Integer

AChar

Residue name

Character

Integer

AChar

Integer

Atom

Residue name

Character

Integer

AChar

Atom

Residue name

Character

Integer

AChar

strand

sheetID

numStrands

initResName

initChainID

initSeqNum

initICode

endResName

endChainID

endSeqNum

endICode

sense

curAtom

curResName

curChainId

curResSeq

curICode

prevAtom

prevResName

prevChainId

prevResSeq

prevICode

折叠片的分支链(strand)的编号,从1开始逐次增加。

折叠片的标识符。

折叠片中分支链的数目。

起始残基的名称。

分支链中起始残基的主链标识符。

分支起始残基在主链中的排序号。

分支链起始残基的插入代码。

末端终止残基名称。

终止残基的主链标识符。

终止残基的主链排序号。

终止残基的插入代码。

相对于前导链的意义。数字0代表第一前导链,1代表相对为顺式,

-1代表相对为反式。详细解释见后细节部分。

分支链标识信息:前分支链中原子的名称。

分支链标识信息:前分支链中的残基名称。

分支链标识信息:分支链的主链标识符。

分支链标识信息:前分支链残基的主链序列排号。

分支链标识信息:前分支链的插入代码。

分支链标识信息:导分支链的原子名称。

分支链标识信息:导分支链的残基名称。

分支链标识信息:导分支链的主链标识符。

分支链标识信息:导分支链残基的主链序列排号。

支链标识信息:导分支链的插入代码。

3 4 5 6 7

N

N

N

N

N

N

N

N

LYS A

LEU A

ALA A

PHE A

LYS B

LEU B

ALA B

ASP B

98

89

74

56

98

89

74

54

O

O

O

O

O

O

O

O

THR A 107

TYR A 97

ILE A 88

TRP A 71

THR B 107

TYR B 97

ILE B 88

GLU B 73

从这个示例可以看出SHEET A共有5条分支链,列14为SHEET标识符,列10为分支链标号,列16表示SHEET中的分支链总数。分支链1是从主

链A107位的苏氨酸(THR)到主链A110位的精氨酸(ARG),后面40列数字0代表了此链是首链。第二行是分支链2,从1到37列意义是主链

A96位的赖氨酸(LYS)到主链A99位的苏氨酸(THR),后面的-1代表其和它的前导链关系是反式。后面表示A链98位赖氨酸上的氮和前导链

A107位的苏氨酸(THR)上的氧之间形成氢键。后面其他SHEET意义都可以参考上面的注解。

示例2:

下面列出的BS1折叠片是一个8条分支链的β折叠桶。这个例子表现了闭和折叠片的首分支链和最后一条分支链是同一条链。其他含义可以参考

示例1的注释。

SHEET

SHEET

SHEET

SHEET

1 BS1 9 VAL

2 BS1 9 ALA

3 BS1 9 LYS

4 BS1 9 GLY

13 ILE 17 0

70 ILE 73 1 O TRP 72 N ILE 17

127 PHE 132 1 O ILE 129 N ILE 73

221 ASP 225 1 O GLY 221 N ILE 130

SHEET

SHEET

SHEET

SHEET

SHEET

5 BS1 9 VAL

6 BS1 9 LEU

7 BS1 9 TYR

8 BS1 9 VAL

9 BS1 9 VAL

248 GLU 253 1 O PHE

276 ASP 278 1 N LEU

310 THR 318 1 O VAL

351 TYR 356 1 O VAL

13 ILE 17 1 N VAL

249 N ILE 222

277 O GLY 252

317 N ASP 278

351 N THR 318

14 O PRO 352

示例3:

下面是个折叠片结构被分为两部分的实例,为了表现这一特征,定义了两个折叠片,分支链BS7的2链和分支链BS8的3链是同一条链。

SHEET

SHEET

SHEET

SHEET

SHEET

SHEET

1 BS7 3 HIS

2 BS7 3 LYS

3 BS7 3 ASN

1 BS8 3 ASN

2 BS8 3 LYS

3 BS8 3 ASN

662

639

596

653

639

596

THR

LYS

VAL

TRP

LYS

VAL

665 0

648 -1 N

600 -1 N

656 0

648 -1 N

600 -1 N

PHE 643 O HIS 662

TYR 598 O ILE 646

LYS 647 O THR 655

TYR 598 O ILE 646

TURN(转角)

综述

转角记录项是来确认转角和其他通常连接其他二级结构片段的短环转角(short loop turns)。

记录格式

1 - 6

8 - 10

12 - 14

16 - 18

20

21 - 24

25

27 - 29

31

32 - 35

36

41 - 70

细节

1. 转角包括那些来自β转角的残基都有一对(C-O)i到(N-H)I+3的氢键。连接I到I+2(γ弯曲)残基的转角也应该被包括。其他的也

有可能包括在转角的分类中。

2. 起始残基是氮末端残基。

3. 和其他数据类型的关系:可以在REMARK项中找到相关信息。

示例

1 2

345678934567890

TURN 1 S1A GLY A 16 GLN A 18

TURN 2 FLA ILE A 50 GLY A 52

TURN 3 S2A ILE A 66 HIS A 69

TURN 4 S1B GLY B 16 GLN B 18

TURN 5 FLB ILE B 50 GLY B 52

TURN 6 S2B ILE B 66 HIS B 69

3 4 5 6 7

SURFACE

FLAP

SURFACE

SURFACE

FLAP

SURFACE

数据类型

Record name

Integer

LString(3)

Residue name

Character

Integer

AChar

Residue name

Character

Integer

AChar

String

字段名称

"TURN "

seq

turnId

initResName

initChainID

initSeqNum

initICode

endResName

endChainID

endSeqNum

endICode

comment

定义描述

转角的编号,从1开始逐个增加。

转角标识符。

转角中的起始残基名称。

包含此转角的主链的标识符。

转角起始残基主链中的序列排号。

转角起始残基的插入码。

转角终止残基名称。

包含此转角的主链的标识符。

转角终止残基在主链中的序列排号。

转角终止残基的插入码。

相关注释。

参照以上转角的数据描述,此示例有如下含义:10列为转角标号,从一开是逐一递增,12-14是转角标识符,后面分别说明了转角的起始和终止

残基,以TURN 1 来说明,其标识为S1A,起始残基为主链A 16位的甘氨酸,终止残基为主链A18位的谷氨酰氨(GLN),后面是对此转角的说明。

6.连接注释

连接注释部分详细说明二硫化物的存在和位置,还有其他连接:共价键,盐桥。它包括以下几个部分。

SSBOND(二硫键)

综述

这一部分通过识别二硫键连接的两个残基识别蛋白中的每个二硫键和多肽键结构。

记录格式

1 - 6

8 - 10

12 - 14

16

18 - 21

22

26 - 28

30

32 - 35

36

60 - 65

67 - 72

示例

1 2 3 4 5 6

7

34567893456789012

SSBOND 1 CYS E 48 CYS E 51 2555

SSBOND 2 CYS E 252 CYS E 285

如上边所示:SSBOND 1 CYS E 48 CYS E 51

记录名为:SSBOND,序列号为1,E链上第48位和第51位结合形成二硫键。

LINK(残基间化学键)

综述

LINK详细说明在一级结构中残基间没有指出的结构,残基之间的连接依据原子名来表示,即残基间的化学键。该记录补充了CONECT记录的信息,

方便了查询。

记录格式

1 - 6

13 - 16

17

18 - 20

22

23 - 26

27

43 - 46

47

48 - 50

52

53 - 56

57

60 - 65

67 - 72

示例

1 2 3 4 5 6 7

34567893456789012

LINK O1 DDA 1 C3 DDL 2

LINK MN MN 391 OE2 GLU 217 2565

数据类型

Record name

Atom

Character

Residue name

Character

Integer

AChar

Atom

Character

Residue name

Character

Integer

AChar

SymOP

SymOP

字段名称

"LINK "

name1

altLoc1

resName1

chainID1

resSeq1

icode1

name2

altLoc2

resName2

chainID2

resSeq2

icode2

sym1

sym2

定义描述

原子名

交替位点标识

残基名

链标识符

残基序列号

插入代码

原子名

交替位点标识

残基名

链标识符

残基序列号

插入代码

第一个原子的对称算子

第二个原子的对称算子

数据类型

Record name

Integer

LString(3)

Character

Integer

AChar

LString(3)

Character

Integer

AChar

SymOP

SymOP

字段名称

"SSBOND"

serNum

"CYS"

chainID1

seqNum1

icode1

"CYS"

chainID2

seqNum2

icode2

sym1

sym2

定义描述

序列号

残基名

链标识符

残基序列号

插入代码

残基名

链标识符

残基序列号

插入代码

第一个残基对称算子

第二个残基对称算子

如:LINK O1 DDA 1 C3 DDL 2

解释为:LINK记录,第一个残基DDA中的原子O1和第2个残基DDL中的原子C3相互作用形成特殊键。

HYDBND(氢键)

综述

详细说明记录中的氢键.

记录格式

列 数据类型 字段名称 定义描述

1 - 6 Record name "HYDBND"

13 - 16 Atom name1 原子名

17 Character altLoc1 交替位点标识

18 - 20 Residue name resName1 残基名

22 Character chainID1 链标识符

23 - 27 Integer resSeq1 残基序列号

28 AChar icode1 插入代码

30 - 33 Atom nameH 氢原子名

34 Character altLocH 交替位点标识

36 Character ChainH 链标识符

37 - 41 Integer resSeqH 残基序列号

42 AChar iCodeH 插入代码

44 - 47 Atom name2 原子名

48 Character altLoc2 交替位点标识

49 - 51 Residue name resName2 残基名

53 Character chainID2 链标识符

54 - 58 Integer resSeq2 残基序列号

59 AChar icode2 插入代码

60 - 65 SymOP sym1 第一个非氢原子的对称算子

67 - 72 SymOP sym2 第二个非氢原子的对称算子

示例

1 2 3 4 5

34567893456789012

HYDBND N LEU 10 AO3* NDP 501

HYDBND NH2 ARG 111 OD1 ASP 149 1555

如:HYDBND N LEU 10 AO3* NDP 501

解释为: 第10个氨基酸LEU上的N原子和第501个氨基酸NDP上的第三位氧的一个氢原子相互作用形成的特殊键。

SLTBRG(盐桥)

综述

SLTBRG详细记录了盐桥,盐桥是两个原子通过电子之间的相互作用所形成的一种特殊键。

记录格式

列 数据类型 字段名称 定义描述

1 - 6 Record name "SLTBRG"

13 - 16 Atom atom1 第一个原子名

17 Character altLoc1 交替位点标识

18 - 20 Residue name resName1 残基名

22 Character chainID1 链标识符

23 - 26 Integer resSeq1 残基序列号

27 AChar icode1 插入代码

43 - 46 Atom name2 第二个原子名

47 Character altLoc2 交替位点标识

48 - 50 Residue name resName2 残基名

52 Character chainID2 链标识符

6 7

53 - 56

57

60 - 65

67 - 72

示例

1 2 3 4 5 6 7

34567893456789012

SLTBRG O GLU 10 NZ LYS 115

SLTBRG O GLU 10 NZ LYS 115 3654

如:SLTBRG O GLU 10 NZ LYS 115

第10个GLU上的氧和第115个LYS上NZ上的氢相结合形成盐桥。

CISPEP(顺式残基)

综述

CISPEP详细记录了在顺式结构中的脯氨酸和其他缩氨酸,即顺式残基。这些记录可以取代脚本注释来显示顺式残基。

记录格式

1 - 6

8 - 10

12 - 14

16

18 - 21

22

26 - 28

30

32 - 35

36

44 - 46

54 - 59

示例

1 2 3 4 5 6 7

345678934567890

CISPEP 1 GLY A 116 GLY A 117 0 18.50

CISPEP 2 THR D 92 PRO D 93 0 359.80

如:CISPEP 1 GLY A 116 GLY A 117 0 18.50

解释为:记录序列号为1的CISPEP中,A型链第116位残基GLY和A型链第117位残基GLY相互作用形成的键角为18.5度。

7.晶胞特征及坐标变换

这部分共包括五种记录参数:CRYST1,ORIGXn,SCALEn,MTRIXn,TVECT。在这五种记录参数中有三种是必须的:CRYST1,ORIGXn,SCALEn。

CRYST1(晶胞参数)

综述

CRYST1用来描述晶胞特征,其包含了晶胞结构参数。其中,a,b,c表示晶胞三条棱的长度,α,β,γ表示三条棱之间的夹角,如此晶胞空间结构

被描述成菱形六面体。Space group用来描述空间聚合的程度,用完整的Hermann- Mauguin 符号表示。Z 值表示一个单位结构中聚合链的个数。

记录格式

1 - 6

7 - 15

16 - 24

25 - 33

数据类型

Record name

Real(9.3)

Real(9.3)

Real(9.3)

字段名称

"CRYST1"

a

b

c

定义描述

a(埃)

b(埃)

c(埃)

数据类型

Record name

Integer

LString(3)

Character

Integer

AChar

LString(3)

Character

Integer

AChar

Integer

Real(6.2)

字段名称

"CISPEP"

serNum

pep1

chainID1

seqNum1

icode1

pep2

chainID2

seqNum2

icode2

modNum

measure

定义描述

记录序列号

残基名

链标识符

残基序列号

插入代码

残基名

链标识符

残基序列号

插入代码

识别特殊模型

测量角的度数

Integer

AChar

SymOP

SymOP

resSeq2

icode2

sym1

sym2

残基序列号

插入代码

第一个原子的对称算子

第二个原子的对称算子

34 - 40

41 - 47

48 - 54

56 - 66

67 - 70

细节

1.

2.

3.

4.

5.

CRYST1使用了国际 Hermann- Mauguin 符号,例如使用P 1 21 1 代替 P 21。

Z值表示一个单位晶胞的聚合链数。

在处理正确和内在一致性时,要检查被给定的空间组和Z值。

在 polycrystalline纤维衍射研究,CRYST1和SCALEn中包含常态单位结构数据。

单位晶胞参数用来计算SCALE。如果 EXPDTA 记录是 NMR ,理论模型,或纤维衍射,纤维,那末CRYST1 记录会被预先定义,如a = b= c=1.0 ,

α=β=γ=90 度,space group = P 1 和 Z=1. 在这些情况,一个说明性的REMARK一定在进入中出现。一些纤维衍射结构这样将会被这样

Real(7.2)

Real(7.2)

Real(7.2)

LString

Integer

alpha

beta

gamma

sGroup

z

α(度)

β(度)

γ(度)

空间基团

Z 值

做,和此同时其它纤维衍射有一个包含测量值的CRYST1 记录。

6. 存在的问题是,没有给出标准的偏离 。

示例

1 2 3 4 5 6

345678934567890

CRYST1 52.000 58.600 61.900 90.00 90.00 90.00 P 21 21 21 8

CRYST1 1.000 1.000 1.000 90.00 90.00 90.00 P 1 1

CRYST1 42.544 69.085 50.950 90.00 95.55 90.00 P 1 21 1 2

ORIGXn(直角-PDB坐标)

综述

ORIGXn (n = 1, 2, or 3) 记录介绍记录中直角坐标向递交坐标的转换.

列 数据类型 字段名称 定义描述

1 - 6 Record name "ORIGXn" n=1, 2, or 3

11 - 20 Real(10.6) o[n][1] On1

21 - 30 Real(10.6) o[n][2] On2

31 - 40 Real(10.6) o[n][3] On3

46 - 55 Real(10.5) t[n] Tn

细节

1. 即使当转换是恒等交换(矩阵单元,无效向量)时PDB也给出这些信息.可参看SCALE部分关于定义默认的直角埃系统的文献.

2. 如果初始递交坐标是 Xsub , Ysub, Zsub 和被包含在数据输入的直角埃坐标是 X , Y , Z,然后: Xsub= O11X+ O12Y+ O13Z+ T1

Ysub= O21X+ O22Y+ O23Z+ T2

Zsub= O31X+ O32Y+ O33Z+ T3

3. Appendix 2详细记录ORIGX坐标转换的出处.

4. ORIGXn联系ATOM和 HETATM 记录中的坐标和初始坐标。

示例

1 2 3 4 5 6

345678934567890

ORIGX1 0.963457 0.136613 0.230424 16.61000

ORIGX2 -0.158977 0.983924 0.081383 13.72000

ORIGX3 -0.215598 -0.115048 0.969683 37.65000

SCALEn(直角-部分结晶学坐标)

综述

SCALEn记录介绍记录中直角坐标向部分结晶学坐标的转换。也应解释非标准坐标.

列 数据类型 字段名称 定义描述

1 - 6 Record name "SCALEn" n=1, 2, or 3

11 - 20 Real(10.6) s[n][1] sn1

7

7

21 - 30

31 - 40

46 - 55

细节

PDB使用的标准直角坐标系统和单位晶胞轴系统相关。单位晶胞轴系统相关由下列定义提供:

Real(10.6)

Real(10.6)

Real(10.5)

s[n][2]

s[n][3]

u[n]

sn2

sn3

Un

如果矢量a,矢量b,矢量c描述晶胞边缘,且矢量A,矢量B,矢量C是单位内定的直角埃系统晶胞矢量,那末矢 量a,矢量b,矢量c和矢量

A,矢量B,矢量C同源:矢量A平行和矢量a,矢量B平行于矢量c倍的矢量a,矢量C平行和矢量a倍的矢量b。

如果直角的埃坐标是 X , Y , Z 和部分晶胞坐标是x frac , yfrac, zfrac,然后:

xfrac= S11X+ S12Y+ S13Z+ U1

yfrac= S21X+ S22Y+ S23Z+ U2

zfrac= S31X+ S32Y+ S33Z+ U3

SCALEn的变换和 CRYST1 记录相关联,如SCALE点阵式的决定因素的反相等于晶胞体积。

以上三个记录是每个PDB文件中必须的三项记录。

示例

1 2 3 4 5 6 7

345678934567890

SCALE1 0.019231 0.000000 0.000000 0.00000

SCALE2 0.000000 0.017065 0.000000 0.00000

SCALE3 0.000000 0.000000 0.016155 0.00000

MTRIXn(非晶相对称)

综述

SCALEn记录介绍记录中直角坐标向部分结晶学坐标的转换。也应解释非标准坐标.

1 - 6

8 - 10

11 - 20

21 - 30

31 - 40

46 - 55

60

数据类型

Record name

Integer

Real(10.6)

Real(10.6)

Real(10.6)

Real(10.5)

Integer

字段名称

"MTRIXn"

serial

m[n][1]

m[n][2]

m[n][3]

v[n]

iGiven

定义描述

n=1, 2, or 3

序列号

Mn1

Mn2

Mn3

Un

如果和分子转换近似相关的坐标表示法包含在记录中就用1表

示,否则空白.

细节

1. 用一个固定序号的MTRIX记录三个一组来定义描述一个非晶胞对称操作。如果和给定变换相联系坐标表示在文件中,那么iGiven的值为

1,否则为空。

2. 一个相应的REMARK记录一定出现在描述变化的地方。

3. 如果iGiven的值为1,PDB通过使用给定的变换和计算提供坐标决定RMSD来查证所有的MTRIX记录。如果iGiven的值为空,PDB通过检

查产生分子的封装来查证MTRIX记录。

示例

1 2 3 4 5 6 7

345678934567890

MTRIX1 1 -1.000000 0.000000 -0.000000 0.00001 1

MTRIX2 1 -0.000000 1.000000 0.000000 0.00002 1

MTRIX3 1 0.000000 -0.000000 -1.000000 0.00002 1

TVECT(转换因子)

综述

TVECT记录介绍无限共价键连接结构的转换因子。

1 - 6

数据类型

Record name

字段名称

"TVECT "

定义描述

8 - 10

11 - 20

21 - 30

31 - 40

41 - 70

细节

1. 由于结构不是由不连续的分子组成的,这种进入包含一个通过TVECT记录的简单转化因子能加入完整结构的碎片。

2. 有一个描述结构的相关REMARK记录出现。

3. PDB使用这种转化并检查产生的分子。

示例

1 2 3 4 5 6 7

345678934567890

TVECT 1 0.00000 0.00000 28.30000

MTRIX,TVECT这两项不是必须有的两项。

8.坐标部分

坐标部分主要包括原子坐标的收集,正如MODEL/ ENDMDL记录。

MODLE用来标志一个模块的开始,ENDMDL则标志着一个模块的结束。一个模块主要有MODEL,ATOM,HETATM,SIGATM SIGUIJ,ANISOU,TER和 ENDMDL

记录等几部分组成。

MODEL(多亚基时示亚基号)

综述

MODEL部分主要记录了模块的序列号。

记录格式

1 - 6

11 - 14

细节

需要注意的是,这种记录只用于当一个记录中有多个MODEL出现时,并且它主要用于NMR结构中。MODEL的序列号是从1开始的,并且是连续的。

示例

1 2 3 4 5 6 7

8

34567893456789

MODEL 1

ATOM 1 N ALA 1 11.104 6.134 -6.504 1.00 0.00 N

ATOM 2 CA ALA 1 11.639 6.071 -5.147 1.00 0.00 C

...

ATOM 294 2HG GLU 18 -13.518 -3.769 0.084 1.00 0.00 H

TER 295 GLU 18

ENDMDL

MODEL 2

ATOM 296 N ALA 1 10.883 6.779 -6.464 1.00 0.00 N

ATOM 297 CA ALA 1 11.451 6.531 -5.142 1.00 0.00 C

...

ATOM 589 2HG GLU 18 -12.634 -3.023 -3.475 1.00 0.00 H

TER 590 GLU 18

ENDMDL

ATOM(标准基团的原子坐标)

综述

MODEL部分主要记录了模块的序列号。

数据类型

Record name

Integer

字段名称

"MODEL "

serial

定义描述

Model序列号

Integer

Real(10.5)

Real(10.5)

Real(10.5)

Integer

serial

t[n][1]

t[n][2]

t[n][3]

text

序列号

转化矢量成分

转化矢量成分

转化矢量成分

注释

记录格式

1 - 6

7 - 11

13 - 16

17

18 - 20

22

23 - 26

27

31 - 38

39 - 46

47 - 54

55 - 60

61 - 66

73 - 76

77 - 78

79 - 80

细节

1.

2.

3.

4.

一般来说,蛋白质的这些原子记录是从氨基到羧基来排列的。

但对多聚糖而言是无序的。

核酸的残基是从5' 端到 3'端排列的。

由于第7—11位存储原子的序列号,即一个MODEL/ENDMD模块中能够存储的最大原子数为99999,所以当一个记录中有多于99999个原子

时,就需要多个MODEL/ENDMD模块,而这些模块中的原子序列号是连续的,并且关键字MODEL和ENDMDL必须显示,但一般情况下可以不

写。

数据类型

Record name

Integer

Atom

Character

Residue name

Character

Integer

AChar

Real(8.3)

Real(8.3)

Real(8.3)

Real(6.2)

Real(6.2)

LString(4)

LString(2)

LString(2)

字段名称

"ATOM "

serial

name

altLoc

resName

chainID

resSeq

iCode

x

y

z

occupancy

tempFactor

segID

element

charge

定义描述

原子序列号

原子名

交替位点标识

残基名

链标识符

残基序列号

残基的插入代码

X坐标

Y坐标

Z坐标

空间大小

温度因数

段标识符,左对齐

元素符号,右对齐

原子的价位

示例

1 2 3 4 5 6 7

8

34567893456789

ATOM 145 N VAL A 25 32.433 16.336 57.540 1.00 11.92 A1 N

ATOM 146 CA VAL A 25 31.132 16.439 58.160 1.00 11.85 A1 C

ATOM 147 C VAL A 25 30.447 15.105 58.363 1.00 12.34 A1 C

ATOM 148 O VAL A 25 29.520 15.059 59.174 1.00 15.65 A1

SIGATM(标准差)

综述

这部分主要记录了在ATOM和HETATM 中出现的原子参数的标准差。

记录格式

1 - 6

7 - 11

13 - 16

17

18 - 20

22

23 - 26

27

31 - 38

39 - 46

47 - 54

55 - 60

61 - 66

73 - 76

77 - 78

数据类型

Record name

Integer

Atom

Character

Residue name

Character

Integer

AChar

Real(8.3)

Real(8.3)

Real(8.3)

Real(6.2)

Real(6.2)

LString(4)

LString(2)

字段名称

"SIGATM"

serial

name

altLoc

resName

chainID

resSeq

iCode

sigX

sigY

sigZ

sigOcc

sigTemp

segID

element

定义描述

原子序列号

原子名

交替位点标识

残基名

链标识符

残基序列号

插入代码

坐标的标准差

坐标的标准差

坐标的标准差

占有标准差背离

温度因数的标准差

段标识符,左对齐

元素符号,右对齐

79 - 80

细节

其中7 - 27位 和 73 - 80位所记录的内容和ATOM/HETATM中的相同,并且每个SIGATM总是紧跟着一个ATOM/HETATM记录后面。但不是每个

ATOM/HETATM记录都有一个SIGATM,只有当研究人员提供这些数值并且这些数值不为零时才会出现SIGATM记录。

示例

1 2 3 4 5 6 7

8

34567893456789

ATOM 230 N PRO 15 20.860 29.640 13.460 1.00 12.20 N

SIGATM 230 N PRO 15 0.040 0.030 0.030 0.00 0.00 N

ATOM 231 CA PRO 15 22.180 29.010 12.960 1.00 14.70 C

SIGATM 231 CA PRO 15 0.060 0.040 0.050 0.00 0.00 C

ATOM 237 HA PRO 15 22.630 28.400 13.620 1.00 14.70 H

ATOM 238 1HB PRO 15 22.240 28.540 10.860 1.00 17.70 H

ATOM 239 2HB PRO 15 21.670 27.240 11.840 1.00 17.70

ANISOU(温度因子)

综述

这部分主要记录了各种温度因子。

记录格式

1 - 6

7 - 11

13 - 16

17

18 - 20

22

23 - 26

27

29 - 35

36 - 42

43 - 49

50 - 56

57 - 63

64 - 70

73 - 76

77 - 78

79 - 80

细节

其中7 - 27位 和 73 - 80位所记录的内容和ATOM/HETATM中的相同。在这里,这些温度因数都是整数,并且是以10**4 (埃**2)为单位来度量

的,它们存储在和原子记录相同的坐标结构中。和SIGATM部分一样,只有当研究人员提供这些数据值时才会出现ANISOU记录。

示例

1 2 3 4 5 6 7

8

34567893456789

ATOM 107 N GLY 13 12.681 37.302 -25.211 1.000 15.56 N

ANISOU 107 N GLY 13 2406 1892 1614 198 519 -328 N

ATOM 108 CA GLY 13 11.982 37.996 -26.241 1.000 16.92 C

ANISOU 108 CA GLY 13 2748 2004 1679 -21 55 -419 C

ATOM 109 C GLY 13 11.678 39.447 -26.008 1.000 15.73

SIGUIJ(各种温度因素导致的标准差)

数据类型

Record name

Integer

Atom

Character

Residue name

Character

Integer

AChar

Integer

Integer

Integer

Integer

Integer

Integer

LString(4)

LString(2)

LString(2)

字段名称

"ANISOU"

serial

name

altLoc

resName

chainID

resSeq

iCode

u[0][0]

u[1][1]

u[2][2]

u[0][1]

u[0][2]

u[1][2]

segID

element

charge

定义描述

原子序列号

原子名

交替位点标识

残基名

链标识符

残基序列号

插入代码

U(1,1)

U(2,2)

U(3,3)

U(1,2)

U(1,3)

U(2,3)

段标识符,左对齐

元素符号,右对齐

原子的价位

LString(2) charge 原子的价位

综述

这部分主要记录了各种温度因子。

记录格式

1 - 6

7 - 11

13 - 16

17

18 - 20

22

23 - 26

27

29 - 35

36 - 42

43 - 49

50 - 56

57 - 63

64 - 70

73 - 76

77 - 78

79 - 80

细节

其中7 - 27位 和 73 - 80位所记录的内容和ATOM/HETATM中的相同,而且只有当研究人员提供这些数值并且这些数值不为零时才会出现SIGATM

记录。

示例

1 2 3 4 5 6 7

8

34567893456789

ATOM 107 N GLY 13 12.681 37.302 -25.211 1.000 15.56 N

ANISOU 107 N GLY 13 2406 1892 1614 198 519 -328 N

SIGUIJ 107 N GLY 13 10 10 10 10 10 10 N

ATOM 108 CA GLY 13 11.982 37.996 -26.241 1.000 16.92 C

ANISOU 108 CA GLY 13 2748 2004 1679 -21 155 -419 C

SIGUIJ 108 CA GLY 13 10 10 10 10 10 10

TER(链末端)

综述

TER记录表示了在一个链中一个ATOM/HETATM记录的结束。

记录格式

1 - 6

7 - 11

18 - 20

22

23 - 26

27

细节

1. 在SEQRES 记录中描述的每个ATOM/HETATM 链都是以一个TER记录来标志结束的。

2. 这种TER记录出现在每个记录的坐标部分,并且指示出每个多肽或者是核酸链的最后一个残基。对于蛋白质来说,这个残基是C-端残基;

但对于核酸来说它是一个3'端残基。

3. 对于环状分子来说,这个末端分子的选择是随意的。

数据类型

Record name

Integer

Residue name

Character

Integer

AChar

字段名称

"TER "

serial

resName

chainID

resSeq

iCode

定义描述

原子序列号

残基名

链标识符

残基序列号

插入代码

数据类型

Record name

Integer

Atom

Character

Residue name

Character

Integer

AChar

Integer

Integer

Integer

Integer

Integer

Integer

LString(4)

LString(2)

LString(2)

字段名称

"SIGUIJ"

serial

name

altLoc

resName

chainID

resSeq

iCode

sig[1][1]

sig[2][2]

sig[3][3]

sig[1][2]

sig[1][3]

sig[2][3]

segID

element

charge

定义描述

原子序列号

原子名

交替位点标识

残基名

链标识符

残基序列号

插入代码

Sigma U(1,1)

Sigma U(2,2)

Sigma U(3,3)

Sigma U(1,2)

Sigma U(1,3)

Sigma U(2,3)

段标识符,左对齐

元素符号,右对齐

原子的价位

4. 蛋白质中末端的氧原子是以OXT的形式描述的,而核酸中末端的氧原子是以O5T 或 O3T 的形式描述的。

5. 这种TER记录描述了残基的残基名,链标识符,序列号以及插入代码。并且它的序列号比前面ATOM/HETATM记录中描述的残基的序列号都

大。

6. 对于由于无序而造成的具有空位的链,人们习惯用C-端原子来表示O and OXT,并且用一个REMARK记录来解释其中不明确的地方。

示例

1 2 3 4 5 6 7

8

34567893456789

ATOM 4150 H ALA A 431 8.674 16.036 12.858 1.00 0.00 H

TER 4151 ALA A 431

ATOM 1403 O PRO P 22 12.701 33.564 15.827 1.09 18.03 O

ATOM 1404 CB PRO P 22 13.512 32.617 18.642 1.09 9.32 C

ATOM 1405 CG PRO P 22 12.828 33.382 19.740 1.09 12.23

ATOM 1406 CD PRO P 22 12.324 34.603 18.985 1.09 11.47

HETATM 1407 CA BLE P 1 14.625 32.240 14.151 1.09 16.76

HETATM 1408 CB BLE P 1 15.610 33.091 13.297 1.09 16.56

HETATM 1409 CG BLE P 1 15.558 34.629 13.373 1.09 14.27

HETATM 1410 CD1 BLE P 1 16.601 35.208 12.440 1.09 14.75

HETATM 1411 CD2 BLE P 1 14.209 35.160 12.930 1.09 15.60

HETATM 1412 N BLE P 1 14.777 32.703 15.531 1.09 14.79

HETATM 1413 B BLE P 1 14.921 30.655 14.194 1.09 15.56

HETATM 1414 O1 BLE P 1 14.852 30.178 12.832 1.09 16.10

HETATM 1415 O2 BLE P 1 13.775 30.147 14.862 1.09 20.95

TER 1416 BLE P 1

HETATM(非标准基团原子坐标)

综述

这部分主要记录了非标准集团原子的坐标,这些记录主要用于水分子和HET集团原子.

记录格式

列 数据类型 字段名称 定义描述

1 - 6 Record name "HETATM"

7 - 11 Integer serial 原子序列号

13 - 16 Atom name 原子名

17 Character altLoc 交替位点标识

18 - 20 Residue name resName 残基名

22 Character chainID 链标识符

23 - 26 Integer resSeq 残基序列号

27 AChar iCode 残基的插入代码

31 - 38 Real(8.3) x X坐标

39 - 46 Real(8.3) y Y坐标

47 - 54 Real(8.3) z Z坐标

55 - 60 Real(6.2) occupancy 空间大小

61 - 66 Real(6.2) tempFactor 温度因数

73 - 76 LString(4) segID 段标识符,左对齐

77 - 78 LString(2) element 元素符号,右对齐

79 - 80 LString(2) charge 原子的价位

细节

1. 这里的 x, y, z 坐标是以埃为单位的。

2. 在一些条目中,空间大小和温度因素区域部分经常用来说明原子的其它参数。如果是这

种情况,在注释部分将会有一个详细的解释。

3. 插入代码,段标识符和元素名称在ATOM部分已经作了详细的描述。

4. 除了水以外,每个HETATM记录都必须有一个相应的HET, HETNAM, FORMUL 和 CONECT

记录。

C

C

C

C

C

N

B

O

O

C

C

示例

1 2 3 4

5 6 7 8

34567893456789

HETATM 1357

MG MG 168 4.669 34.118 19.123 1.00 3.16

MG2+

HETATM 3835 FE HEM 1 17.140 3.115 15.066 1.00

14.14 FE3+

ENDMDL(亚基结束)

综述

ENDMDL记录和MODEL记录是成对出现的,用来组成一个坐标条目中的单结构。

记录格式

1 - 6

细节

1. 要注意的是,这种记录只用于当一个记录中有多个MODEL出现时,并且它主要用于NMR

结构中。

2. 在一个具有多模块的条目中所有的模块必须描述的是相同的结构。

3. 每个MODEL记录都有一个相应的ENDMDL记录。

示例

1 2 3 4

5 6 7 8

34567893456789

...

...

ATOM 14550 1HG GLU 122 -14.364 14.787

-14.258 1.00 0.00 H

ATOM 14551 2HG GLU 122 -13.794 13.738

-12.961 1.00 0.00 H

TER 14552 GLU 122

ENDMDL

MODEL 9

ATOM 14553 N SER 1 -28.280 1.567 12.004 1.00 0.0

0 N

ATOM 14554 CA SER 1 -27.749 0.392 11.256 1.00 0.00

C

...

...

ATOM 16369

1HG GLU 122 -3.757 18.546 -8.439 1.00 0.00

H

ATOM 16370

2HG GLU 122 -3.066 17.166 -7.584 1.00 0.00

H

TER 16371 GLU 122

ENDMDL

MODEL 10

数据类型

Record name

字段名称

"ENDMDL"

定义描述

ATOM 16372 N SER 1 -22.285 7.041 10.003 1.00 0.0

0 N

ATOM 16373 CA SER 1 -23.026 6.872 8.720 1.00 0.0

0 C

...

...

ATOM 18188 1HG GLU 122 -1.467 18.282

-17.144 1.00 0.00 H

ATOM 18189 2HG GLU 122 -2.711 18.067

-15.913 1.00 0.00 H

TER 18190 GLU 122

ENDMDL

10.连通性部分

要是提供该pdb在化学连通性方面的信息。LINK(联系),HYDBND(氢键), SLTBRG(盐桥)和CISPEP

(顺势肽)则出现在连通性注释部分.

CONECT(原子间的连通性有关记录)

综述

CONECT详细的描述了已给出坐标的原子间的连通性。而这种连通性是以该记录的原子序列号的形式

表现的。(参照后面的例子)

CONECT记录是用来描述那些非标准残基(包括水)和那些在标准连同性表中没有被详细列出的键。

(参照第四部分标准残基列表)

记录格式

1 - 6

7 - 11

12 - 16

17 - 21

22 - 26

27 - 31

32 - 36

37 - 41

42 - 46

47 - 51

52 - 56

57 - 61

细节

1.

2.

3.

4.

5.

6.

7.

8.

在非标准残基(包括水)中的内部残基连通性在CONECT中有所表现。

非标准残基组和标准残基组或和非标准残基组之间的交叉性隐含在CONECT中。

在SSBOND记录中二硫键在CONECT中有相应的记录。

氢键和盐桥在CONECT中有相应的记录。

连接氢键的两个原子没有区别。

带多余正负电荷的原子之间没有区别。

原子的连通性是通过原子序列号表现出来的。

如果原子的共价键大于4个,那么需要再建立一个新的和这个原子的序列号相同的CONECT

记录。

9. 如果一个键的两端的一个原子出现在7-11字节中,那么另一个就没有必要再标示出来。

10. 对于核酸,氢键列出和否是可以选择的。

11. 对于氢键来说,当一个氢原子出现的时候,pdb会建立一个CONECT用来记录氢原子和它连接

的原子。

12. 对于核磁共振来说,CONECT用来记录异型杂种的连通性。

数据类型

Record name

Integer

Integer

Integer

Integer

Integer

Integer

Integer

Integer

Integer

Integer

Integer

字段名称

“CONECT”

serial

serial

serial

serial

serial

serial

serial

serial

serial

serial

serial

定义描述

原子序列号

共价键连接的原子序列号

共价键连接的原子序列号

共价键连接的原子序列号

共价键连接的原子序列号

氢键连接的原子序列号

氢键连接的原子序列号

盐桥连接的原子序列号

氢键连接的原子序列号

氢键连接的原子序列号

盐桥连接的原子序列号

13. 和其他记录的联系:如果某条出现了非标准组或是二硫键,CONECT必须出现 。

示例

1 2 3 4

5 6 7

345678934567890

CONECT 1179 746 1184 1195 1203

CONECT 1180 1211 1222

CONECT 1021 544 1017 1020 1022 1211 1222 1311

10.簿记

该部分主要是用提供文件自身最后其他一些补充的内容.

MASTER (版权拥有者)

综述

MASTER记录是簿记部分的控制记录,在这部分列出了相应记录或所选数据类型文件的数目。

记录格式

1 - 6

16 - 20

21 - 25

26 - 30

31 - 35

36 - 40

41 - 45

46 - 50

51 - 55

56 - 60

61 - 65

66 - 70

细节

对于已经选用的记录类型,MASTER项给出了这一条目所有记录数目行数的验证数字。

示例

1 2 3 4

5 6 7

345678934567890

MASTER 40 0 0 0 0 0 0 6

2930 2 0 29

如上示例,14列表示REMARK记录项一共有40行,20列被定义为0,25列为0表示没有HET记录,

30列为0表示没有HELIX记录,35列为0表示没有SHEET记录,35列表示TURN记录为0,40列表

示没有SITE记录,50列为数字6表示坐标变换记录有6行,22-25行表示ATOM和HETATM项共2930

行,60表示TER记录有2行,65列表示CONECT记录为0,69-70列表示SEQRES项共29行。

1 2 3 4

5 6 7

345678934567890

END

数据类型

Record name

Integer

Integer

Integer

Integer

Integer

Integer

Integer

Integer

Integer

Integer

Integer

字段名称

"MASTER"

numRemark

"0"

numHet

numHelix

numSheet

numTurn

numSite

numXform

numCoord

numTer

numConect

numSeq

定义描述

REMARK记录项的行数

HET记录项的行数

HELIX记录项的行数

SHEET记录项的行数

TURN记录项的行数

SITE记录项的行数

坐标变换记录项的行数

(ORIGX+SCALE+MTRIX)

原子坐标记录项的行数(ATOM+HETATM)

TER记录项的行数

CONECT记录项的行数

SEQRES记录项的行数

11 - 15 Integer

关于蛋白质数据库 | 蛋白质数据库文件格式 | 蛋白质结

修改日期: 2008年5月3日

本文标签: 记录残基描述表示