mmdb2.asn
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:14k
源码类别:

生物技术

开发平台:

C/C++

  1. --
  2. -- ===========================================================================
  3. -- PRODUCTION $Log: mmdb2.asn,v $
  4. -- PRODUCTION Revision 1000.0  2003/10/29 21:21:50  gouriano
  5. -- PRODUCTION PRODUCTION: IMPORTED [ORIGINAL] Dev-tree R6.0
  6. -- PRODUCTION
  7. -- ===========================================================================
  8. --
  9. --$Revision: 1000.0 $
  10. --**********************************************************************
  11. --
  12. --  Biological Macromolecule 3-D Structure Data Types for MMDB,
  13. --                A Molecular Modeling Database
  14. --
  15. --  Definitions for structural models
  16. --
  17. --  By Hitomi Ohkawa, Jim Ostell, Chris Hogue and Steve Bryant 
  18. --
  19. --  National Center for Biotechnology Information
  20. --  National Institutes of Health
  21. --  Bethesda, MD 20894 USA
  22. --
  23. --  July, 1996
  24. --
  25. --**********************************************************************
  26. MMDB-Structural-model DEFINITIONS ::=
  27. BEGIN
  28. EXPORTS Biostruc-model, Model-id, Model-coordinate-set-id;
  29. IMPORTS Chem-graph-pntrs, Atom-pntrs, Chem-graph-alignment,
  30. Sphere, Cone, Cylinder, Brick, Transform FROM MMDB-Features
  31. Biostruc-id FROM MMDB
  32. Pub FROM NCBI-Pub;
  33. -- A structural model maps chemical components into a measured three-
  34. -- dimensional space. PDB-derived biostrucs generally contain 4 models, 
  35. -- corresponding to "views" of the structure of a biomolecular assemble with 
  36. -- increasing levels of complexity.  Model types indicate the complexity of the
  37. -- view.  
  38. -- The model named "NCBI all atom" represents a view suitable for most 
  39. -- computational biology applications.  It provides complete atomic coordinate 
  40. -- data for a "single best" model, omitting statistical disorder information 
  41. -- and/or ensemble structure descriptions provided in the source PDB file.  
  42. -- Construction of the single best model is based on the assumption that the 
  43. -- contents of the "alternate conformation" field from pdb imply no correlation
  44. -- among the occupancies of multiple sites assigned to sets of atoms: the best 
  45. -- site is chosen only on the basis of highest occupancy. Note, however, that 
  46. -- alternate conformation sets where correlation is implied are generally 
  47. -- constrained in crystallographic refinement to have uniform occupancy, and 
  48. -- will thus be selected as a set. For ensemble models the model which assigns 
  49. -- coordinates to the most atoms is chosen.  If numbers of coordinates are the 
  50. -- same, the model occurring first in the PDB file is selected.  The single 
  51. -- best model includes complete coordinates for all nonpolymer components, but 
  52. -- omits those classified as "solvent".  Model type is 3 for this model. 
  53. -- The model named "NCBI backbone" represents a simple view intended for 
  54. -- graphic displays and rapid transmission over a network.  It includes only 
  55. -- alpha carbon or backbone phosphate coordinates for biopolymers. It is based 
  56. -- on selection of alpha-carbon and backbone phosphate atoms from the "NCBI
  57. -- all atom" model. The model type is set to 2.  An even simpler model gives 
  58. -- only a cartoon representation, using cylinders corresponding to secondary 
  59. -- structure elements.  This is named "NCBI vector", and has model type 1.
  60. -- The models named "PDB Model 1", "PDB Model 2", etc. represent the complete
  61. -- information provided by PDB, including full descriptions of statistical
  62. -- disorder.  The name of the model is based on the contents of the PDB MODEL
  63. -- record, with a default name of "PDB Model 1" for PDB files which contain 
  64. -- only a single model.  Construction of these models is based on the 
  65. -- assumption that contents of the PDB "alternate conformation" field are 
  66. -- intended to imply correlation among the occupancies of atom sets flagged by
  67. -- the same identifier.  The special flag " " (blank) is assumed to indicate 
  68. -- sites occupied in all alternate conformations, and sites flagged otherwise,
  69. -- together with " ", to indicate a distinct member of an ensemble of 
  70. -- alternate conformations.  Note that construction of ensemble members 
  71. -- according to these assumption requires two validation checks on PDB 
  72. -- "alternate conformation" flags: they must be unique among sites assigned to 
  73. -- the same atom, and that the special " " flag must occur only for unique
  74. -- sites.  Sites which violate the first check are flagged as "u", for 
  75. -- "unknown"; they are omitted from all ensemble definitions but are 
  76. -- nontheless retained in the coordinate list.  Sites which violate the second
  77. -- check are flagged "b" for "blank", and are included in an appropriately
  78. -- named ensemble.  The model type for pdb all models is 4.
  79. -- Note that in the MMDB database models are stored in the ASN.1 stream in
  80. -- order of increasing model type value.  Since models occur as the last item
  81. -- in a biostruc, parsers may avoid reading the entire stream if the desired
  82. -- model is one of the simplified types, which occur first in the stream. This
  83. -- can save considerable I/O time, particularly for large ensemble models from 
  84. -- NMR determinations.
  85. Biostruc-model ::= SEQUENCE {
  86. id Model-id,
  87. type Model-type,
  88. descr SEQUENCE OF Model-descr OPTIONAL,
  89. model-space Model-space OPTIONAL,
  90. model-coordinates SEQUENCE OF Model-coordinate-set OPTIONAL }
  91. Model-id ::= INTEGER
  92. Model-type ::= INTEGER {
  93. ncbi-vector(1),
  94. ncbi-backbone(2),
  95. ncbi-all-atom(3),
  96. pdb-model(4),
  97. other(255)}
  98. Model-descr ::= CHOICE {
  99. name VisibleString,
  100. pdb-reso                VisibleString,
  101. pdb-method              VisibleString,
  102. pdb-comment VisibleString,
  103. other-comment VisibleString,
  104. attribution Pub }
  105. -- The model space defines measurement units and any external reference frame.
  106. -- Coordinates refer to a right-handed orthogonal system defined on axes 
  107. -- tagged x, y and z in the coordinate and feature definitions of a biostruc.
  108. -- Coordinates from PDB-derived structures are reported without change, in
  109. -- angstrom units.  The units of temperature and occupancy factors are not
  110. -- defined explicitly in PDB, but are inferred from their value range.
  111. Model-space ::= SEQUENCE {
  112. coordinate-units ENUMERATED {
  113. angstroms(1),
  114. nanometers(2),
  115. other(3),
  116. unknown(255)},
  117. thermal-factor-units ENUMERATED {
  118. b(1),
  119. u(2),
  120. other(3),
  121. unknown(255)} OPTIONAL,
  122. occupancy-factor-units ENUMERATED {
  123. fractional(1),
  124. electrons(2),
  125. other(3),
  126. unknown(255)} OPTIONAL,
  127. density-units ENUMERATED {
  128. electrons-per-unit-volume(1),
  129. arbitrary-scale(2),
  130. other(3),
  131. unknown(255)} OPTIONAL,
  132. reference-frame Reference-frame OPTIONAL }
  133. -- An external reference frame is a pointer to another biostruc, with an 
  134. -- optional operator to rotate and translate coordinates into its model space.
  135. -- This item is intended for representation of homology-derived model 
  136. -- structures, and is not present for structures from PDB.
  137. Reference-frame ::= SEQUENCE {
  138. biostruc-id Biostruc-id,
  139. rotation-translation Transform OPTIONAL }
  140. -- Atomic coordinates may be assigned literally or by reference to another
  141. -- biostruc.  The reference coordinate type is used to represent homology-
  142. -- derived model structures.  PDB-derived structures have literal coordinates.
  143. -- Referenced coordinates identify another biostruc, any transformation to be 
  144. -- applied to coordinates from that biostruc, and a mapping of the chemical
  145. -- graph of the present biostruc onto that of the referenced biostruc.  They
  146. -- give an "alignment" of atoms in the current biostruc with those in another,
  147. -- from which the coordinates of matched atoms may be retrieved.  For non-
  148. -- atomic models "alignment" may also be represented by molecule and residue
  149. -- equivalence lists.  Referenced coordinates are a data item inteded for 
  150. -- representation of homology models, with an explicit pointer to their source
  151. -- information. They do not occur in PDB-derived models.
  152. Model-coordinate-set ::= SEQUENCE {
  153. id Model-coordinate-set-id OPTIONAL,
  154. descr SEQUENCE OF Model-descr OPTIONAL,
  155. coordinates CHOICE {
  156. literal Coordinates,
  157. reference Chem-graph-alignment } }
  158. Model-coordinate-set-id ::= INTEGER
  159. -- Literal coordinates map chemical components into the model space.  Three 
  160. -- mapping types are allowed, atomic coordinate models, density-grid models,
  161. -- and surface models. A model consists of a sequence of such coordinate sets, 
  162. -- and may thus combine coordinate subsets which have a different source.  
  163. -- PDB-derived models contain a single atomic coordinate set, as they by
  164. -- definition represent information from a single source.
  165. Coordinates ::= CHOICE {
  166. atomic Atomic-coordinates,
  167. surface Surface-coordinates,
  168. density Density-coordinates }
  169. -- Literal atomic coordinate values give location, occupancy and order
  170. -- parameters, and a pointer to a specific atom defined in the biostruc graph.
  171. -- Temperature and occupancy factors have their conventional crystallographic
  172. -- definitions, with units defined in the model space declaration.  Atoms,
  173. -- sites, temperature-factors, occupancies and alternate-conformation-ids
  174. -- are parallel arrays, i.e. the have the same number of values as given by
  175. -- number-of-points. Conformation ensembles represent distinct correlated-
  176. -- disorder subsets of the coordinates.  They will be present only for certain 
  177. -- "views" of PDB structures, as described above. Their derivation from PDB-
  178. -- supplied "alternate-conformation" ids is described below. 
  179. Atomic-coordinates ::= SEQUENCE {
  180. number-of-points INTEGER,
  181. atoms Atom-pntrs,
  182. sites Model-space-points,
  183. temperature-factors Atomic-temperature-factors OPTIONAL,
  184. occupancies Atomic-occupancies OPTIONAL, 
  185. alternate-conf-ids Alternate-conformation-ids OPTIONAL,
  186. conf-ensembles SEQUENCE OF Conformation-ensemble OPTIONAL }
  187. -- The atoms whose location is described by each coordinate are identified
  188. -- via a hierarchical pointer to the chemical graph of the biomolecular
  189. -- assembly.  Coordinates may be matched with atoms in the chemical structure
  190. -- by the values of the molecule, residue and atom id's given here,  which 
  191. -- match exactly the items of the same type defined in Biostruc-graph.
  192. -- Coordinates are given as integer values, with a scale factor to convert 
  193. -- to real values for each x, y or z, in the units indicated in model-space.
  194. -- Integer values must be divided by the the scale factor.  This use of integer
  195. -- values reduces the ASN.1 stream size. The scale factors for temperature 
  196. -- factors and occupancies are given separately, but must be used in the same 
  197. -- fashion to produce properly scaled real values.
  198. Model-space-points ::= SEQUENCE {
  199. scale-factor INTEGER,
  200. x SEQUENCE OF INTEGER,
  201. y SEQUENCE OF INTEGER,
  202. z SEQUENCE OF INTEGER } 
  203. Atomic-temperature-factors ::= CHOICE {
  204. isotropic Isotropic-temperature-factors,
  205. anisotropic Anisotropic-temperature-factors }
  206. Isotropic-temperature-factors ::= SEQUENCE {
  207. scale-factor INTEGER,
  208. b SEQUENCE OF INTEGER }
  209. Anisotropic-temperature-factors ::= SEQUENCE {
  210. scale-factor INTEGER,
  211. b-11 SEQUENCE OF INTEGER,
  212. b-12 SEQUENCE OF INTEGER,
  213. b-13 SEQUENCE OF INTEGER,
  214. b-22 SEQUENCE OF INTEGER,
  215. b-23 SEQUENCE OF INTEGER,
  216. b-33 SEQUENCE OF INTEGER }
  217. Atomic-occupancies ::= SEQUENCE {
  218. scale-factor INTEGER,
  219. o SEQUENCE OF INTEGER }
  220. -- An alternate conformation id is optionally associated with each coordinate. 
  221. -- Aside from corrections due to the validation checks described above, the 
  222. -- contents of MMDB Alternate-conformation-ids are identical to the PDB 
  223. -- "alternate conformation" field.
  224. Alternate-conformation-ids ::= SEQUENCE OF Alternate-conformation-id 
  225. Alternate-conformation-id ::= VisibleString 
  226. -- Correlated disorder ensemble is defined by a set of alternate conformation 
  227. -- id's which identify coordinates relevant to that ensemble. These are 
  228. -- defined from the validated and corrected contents of the PDB "alternate
  229. -- conformation" field as described above.  A given ensemble, for example, may
  230. -- consist of atom sites flagged by " " and "A" Alternate-conformation-ids. 
  231. -- Names for ensembles are constructed from these flags. This example would be
  232. -- named, in its description, "PDB Ensemble blank plus A".
  233. -- Note that this interpretation is consistent with common PDB usage of the 
  234. -- "alternate conformation" field, but that PDB specifications do not formally
  235. -- distinguish between correlated and uncorrelated disorder in crystallographic
  236. -- models. Ensembles identified in MMDB thus may not correspond to the meaning
  237. -- intended by PDB or the depositor.  No information is lost, however, and
  238. -- if the intended meaning is known alternative ensemble descriptions may be
  239. -- reconstructed directly from the Alternate-conformation-ids.
  240. -- Note that correlated disorder as defined here is allowed within an atomic 
  241. -- coordinate set but not between the multiple sets which may define a model. 
  242. -- Multiple sets within the same model are intended as a means to represent 
  243. -- assemblies modeled from different experimentally determined structures,
  244. -- where correlated disorder between coordinate sets is not relevant.
  245. Conformation-ensemble ::= SEQUENCE {
  246. name VisibleString,
  247. alt-conf-ids SEQUENCE OF Alternate-conformation-id }
  248. -- Literal surface coordinates define the chemical components whose structure
  249. -- is described by a surface, and the surface itself.  The surface may be
  250. -- either a regular geometric solid or a triangle-mesh of arbitrary shape.
  251. Surface-coordinates ::= SEQUENCE {
  252. contents Chem-graph-pntrs,
  253. surface CHOICE { sphere Sphere,
  254. cone Cone,
  255. cylinder Cylinder,
  256. brick Brick,
  257. tmesh T-mesh,
  258. triangles Triangles } }
  259. T-mesh ::= SEQUENCE {
  260. number-of-points INTEGER,
  261. scale-factor INTEGER,
  262. swap SEQUENCE OF BOOLEAN,
  263. x SEQUENCE OF INTEGER,
  264. y SEQUENCE OF INTEGER,
  265. z         SEQUENCE OF INTEGER }
  266. Triangles ::= SEQUENCE {
  267. number-of-points INTEGER,
  268. scale-factor INTEGER,
  269. x SEQUENCE OF INTEGER,
  270. y SEQUENCE OF INTEGER,
  271. z SEQUENCE OF INTEGER,
  272. number-of-triangles     INTEGER,
  273. v1 SEQUENCE OF INTEGER, 
  274. v2 SEQUENCE OF INTEGER,
  275. v3 SEQUENCE OF INTEGER }
  276. -- Literal density coordinates define the chemical components whose structure
  277. -- is described by a density grid, parameters of this grid, and density values.
  278. Density-coordinates ::= SEQUENCE {
  279. contents Chem-graph-pntrs,
  280. grid-corners Brick,
  281. grid-steps-x INTEGER,
  282. grid-steps-y INTEGER,
  283. grid-steps-z INTEGER,
  284. fastest-varying ENUMERATED {
  285. x(1),
  286. y(2),
  287. z(3)},
  288. slowest-varying ENUMERATED {
  289. x(1),
  290. y(2),
  291. z(3)},
  292. scale-factor INTEGER,
  293. density SEQUENCE OF INTEGER }
  294. END