insdseq.asn
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:6k
源码类别:

生物技术

开发平台:

C/C++

  1. --$Revision: 1000.0 $
  2. --************************************************************************
  3. --
  4. -- ASN.1 and XML for the components of a GenBank/EMBL/DDBJ sequence record
  5. -- The International Nucleotide Sequence Database (INSD) collaboration
  6. -- Version 1.3, 1 June 2004
  7. --
  8. --************************************************************************
  9. INSD-INSDSeq DEFINITIONS ::=
  10. BEGIN
  11. --  INSDSeq provides the elements of a sequence as presented in the
  12. --    GenBank/EMBL/DDBJ-style flatfile formats, with a small amount of
  13. --    additional structure.
  14. --    Although this single perspective of the three flatfile formats
  15. --    provides a useful simplification, it hides to some extent the
  16. --    details of the actual data underlying those formats. Nevertheless,
  17. --    the XML version of INSD-Seq is being provided with
  18. --    the hopes that it will prove useful to those who bulk-process
  19. --    sequence data at the flatfile-format level of detail. Further 
  20. --    documentation regarding the content and conventions of those formats 
  21. --    can be found at:
  22. --
  23. --    URLs for the DDBJ, EMBL, and GenBank Feature Table Document:
  24. --    http://www.ddbj.nig.ac.jp/FT/full_index.html
  25. --    http://www.ebi.ac.uk/embl/Documentation/FT_definitions/feature_table.html
  26. --    http://www.ncbi.nlm.nih.gov/projects/collab/FT/index.html
  27. --
  28. --    URLs for DDBJ, EMBL, and GenBank Release Notes :
  29. --    http://www.ddbj.nig.ac.jp/ddbjnew/ddbj_relnote.html
  30. --    http://www.ebi.ac.uk/embl/Documentation/Release_notes/current/relnotes.html
  31. --    ftp://ftp.ncbi.nih.gov/genbank/gbrel.txt
  32. --
  33. --    Because INSDSeq is a compromise, a number of pragmatic decisions have
  34. --    been made:
  35. --
  36. --  In pursuit of simplicity and familiarity a number of fields do not
  37. --    have full substructure defined here where there is already a
  38. --    standard flatfile format string. For example:
  39. --
  40. --   Dates:      DD-MON-YYYY (eg 10-JUN-2003)
  41. --
  42. --   Author:     LastName, Initials  (eg Smith, J.N.)
  43. --            or Lastname Initials   (eg Smith J.N.)
  44. --
  45. --   Journal:    JournalName Volume (issue), page-range (year)
  46. --            or JournalName Volume(issue):page-range(year)
  47. --            eg Appl. Environ. Microbiol. 61 (4), 1646-1648 (1995)
  48. --               Appl. Environ. Microbiol. 61(4):1646-1648(1995).
  49. --
  50. --  FeatureLocations are representated as in the flatfile feature table,
  51. --    but FeatureIntervals may also be provided as a convenience
  52. --
  53. --  FeatureQualifiers are represented as in the flatfile feature table.
  54. --
  55. --  Primary has a string that represents a table to construct
  56. --    a third party (TPA) sequence.
  57. --
  58. --  other-seqids can have strings with the "vertical bar format" sequence
  59. --    identifiers used in BLAST for example, when they are non-INSD types.
  60. --
  61. --  Currently in flatfile format you only see Accession numbers, but there 
  62. --    are others, like patents, submitter clone names, etc which will 
  63. --    appear here
  64. --
  65. --  There are also a number of elements that could have been more exactly
  66. --    specified, but in the interest of simplicity have been simply left as
  67. --    optional. For example:
  68. --
  69. --  All publicly accessible sequence records in INSDSeq format will
  70. --    include accession and accession.version. However, these elements are 
  71. --    optional in optional in INSDSeq so that this format can also be used   
  72. --    for non-public sequence data, prior to the assignment of accessions and 
  73. --    version numbers. In such cases, records will have only "other-seqids".
  74. --
  75. --  sequences will normally all have "sequence" filled in. But contig records
  76. --    will have a "join" statement in the "contig" slot, and no "sequence".
  77. --    We also may consider a retrieval option with no sequence of any kind
  78. --    and no feature table to quickly check minimal values.
  79. --
  80. --  Four (optional) elements are specific to records represented via the EMBL
  81. --    sequence database: INSDSeq_update-release, INSDSeq_create-release,
  82. --    INSDSeq_entry-version, and INSDSeq_database-reference.
  83. --
  84. --  One (optional) element is specific to records originating at the GenBank
  85. --    and DDBJ sequence databases: INSDSeq_segment.
  86. --
  87. --********
  88. INSDSeq ::= SEQUENCE {
  89. locus VisibleString ,
  90. length INTEGER ,
  91. strandedness VisibleString OPTIONAL ,
  92. moltype VisibleString ,
  93. topology VisibleString OPTIONAL ,
  94. division VisibleString ,
  95. update-date VisibleString ,
  96. create-date VisibleString ,
  97. update-release VisibleString OPTIONAL ,
  98. create-release VisibleString OPTIONAL ,
  99. definition VisibleString ,
  100. primary-accession VisibleString OPTIONAL ,
  101. entry-version VisibleString OPTIONAL ,
  102. accession-version VisibleString OPTIONAL ,
  103. other-seqids SEQUENCE OF INSDSeqid OPTIONAL ,
  104. secondary-accessions SEQUENCE OF INSDSecondary-accn OPTIONAL,
  105. keywords SEQUENCE OF INSDKeyword OPTIONAL ,
  106. segment VisibleString OPTIONAL ,
  107. source VisibleString OPTIONAL ,
  108. organism VisibleString OPTIONAL ,
  109. taxonomy VisibleString OPTIONAL ,
  110. references SEQUENCE OF INSDReference OPTIONAL ,
  111. comment VisibleString OPTIONAL ,
  112. primary VisibleString OPTIONAL ,
  113. source-db VisibleString OPTIONAL ,
  114. database-reference VisibleString OPTIONAL ,
  115. feature-table SEQUENCE OF INSDFeature OPTIONAL ,
  116. sequence VisibleString OPTIONAL ,  -- Optional for other dump forms
  117. contig VisibleString OPTIONAL }
  118. INSDSeqid ::= VisibleString
  119. INSDSecondary-accn ::= VisibleString
  120. INSDKeyword ::= VisibleString
  121. INSDReference ::= SEQUENCE {
  122. reference VisibleString ,
  123. authors SEQUENCE OF INSDAuthor OPTIONAL ,
  124. consortium VisibleString OPTIONAL ,
  125. title VisibleString OPTIONAL ,
  126. journal VisibleString ,
  127. medline INTEGER OPTIONAL ,
  128. pubmed INTEGER OPTIONAL ,
  129. remark VisibleString OPTIONAL }
  130. INSDAuthor ::= VisibleString
  131. INSDFeature ::= SEQUENCE {
  132. key VisibleString ,
  133. location VisibleString ,
  134. intervals SEQUENCE OF INSDInterval OPTIONAL ,
  135. quals SEQUENCE OF INSDQualifier OPTIONAL }
  136. INSDInterval ::= SEQUENCE {
  137. from INTEGER OPTIONAL ,
  138. to INTEGER OPTIONAL ,
  139. point INTEGER OPTIONAL ,
  140. accession VisibleString }
  141. INSDQualifier ::= SEQUENCE {
  142. name VisibleString ,
  143. value VisibleString OPTIONAL }
  144. INSDSet ::= SEQUENCE OF INSDSeq
  145. END