



  /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: structure_set.hpp,v $
  4.  * PRODUCTION Revision 1000.2  2004/06/01 18:29:31  gouriano
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: structure_set.hpp,v 1000.2 2004/06/01 18:29:31 gouriano Exp $
  10. * ===========================================================================
  11. *
  12. *                            PUBLIC DOMAIN NOTICE
  13. *               National Center for Biotechnology Information
  14. *
  15. *  This software/database is a "United States Government Work" under the
  16. *  terms of the United States Copyright Act.  It was written as part of
  17. *  the author's official duties as a United States Government employee and
  18. *  thus cannot be copyrighted.  This software/database is freely available
  19. *  to the public for use. The National Library of Medicine and the U.S.
  20. *  Government have not placed any restriction on its use or reproduction.
  21. *
  22. *  Although all reasonable efforts have been taken to ensure the accuracy
  23. *  and reliability of the software and data, the NLM and the U.S.
  24. *  Government do not and cannot warrant the performance or results that
  25. *  may be obtained by using this software or data. The NLM and the U.S.
  26. *  Government disclaim all warranties, express or implied, including
  27. *  warranties of performance, merchantability or fitness for any particular
  28. *  purpose.
  29. *
  30. *  Please cite the author in any work or product based on this material.
  31. *
  32. * ===========================================================================
  33. *
  * Authors:  Paul Thiessen
  35. *
  * File Description:
  *      Classes to hold sets of structure data
  38. *
  39. * ===========================================================================
  */
  41. #ifndef CN3D_STRUCTURESET__HPP
  42. #define CN3D_STRUCTURESET__HPP
  43. #include <corelib/ncbistd.hpp>
  44. #include <corelib/ncbistl.hpp>
  45. #include <objects/ncbimime/Ncbi_mime_asn1.hpp>
  46. #include <objects/cdd/Cdd.hpp>
  47. #include <objects/mmdb1/Biostruc.hpp>
  48. #include <objects/mmdb1/Biostruc_annot_set.hpp>
  49. #include <objects/mmdb3/Biostruc_feature.hpp>
  50. #include <objects/cdd/Align_annot_set.hpp>
  51. #include <objects/seq/Bioseq.hpp>
  52. #include <objects/cdd/Reject_id.hpp>
  53. #include <string>
  54. #include <map>
  55. #include <vector>
  56. #include <list>
  57. #include <objseq.h>
  58. #include <objloc.h>
  59. #include "structure_base.hpp"
  60. #include "vector_math.hpp"
  62. // StructureSet is the top-level container. It holds a set of SturctureObjects;
  63. // A SturctureObject is basically the contents of one PDB entry.
  64. class StructureObject;
  65. class OpenGLRenderer;
  66. class ShowHideManager;
  67. class StyleManager;
  68. class Residue;
  69. class SequenceSet;
  70. class AlignmentSet;
  71. class AlignmentManager;
  72. class SequenceViewer;
  73. class Messenger;
  74. class Colors;
  75. class Molecule;
  76. class BlockMultipleAlignment;
  77. class Sequence;
  78. class SequenceSet;
  79. class ChemicalGraph;
  80. class CoordSet;
  81. class ASNDataManager;
  82. class StructureSet : public StructureBase
  83. {
  84. public:
  85.     StructureSet(ncbi::objects::CNcbi_mime_asn1 *mime, int structureLimit, OpenGLRenderer *r);
  86.     StructureSet(ncbi::objects::CCdd *cdd, int structureLimit, OpenGLRenderer *r);
  87.     ~StructureSet(void);
  88.     // public data
  89.     bool isAlphaOnly;   // assume if one Object is alpha-only, then they all are
  90.     int nDomains;       // total number of domains over all objects
  91.     bool hasUserStyle;  // whether there's a global style in the original data
  92.     typedef std::list < const StructureObject * > ObjectList;
  93.     ObjectList objects;
  94.     // sequence and alignment information
  95.     const SequenceSet *sequenceSet;
  96.     const AlignmentSet *alignmentSet;
  97.     AlignmentManager *alignmentManager;
  98.     OpenGLRenderer *renderer;
  99.     ShowHideManager *showHideManager;
  100.     StyleManager *styleManager;
  101.     Vector center; // center of structure (relative to Master's coordinates)
  102.     double maxDistFromCenter; // max distance of any atom from center
  103.     Vector rotationCenter; // center of rotation (relative to Master's coordinates)
  104.     // for assigning display lists and frames
  105.     unsigned int lastDisplayList;
  106.     typedef std::list < unsigned int > DisplayLists;
  107.     typedef std::vector < DisplayLists > FrameMap;
  108.     FrameMap frameMap;
  109.     // to map display list -> slave transform
  110.     typedef std::map < unsigned int, const Matrix * const * > TransformMap;
  111.     TransformMap transformMap;
  112.     // for ensuring unique structure<->structure alignments for repeated structures
  113.     std::map < int, bool > usedFeatures;
  114.     // public methods
  115.     bool IsMultiStructure(void) const;
  116.     // set screen and rotation center of model (coordinate relative to Master);
  117.     // if NULL, will calculate average geometric center
  118.     void SetCenter(const Vector *setTo = NULL);
  119.     // center rotation and view on aligned residues only
  120.     void CenterViewOnAlignedResidues(void);
  121.     bool Draw(const AtomSet *atomSet) const;
  122.     // keep a list of names to look atoms from GL selection
  123.     unsigned int CreateName(const Residue *residue, int atomID);
  124.     bool GetAtomFromName(unsigned int name, const Residue **residue, int *atomID) const;
  125.     // called when an atom is selected in the GL window. If setCenter == true, then
  126.     // the atom's location is used as the global rotation center
  127.     void SelectedAtom(unsigned int name, bool setCenter);
  128.     // select either biopolymer residues only or all residues/molecules within cutoff distance
  129.     // of currently selected residues
  130.     void SelectByDistance(double cutoff, bool biopolymersOnly, bool otherMoleculesOnly) const;
  131.     // updates sequences in the asn, to remove any sequences
  132.     // that are not used by the current alignmentSet or updates
  133.     void RemoveUnusedSequences(void);
  134.     // put in new AlignmentSet - e.g. when alignment has been edited
  135.     void ReplaceAlignmentSet(AlignmentSet *newAlignmentSet);
  136.     // replace the ASN update list with the current updates
  137.     void ReplaceUpdates(ncbi::objects::CCdd::TPending& newUpdates);
  138.     // bit flags to tell whether various parts of the data have been changed
  139.     static const unsigned int
  140.         ePSSMData,                  // PSSM values have changed
  141.         eRowOrderData,              // row order has changed
  142.         eAnyAlignmentData,          // any change to alignment (including edits that don't change prev two)
  143.         eStructureAlignmentData,
  144.         eSequenceData,
  145.         eUpdateData,
  146.         eStyleData,
  147.         eUserAnnotationData,
  148.         eCDDData,
  149.         eOtherData;
  150.     bool HasDataChanged(void) const;
  151.     void SetDataChanged(unsigned int what) const;
  152.     // CDD-specific data accessors
  153.     bool IsCDD(void) const;
  154.     bool IsCDDInMime(void) const;
  155.     const std::string& GetCDDName(void) const;
  156.     bool SetCDDName(const std::string& name);
  157.     const std::string& GetCDDDescription(void) const;
  158.     bool SetCDDDescription(const std::string& descr);
  159.     typedef std::vector < std::string > TextLines;
  160.     bool GetCDDNotes(TextLines *lines) const;
  161.     bool SetCDDNotes(const TextLines& lines);
  162.     ncbi::objects::CCdd_descr_set * GetCDDDescrSet(void);
  163.     ncbi::objects::CAlign_annot_set * GetCDDAnnotSet(void);
  164.     // convert underlying data from mime to cdd
  165.     bool ConvertMimeDataToCDD(const std::string& cddName);
  166.     // writes data to a file; returns true on success
  167.     bool SaveASNData(const char *filename, bool doBinary, unsigned int *changeFlags);
  168.     // adds a new Sequence to the SequenceSet
  169.     const Sequence * CreateNewSequence(ncbi::objects::CBioseq& bioseq);
  170.     // reject sequence (from CDD)
  171.     void RejectAndPurgeSequence(const Sequence *reject, std::string reason, bool purge);
  172.     typedef std::list < ncbi::CRef < ncbi::objects::CReject_id > > RejectList;
  173.     const RejectList * GetRejects(void) const;
  174.     void ShowRejects(void) const;
  175.     // creates Bioseq from Sequence; registed with SeqMgr and stored in BioseqMap
  176.     Bioseq * GetOrCreateBioseq(const Sequence *sequence);
  177.     void CreateAllBioseqs(const BlockMultipleAlignment *multiple);
  178.     // adds a new Biostruc to the asn data, if appropriate
  179.     bool AddBiostrucToASN(ncbi::objects::CBiostruc *biostruc);
  180.     // for manipulating structure alignment features
  181.     void InitStructureAlignments(int masterMMDBID);
  182.     void AddStructureAlignment(ncbi::objects::CBiostruc_feature *feature,
  183.         int masterDomainID, int slaveDomainID);
  184.     void RemoveStructureAlignments(void);
  185. private:
  186.     ASNDataManager *dataManager;
  187.     // data preparation methods
  188.     void Load(int structureLimit);
  189.     void LoadSequencesForSingleStructure(void);             // for single structures
  190.     void LoadAlignmentsAndStructures(int structureLimit);   // for alignments
  191.     std::map < const ncbi::objects::CBiostruc * , bool > usedStructures;
  192.     bool MatchSequenceToMoleculeInObject(const Sequence *seq,
  193.         const StructureObject *obj, const Sequence **seqHandle = NULL);
  194.     bool LoadMaster(int masterMMDBID);
  195.     void VerifyFrameMap(void) const;
  196.     // to keep track of gl "name" -> atom correspondence (for structure picking)
  197.     typedef std::pair < const Residue*, int > NamePair;
  198.     typedef std::map < unsigned int, NamePair > NameMap;
  199.     NameMap nameMap;
  200.     unsigned int lastAtomName;
  201.     // holds C Bioseqs associated with Sequences
  202.     typedef std::map < const Sequence *, Bioseq * > BioseqMap;
  203.     BioseqMap bioseqs;
  204.     // for printing out distances between successively picked atoms
  205.     Vector prevPickedAtomCoord;
  206.     bool havePrevPickedAtomCoord;
  207. };
  208. class StructureObject : public StructureBase
  209. {
  210. private:
  211.     const bool isMaster;
  212. public:
  213.     // biostruc must not be "raw" mmdb data - will get confused by presence of different models
  214.     StructureObject(StructureBase *parent, const ncbi::objects::CBiostruc& biostruc, bool isMaster);
  215.     ~StructureObject(void) { if (transformToMaster) delete transformToMaster; }
  216.     // public data
  217.     static const int NO_MMDB_ID;
  218.     int id, mmdbID;
  219.     std::string pdbID;
  220.     Matrix *transformToMaster;
  221.     // an object has one ChemicalGraph that can be applied to one or more
  222.     // CoordSets to generate the object's model(s)
  223.     const ChemicalGraph *graph;
  224.     typedef std::list < const CoordSet * > CoordSetList;
  225.     CoordSetList coordSets;
  226.     // min and max atomic temperatures
  227.     static const double NO_TEMPERATURE;
  228.     double minTemperature, maxTemperature;
  229.     // map of internal domainID -> Molecule and MMDB-assigned id
  230.     typedef std::map < int, const Molecule * > DomainMap;
  231.     DomainMap domainMap;
  232.     typedef std::map < int, int > DomainIDMap;
  233.     DomainIDMap domainID2MMDB;
  234.     // public methods
  235.     typedef std::map < const Residue *, const Molecule * > ResidueMap;
  236.     void SelectByDistance(double cutoff, bool biopolymersOnly, bool otherMoleculesOnly,
  237.         ResidueMap *selectedResidues) const;
  238.     // set transform based on asn1 data
  239.     bool SetTransformToMaster(const ncbi::objects::CBiostruc_annot_set& annot, int masterMMDBID);
  240.     // set transform based on rigid body fit of given coordinates
  241.     void RealignStructure(int nCoords,
  242.         const Vector * const *masterCoords, const Vector * const *slaveCoords,
  243.         const double *weights, int slaveRow);
  244.     bool IsMaster(void) const { return isMaster; }
  245.     bool IsSlave(void) const { return !isMaster; }
  246.     int NDomains(void) const { return domainMap.size(); }
  247. };
  248. END_SCOPE(Cn3D)
  249. #endif // CN3D_STRUCTURESET__HPP
