cpg.hpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:5k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: cpg.hpp,v $
  4.  * PRODUCTION Revision 1000.1  2004/04/12 17:47:56  gouriano
  5.  * PRODUCTION PRODUCTION: UPGRADED [CATCHUP_003] Dev-tree R1.6
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: cpg.hpp,v 1000.1 2004/04/12 17:47:56 gouriano Exp $
  10. * ===========================================================================
  11. *
  12. *                            PUBLIC DOMAIN NOTICE
  13. *               National Center for Biotechnology Information
  14. *
  15. *  This software/database is a "United States Government Work" under the
  16. *  terms of the United States Copyright Act.  It was written as part of
  17. *  the author's official duties as a United States Government employee and
  18. *  thus cannot be copyrighted.  This software/database is freely available
  19. *  to the public for use. The National Library of Medicine and the U.S.
  20. *  Government have not placed any restriction on its use or reproduction.
  21. *
  22. *  Although all reasonable efforts have been taken to ensure the accuracy
  23. *  and reliability of the software and data, the NLM and the U.S.
  24. *  Government do not and cannot warrant the performance or results that
  25. *  may be obtained by using this software or data. The NLM and the U.S.
  26. *  Government disclaim all warranties, express or implied, including
  27. *  warranties of performance, merchantability or fitness for any particular
  28. *  purpose.
  29. *
  30. *  Please cite the author in any work or product based on this material.
  31. *
  32. * ===========================================================================
  33. *
  34. * Author: Philip Johnson
  35. *
  36. * File Description: header file for c++ cpg-finding functions
  37. *
  38. * ===========================================================================*/
  39. #ifndef ALGO_SEQUENCE___CPG__HPP
  40. #define ALGO_SEQUENCE___CPG__HPP
  41. #include <corelib/ncbistd.hpp>
  42. #include <list>
  43. BEGIN_NCBI_SCOPE
  44. /*---------------------------------------------------------------------------*/
  45. struct NCBI_XALGOSEQ_EXPORT SCpGIsland {
  46.     TSeqPos m_Start;
  47.     TSeqPos m_Stop;
  48.     unsigned int m_CG;
  49.     unsigned int m_A;
  50.     unsigned int m_C;
  51.     unsigned int m_G;
  52.     unsigned int m_T;
  53.     unsigned int m_N;
  54. };
  55. /*---------------------------------------------------------------------------*/
  56. class NCBI_XALGOSEQ_EXPORT CCpGIslands
  57. {
  58. public:
  59.     typedef list<SCpGIsland> TIsles;
  60.     CCpGIslands(const char* seq, TSeqPos seqLength, int window = 200,
  61.                 int minLen = 200, double GC = 0.5, double CpG = 0.6);
  62.     void Calc(int windowSize, int minLen, double GC, double CpG);
  63.     void MergeIslesWithin(unsigned int range);
  64.     const TIsles& GetIsles(void) const;
  65.         
  66. private:
  67.     TIsles m_Isles;
  68.     const char* m_Seq;
  69.     TSeqPos m_SeqLength;
  70.     unsigned int m_WindowSize;
  71.     unsigned int m_MinIsleLen;
  72.     unsigned int m_GC;
  73.     unsigned int m_CpG;
  74.     //prohibit copy constructor and assignment operator
  75.     CCpGIslands(const CCpGIslands&);
  76.     CCpGIslands& operator=(const CCpGIslands&);
  77.     bool x_IsIsland(const SCpGIsland &isle) const;
  78.     void x_AddPosition(TSeqPos i, SCpGIsland &isle);
  79.     void x_RemovePosition(TSeqPos i, SCpGIsland &isle);
  80.     void x_CalcWindowStats(SCpGIsland &isle);
  81.     bool x_SlideToHit(SCpGIsland &isle);
  82.     bool x_ExtendHit(SCpGIsland &isle);
  83. };
  84. ///////////////////////////////////////////////////////////////////////////////
  85. // PRE : none
  86. // POST: list of islands
  87. inline
  88. const CCpGIslands::TIsles& CCpGIslands::GetIsles(void) const
  89. {
  90.     return m_Isles;
  91. }
  92. ///////////////////////////////////////////////////////////////////////////////
  93. // PRE : island structure filled
  94. // POST: whether or not we consider this to be a CpG island
  95. inline
  96. bool CCpGIslands::x_IsIsland(const SCpGIsland &isle) const
  97. {
  98.     TSeqPos len = isle.m_Stop - isle.m_Start + 1;
  99.     return ((100 * (isle.m_C + isle.m_G) > m_GC * len)  &&
  100.             ((100 * isle.m_CG * len) > (m_CpG * isle.m_C * isle.m_G)));
  101. }
  102. END_NCBI_SCOPE
  103. #endif /*ALGO_SEQUENCE___CPG__HPP*/
  104. /*===========================================================================
  105. * $Log: cpg.hpp,v $
  106. * Revision 1000.1  2004/04/12 17:47:56  gouriano
  107. * PRODUCTION: UPGRADED [CATCHUP_003] Dev-tree R1.6
  108. *
  109. * Revision 1.6  2003/12/12 20:19:20  ivanov
  110. * Rollback to 1.4
  111. *
  112. * Revision 1.5  2003/12/12 20:15:55  ivanov
  113. * Added unimplemented SCpGIsland:: operators < and == to avoid compilation
  114. * on MSVC 7
  115. *
  116. * Revision 1.4  2003/12/12 20:05:18  johnson
  117. * refactoring to accommodate MSVC 7
  118. *
  119. * Revision 1.3  2003/08/04 15:43:20  dicuccio
  120. * Modified export specifiers to be more flexible
  121. *
  122. * Revision 1.2  2003/06/17 19:44:13  dicuccio
  123. * Minor code reformatting.  Added export specifiers
  124. *
  125. * Revision 1.1  2003/06/17 15:32:27  johnson
  126. * initial revision
  127. *
  128. * ===========================================================================
  129. */