regexp_loc.cpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:3k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: regexp_loc.cpp,v $
  4.  * PRODUCTION Revision 1000.1  2004/06/01 18:10:48  gouriano
  5.  * PRODUCTION PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.2
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: regexp_loc.cpp,v 1000.1 2004/06/01 18:10:48 gouriano Exp $
  10. * ===========================================================================
  11. *
  12. *                            PUBLIC DOMAIN NOTICE
  13. *               National Center for Biotechnology Information
  14. *
  15. *  This software/database is a "United States Government Work" under the
  16. *  terms of the United States Copyright Act.  It was written as part of
  17. *  the author's official duties as a United States Government employee and
  18. *  thus cannot be copyrighted.  This software/database is freely available
  19. *  to the public for use. The National Library of Medicine and the U.S.
  20. *  Government have not placed any restriction on its use or reproduction.
  21. *
  22. *  Although all reasonable efforts have been taken to ensure the accuracy
  23. *  and reliability of the software and data, the NLM and the U.S.
  24. *  Government do not and cannot warrant the performance or results that
  25. *  may be obtained by using this software or data. The NLM and the U.S.
  26. *  Government disclaim all warranties, express or implied, including
  27. *  warranties of performance, merchantability or fitness for any particular
  28. *  purpose.
  29. *
  30. *  Please cite the author in any work or product based on this material.
  31. *
  32. * ===========================================================================
  33. *
  34. * Author: Clifford Clausen
  35. *
  36. * File Description: Functions for creating CSeq_locs from CRegexps
  37. *
  38. * ===========================================================================*/
  39. #include <ncbi_pch.hpp>
  40. #include <algo/sequence/regexp_loc.hpp>
  41. BEGIN_NCBI_SCOPE
  42. USING_SCOPE(objects);
  43. CRegexp_loc::CRegexp_loc (const string &pat, CRegexp::TCompile flags)
  44.     : m_regexp(new CRegexp(pat, flags))
  45. {
  46. }
  47. CRegexp_loc::~CRegexp_loc()
  48. {
  49. }
  50. void CRegexp_loc::Set(const string &pat, CRegexp::TCompile flags)
  51. {
  52.     m_regexp->Set(pat, flags);
  53. }
  54. TSeqPos CRegexp_loc::GetLoc
  55. (const char *seq,
  56.  CSeq_loc *loc,
  57.  TSeqPos offset,
  58.  CRegexp::TMatch flags)
  59. {
  60.     // Reset loc to type CPacked_seqint
  61.     CSeq_loc::TPacked_int &packed = loc->SetPacked_int();
  62.     // Get list of CSeq_interval
  63.     CPacked_seqint::Tdata &lst = packed.Set();
  64.     lst.clear();
  65.     // Match the regular expression to the sequence
  66.     m_regexp->GetMatch(seq, offset, 0, flags, true);
  67.     // Create a CSeq_interval for whole pattern match
  68.     // and each sub-pattern match and push into list
  69.     for (int i = 0; i < m_regexp->NumFound(); i++) {
  70.         CRef<CSeq_interval> si(new CSeq_interval);
  71.         si->SetFrom(m_regexp->GetResults(i)[0]);
  72.         si->SetTo(m_regexp->GetResults(i)[1] - 1);
  73.         lst.push_back(si);
  74.     }
  75.     if (m_regexp->NumFound() > 0) {
  76.         return m_regexp->GetResults(0)[0];
  77.     } else {
  78.         return kMax_ULong;
  79.     }
  80. }
  81. END_NCBI_SCOPE
  82. /*===========================================================================
  83. * $Log: regexp_loc.cpp,v $
  84. * Revision 1000.1  2004/06/01 18:10:48  gouriano
  85. * PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.2
  86. *
  87. * Revision 1.2  2004/05/21 21:41:04  gorelenk
  88. * Added PCH ncbi_pch.hpp
  89. *
  90. * Revision 1.1  2003/07/16 19:18:53  clausen
  91. * Initial version
  92. *
  93. *
  94. *============================================================================
  95. */