find_pattern.hpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:4k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: find_pattern.hpp,v $
  4.  * PRODUCTION Revision 1000.0  2004/04/12 17:53:48  gouriano
  5.  * PRODUCTION PRODUCTION: IMPORTED [CATCHUP_003] Dev-tree R1.11
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: find_pattern.hpp,v 1000.0 2004/04/12 17:53:48 gouriano Exp $
  10.  * ===========================================================================
  11.  *
  12.  *                            PUBLIC DOMAIN NOTICE
  13.  *               National Center for Biotechnology Information
  14.  *
  15.  *  This software/database is a "United States Government Work" under the
  16.  *  terms of the United States Copyright Act.  It was written as part of
  17.  *  the author's official duties as a United States Government employee and
  18.  *  thus cannot be copyrighted.  This software/database is freely available
  19.  *  to the public for use. The National Library of Medicine and the U.S.
  20.  *  Government have not placed any restriction on its use or reproduction.
  21.  *
  22.  *  Although all reasonable efforts have been taken to ensure the accuracy
  23.  *  and reliability of the software and data, the NLM and the U.S.
  24.  *  Government do not and cannot warrant the performance or results that
  25.  *  may be obtained by using this software or data. The NLM and the U.S.
  26.  *  Government disclaim all warranties, express or implied, including
  27.  *  warranties of performance, merchantability or fitness for any particular
  28.  *  purpose.
  29.  *
  30.  *  Please cite the author in any work or product based on this material.
  31.  *
  32.  * ===========================================================================
  33.  *
  34.  * Authors:  Josh Cherry
  35.  *
  36.  * File Description:  Find occurrences of a regular expression in a sequence
  37.  *
  38.  */
  39. #ifndef ALGO_SEQUENCE___FIND_PATTERN__HPP
  40. #define ALGO_SEQUENCE___FIND_PATTERN__HPP
  41. #include <corelib/ncbistd.hpp>
  42. BEGIN_NCBI_SCOPE
  43. class NCBI_XALGOSEQ_EXPORT CFindPattern {
  44. public:
  45.     /// Find non-overlapping matches of regular expression in sequence.
  46.     static void Find(const string& seq, const string& pattern,
  47.                      vector<TSeqPos>& starts, vector<TSeqPos>& ends);
  48.     /// Find cases of at least min_repeats consecutive occurrences of any
  49.     /// *particular* match to pattern.
  50.     /// N.B.: pattern = "[ag]c" and min_repeats = 2 will match
  51.     /// "acac" and "gcgc" but NOT "acgc" or "gcac".
  52.     static void FindRepeatsOf(const string& seq, const string& pattern,
  53.                               int min_repeats,
  54.                               vector<TSeqPos>& starts, vector<TSeqPos>& ends);
  55.     /// Find all cases of at least min_repeats consecutive occurrences
  56.     /// of any n-mer consisting of unambiguous nucleotides ({a, g, c, t}).
  57.     /// Note that, e.g., dinucelotide repeats can also qualify as
  58.     /// tetranucleotide repeats.
  59.     static void FindNucNmerRepeats(const string& seq,
  60.                                    int n, int min_repeats,
  61.                                    vector<TSeqPos>& starts,
  62.                                    vector<TSeqPos>& ends);
  63. };
  64. END_NCBI_SCOPE
  65. #endif   // ALGO_SEQUENCE___FIND_PATTERN__HPP
  66. /*
  67.  * ===========================================================================
  68.  * $Log: find_pattern.hpp,v $
  69.  * Revision 1000.0  2004/04/12 17:53:48  gouriano
  70.  * PRODUCTION: IMPORTED [CATCHUP_003] Dev-tree R1.11
  71.  *
  72.  * Revision 1.11  2004/04/01 14:14:01  lavr
  73.  * Spell "occurred", "occurrence", and "occurring"
  74.  *
  75.  * Revision 1.10  2003/12/16 20:10:16  jcherry
  76.  * Added export specifier
  77.  *
  78.  * Revision 1.9  2003/12/16 18:02:21  jcherry
  79.  * Moved find_pattern to algo/sequence
  80.  *
  81.  * Revision 1.8  2003/12/15 21:20:02  jcherry
  82.  * Added simple repeat searches
  83.  *
  84.  * Revision 1.7  2003/12/15 20:16:09  jcherry
  85.  * Changed CFindPattern::Find to take a string rather than a CSeqVector
  86.  *
  87.  * Revision 1.6  2003/12/15 19:51:07  jcherry
  88.  * CRegexp::GetMatch now takes a string&, not a char*
  89.  *
  90.  * Revision 1.5  2003/11/04 17:49:23  dicuccio
  91.  * Changed calling parameters for plugins - pass CPluginMessage instead of paired
  92.  * CPluginCommand/CPluginReply
  93.  *
  94.  * Revision 1.4  2003/08/04 20:07:13  jcherry
  95.  * Added standard #ifndef wrapper
  96.  *
  97.  * Revision 1.3  2003/07/03 19:14:12  jcherry
  98.  * Initial version
  99.  *
  100.  * Revision 1.1  2003/07/03 19:06:39  jcherry
  101.  * Initial version
  102.  *
  103.  * ===========================================================================
  104.  */