seq_match.cpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:4k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: seq_match.cpp,v $
  4.  * PRODUCTION Revision 1000.1  2004/06/01 18:10:53  gouriano
  5.  * PRODUCTION PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.5
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: seq_match.cpp,v 1000.1 2004/06/01 18:10:53 gouriano Exp $
  10.  * ===========================================================================
  11.  *
  12.  *                            PUBLIC DOMAIN NOTICE
  13.  *               National Center for Biotechnology Information
  14.  *
  15.  *  This software/database is a "United States Government Work" under the
  16.  *  terms of the United States Copyright Act.  It was written as part of
  17.  *  the author's official duties as a United States Government employee and
  18.  *  thus cannot be copyrighted.  This software/database is freely available
  19.  *  to the public for use. The National Library of Medicine and the U.S.
  20.  *  Government have not placed any restriction on its use or reproduction.
  21.  *
  22.  *  Although all reasonable efforts have been taken to ensure the accuracy
  23.  *  and reliability of the software and data, the NLM and the U.S.
  24.  *  Government do not and cannot warrant the performance or results that
  25.  *  may be obtained by using this software or data. The NLM and the U.S.
  26.  *  Government disclaim all warranties, express or implied, including
  27.  *  warranties of performance, merchantability or fitness for any particular
  28.  *  purpose.
  29.  *
  30.  *  Please cite the author in any work or product based on this material.
  31.  *
  32.  * ===========================================================================
  33.  *
  34.  * Authors:  Josh Cherry
  35.  *
  36.  * File Description:  Simple pattern matching for sequences
  37.  *
  38.  */
  39. #include <ncbi_pch.hpp>
  40. #include <corelib/ncbistd.hpp>
  41. #include <algo/sequence/seq_match.hpp>
  42. #include <algorithm>
  43. BEGIN_NCBI_SCOPE
  44. char CSeqMatch::IupacToNcbi8na(char in)
  45. {
  46.     char A = 1, C = 2, G = 4, T = 8;
  47.     char out;
  48.     switch (in) {
  49.     case 'A':
  50.         out = A;
  51.         break;
  52.     case 'G':
  53.         out = G;
  54.         break;
  55.     case 'C':
  56.         out = C;
  57.         break;
  58.     case 'T':
  59.         out = T;
  60.         break;
  61.     case 'R':
  62.         out = A | G;
  63.         break;
  64.     case 'Y':
  65.         out = T | C;
  66.         break;
  67.     case 'S':
  68.         out = G | C;
  69.         break;
  70.     case 'W':
  71.         out = A | T;
  72.         break;
  73.     case 'M':
  74.         out = A | C;
  75.         break;
  76.     case 'K':
  77.         out = G | T;
  78.         break;
  79.     case 'B':
  80.         out = G | C | T;
  81.         break;
  82.     case 'D':
  83.         out = A | G | T;
  84.         break;
  85.     case 'H':
  86.         out = A | C | T;
  87.         break;
  88.     case 'V':
  89.         out = A | G | C;
  90.         break;
  91.     case 'N':
  92.         out = A | G | C | T;
  93.         break;
  94.     default:
  95.         throw runtime_error(string("couldn't covert ") + in +
  96.                             " to ncbi8na: invalid IUPAC code ");
  97.         break;
  98.     }
  99.     return out;
  100. }        
  101. void CSeqMatch::IupacToNcbi8na(const string& in, string& out)
  102. {
  103.     out.resize(in.size());
  104.     for (unsigned int i = 0;  i < in.length();  i++) {
  105.         out[i] = IupacToNcbi8na(in[i]);
  106.     }
  107. }
  108. char CSeqMatch::CompNcbi8na(char in)
  109. {
  110.     static const char sc_table[16] = {
  111.         0x00, 0x08, 0x04, 0x06, 0x02, 0x0a, 0x06, 0x0e,
  112.         0x01, 0x09, 0x05, 0x0d, 0x03, 0x0b, 0x07, 0x0f
  113.     };
  114.     return sc_table[ in & 0x0f ];
  115. }        
  116. void CSeqMatch::CompNcbi8na(string& seq)
  117. {
  118.     reverse(seq.begin(), seq.end());
  119.     NON_CONST_ITERATE (string, base, seq) {
  120.         *base = CompNcbi8na(*base);
  121.     }
  122. }
  123. END_NCBI_SCOPE
  124. /*
  125.  * ===========================================================================
  126.  * $Log: seq_match.cpp,v $
  127.  * Revision 1000.1  2004/06/01 18:10:53  gouriano
  128.  * PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.5
  129.  *
  130.  * Revision 1.5  2004/05/21 21:41:04  gorelenk
  131.  * Added PCH ncbi_pch.hpp
  132.  *
  133.  * Revision 1.4  2003/08/18 19:23:33  jcherry
  134.  * Moved seq_match to algo/sequence
  135.  *
  136.  * Revision 1.3  2003/08/13 17:40:26  dicuccio
  137.  * Formatting fixes.  Changes some pass-by-val to pass-by-reference.  Fixed
  138.  * complement table
  139.  *
  140.  * Revision 1.2  2003/08/13 16:42:11  dicuccio
  141.  * Compilation fixes for MSVC
  142.  *
  143.  * Revision 1.1  2003/08/12 18:52:58  jcherry
  144.  * Initial version
  145.  *
  146.  * ===========================================================================
  147.  */