prosite.cpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:5k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: prosite.cpp,v $
  4.  * PRODUCTION Revision 1000.2  2004/06/01 20:55:35  gouriano
  5.  * PRODUCTION PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.4
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: prosite.cpp,v 1000.2 2004/06/01 20:55:35 gouriano Exp $
  10.  * ===========================================================================
  11.  *
  12.  *                            PUBLIC DOMAIN NOTICE
  13.  *               National Center for Biotechnology Information
  14.  *
  15.  *  This software/database is a "United States Government Work" under the
  16.  *  terms of the United States Copyright Act.  It was written as part of
  17.  *  the author's official duties as a United States Government employee and
  18.  *  thus cannot be copyrighted.  This software/database is freely available
  19.  *  to the public for use. The National Library of Medicine and the U.S.
  20.  *  Government have not placed any restriction on its use or reproduction.
  21.  *
  22.  *  Although all reasonable efforts have been taken to ensure the accuracy
  23.  *  and reliability of the software and data, the NLM and the U.S.
  24.  *  Government do not and cannot warrant the performance or results that
  25.  *  may be obtained by using this software or data. The NLM and the U.S.
  26.  *  Government disclaim all warranties, express or implied, including
  27.  *  warranties of performance, merchantability or fitness for any particular
  28.  *  purpose.
  29.  *
  30.  *  Please cite the author in any work or product based on this material.
  31.  *
  32.  * ===========================================================================
  33.  *
  34.  * Authors:  Josh Cherry
  35.  *
  36.  * File Description:  Class for handling prosite-format pattern databases
  37.  *
  38.  */
  39. #include <ncbi_pch.hpp>
  40. #include "prosite_entry.hpp"
  41. #include "prosite.hpp"
  42. BEGIN_NCBI_SCOPE
  43. // this function reads a stream in the format of prosite.dat and
  44. // APPENDS prosite entries to the vector of entries it's handed
  45. void CProsite::ReadEntries(istream& input, vector<CPrositeEntry>& entries)
  46. {
  47.     string line;
  48.     CPrositeEntry entry;
  49.     char buffer[4096];
  50.     while (input.getline(buffer, 4096)) {
  51.         line = buffer;
  52.         string ltype = line.substr(0, 2);
  53.         if (ltype == "ID") {
  54.             entry.SetId(line.substr(5));
  55.         } else if (ltype == "DE") {
  56.             entry.SetDesc(line.substr(5));
  57.         } else if (ltype == "DO") {
  58.             entry.SetDoc(line.substr(5));
  59.         } else if (ltype == "AC") {
  60.             entry.SetAccession(line.substr(5));
  61.         } else if (ltype == "PA") {
  62.             entry.SetPattern() += line.substr(5);
  63.         } else if (ltype == "CC") {
  64.             if (line.length() >= 5) {
  65.                 if (line.substr(5) == "/SKIP-FLAG=TRUE;") {
  66.                     entry.SetSkipFlag(1);
  67.                 }
  68.             }
  69.         } else if (ltype == "//") {
  70.             if (!entry.GetPattern().empty()) {
  71.                 // get rid of the ending '.' in pattern
  72.                 string& pa = entry.SetPattern();
  73.                 pa.erase(pa.length() - 1);
  74.                 // save the entry
  75.                 entries.push_back(entry);
  76.             }
  77.             entry.Reset();
  78.         }
  79.     }
  80. }
  81. string CProsite::PSPatternToPCRE(const string& pat)
  82. {
  83.     list<string> l;
  84.     string re;
  85.     // get elements between the -'s
  86.     NStr::Split(pat, "-", l);
  87.     ITERATE (list<string>, iter, l) {
  88.         re += x_ElementConvert(*iter);
  89.     }
  90.     return re;
  91. }
  92. string CProsite::x_ElementConvert(const string& el)
  93. {
  94.     string rv;
  95.     for(unsigned int i = 0;  i < el.length();  i++) {
  96.         switch (char ch = el[i]) {
  97.         case '{':
  98.             rv += "[^";
  99.             break;
  100.         case '}':
  101.             rv += ']';
  102.             break;
  103.         case '(':
  104.             rv += '{';
  105.             break;
  106.         case ')':
  107.             rv += '}';
  108.             break;
  109.         case 'x': case 'X':
  110.             rv += '.';
  111.             break;
  112.         case '<':
  113.             rv += '^';
  114.             break;
  115.         case '>':
  116.             rv += '$';
  117.             break;
  118.         default:
  119.             rv += ch;
  120.         }
  121.     }
  122.     return rv;
  123. }
  124. END_NCBI_SCOPE
  125. /*
  126.  * ===========================================================================
  127.  * $Log: prosite.cpp,v $
  128.  * Revision 1000.2  2004/06/01 20:55:35  gouriano
  129.  * PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.4
  130.  *
  131.  * Revision 1.4  2004/05/21 22:27:47  gorelenk
  132.  * Added PCH ncbi_pch.hpp
  133.  *
  134.  * Revision 1.3  2004/01/27 18:38:07  dicuccio
  135.  * Code clean-up.  Use standard names for plugins.  Removed unnecessary #includes
  136.  *
  137.  * Revision 1.2  2003/08/15 20:24:47  jcherry
  138.  * Sped up reading of prosite data file
  139.  *
  140.  * Revision 1.1  2003/08/04 20:05:45  jcherry
  141.  * Initial version
  142.  *
  143.  * ===========================================================================
  144.  */