sequtil_convert.hpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:6k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: sequtil_convert.hpp,v $
  4.  * PRODUCTION Revision 1000.0  2003/10/29 15:35:41  gouriano
  5.  * PRODUCTION PRODUCTION: IMPORTED [ORIGINAL] Dev-tree R1.1
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. #ifndef UTIL_SEQUTIL___SEQUTIL_CONVERT__HPP
  10. #define UTIL_SEQUTIL___SEQUTIL_CONVERT__HPP
  11. /*  $Id: sequtil_convert.hpp,v 1000.0 2003/10/29 15:35:41 gouriano Exp $
  12.  * ===========================================================================
  13.  *
  14.  *                            PUBLIC DOMAIN NOTICE
  15.  *               National Center for Biotechnology Information
  16.  *
  17.  *  This software/database is a "United States Government Work" under the
  18.  *  terms of the United States Copyright Act.  It was written as part of
  19.  *  the author's official duties as a United States Government employee and
  20.  *  thus cannot be copyrighted.  This software/database is freely available
  21.  *  to the public for use. The National Library of Medicine and the U.S.
  22.  *  Government have not placed any restriction on its use or reproduction.
  23.  *
  24.  *  Although all reasonable efforts have been taken to ensure the accuracy
  25.  *  and reliability of the software and data, the NLM and the U.S.
  26.  *  Government do not and cannot warrant the performance or results that
  27.  *  may be obtained by using this software or data. The NLM and the U.S.
  28.  *  Government disclaim all warranties, express or implied, including
  29.  *  warranties of performance, merchantability or fitness for any particular
  30.  *  purpose.
  31.  *
  32.  *  Please cite the author in any work or product based on this material.
  33.  *
  34.  * ===========================================================================
  35.  *
  36.  * Author:  Mati Shomrat
  37.  *
  38.  * File Description:
  39.  *      Sequence conversion utility.
  40.  */   
  41. #include <corelib/ncbistd.hpp>
  42. #include <corelib/ncbiobj.hpp>
  43. #include <corelib/ncbistr.hpp>
  44. #include <corelib/ncbiexpt.hpp>
  45. #include <corelib/ncbi_limits.hpp>
  46. #include <vector>
  47. #include <util/sequtil/sequtil.hpp>
  48. BEGIN_NCBI_SCOPE
  49. /////////////////////////////////////////////////////////////////////////////
  50. //
  51. // Sequence Conversions
  52. //
  53. class NCBI_XUTIL_EXPORT CSeqConvert
  54. {
  55. public:
  56.     // types
  57.     typedef CSeqUtil::ECoding   TCoding;
  58.     // Conversion Methods:
  59.     // Convert sequence from one coding to another.
  60.     //
  61.     // PARAMETERS:
  62.     // src - input container containing the sequence.
  63.     // src_coding - the input's coding
  64.     // pos, length - specify the initial offset and the length
  65.     // dst - output container, or raw memory
  66.     // dst_coding - the desired output coding
  67.     //
  68.     // RETURN VALUE:
  69.     // All methds return the number of converted characers
  70.     // Methods will throw an exception if the conversion can't be 
  71.     // performed. For example when trying to convert NA coding to an AA one.
  72.    
  73.     // string to string
  74.     static SIZE_TYPE Convert(const string& src, TCoding src_coding,
  75.                              TSeqPos pos, TSeqPos length,
  76.                              string& dst, TCoding dst_coding);
  77.     // string to vector
  78.     static SIZE_TYPE Convert(const string& src, TCoding src_coding,
  79.                              TSeqPos pos, TSeqPos length,
  80.                              vector< char >& dst, TCoding dst_coding);
  81.     // vector to string
  82.     static SIZE_TYPE Convert(const vector< char >& src, TCoding src_coding,
  83.                              TSeqPos pos, TSeqPos length,
  84.                              string& dst, TCoding dst_coding);
  85.     // vector to vector
  86.     static SIZE_TYPE Convert(const vector< char >& src, TCoding src_coding,
  87.                              TSeqPos pos, TSeqPos length,
  88.                              vector< char >& dst, TCoding dst_coding);
  89.     // char[] to char[]
  90.     static SIZE_TYPE Convert(const char src[], TCoding src_coding,
  91.                              TSeqPos pos, TSeqPos length,
  92.                              char dst[], TCoding dst_coding);
  93.     // Subseq
  94.     // 
  95.     // The function returns an object whose sequence is a copy of up to 
  96.     // length elements of the controlled sequence beginning at position 
  97.     // pos.
  98.     static SIZE_TYPE Subseq(const string& src, TCoding src_coding,
  99.                             TSeqPos pos, TSeqPos length,
  100.                             string& dst);
  101.     static SIZE_TYPE Subseq(const string& src, TCoding src_coding,
  102.                             TSeqPos pos, TSeqPos length,
  103.                             vector<char>& dst);
  104.     static SIZE_TYPE Subseq(const vector<char>& src, TCoding src_coding,
  105.                             TSeqPos pos, TSeqPos length,
  106.                             string& dst);
  107.     static SIZE_TYPE Subseq(const vector<char>& src, TCoding src_coding,
  108.                             TSeqPos pos, TSeqPos length,
  109.                             vector<char>& dst);
  110.     static SIZE_TYPE Subseq(const char* src, TCoding src_coding,
  111.                             TSeqPos pos, TSeqPos length,
  112.                             char* dst);
  113.     // Packing:
  114.     // Pack will convert a given sequnece to its most condensed form
  115.     // without the loss of information. Hence, sequences containing 
  116.     // ambiguities will be converted to ncbi4na, while those that are
  117.     // comprised of only A, C, G and T will be converted to ncbi2na.
  118.     static SIZE_TYPE Pack(const string& src, TCoding src_coding,
  119.         vector<char>& dst, TCoding& dst_coding, 
  120.         TSeqPos length = ncbi::numeric_limits<TSeqPos>::max());
  121.     static SIZE_TYPE Pack(const vector<char>& src, TCoding src_coding,
  122.         vector<char>& dst, TCoding& dst_coding, 
  123.         TSeqPos length = ncbi::numeric_limits<TSeqPos>::max());
  124.     static SIZE_TYPE Pack(const char* src, TSeqPos length, TCoding src_coding,
  125.                           char* dst, TCoding& dst_coding);
  126. };
  127. END_NCBI_SCOPE
  128. #endif  /* UTIL_SEQUTIL___SEQUTIL_CONVERT__HPP */
  129.  /*
  130. * ===========================================================================
  131. *
  132. * $Log: sequtil_convert.hpp,v $
  133. * Revision 1000.0  2003/10/29 15:35:41  gouriano
  134. * PRODUCTION: IMPORTED [ORIGINAL] Dev-tree R1.1
  135. *
  136. * Revision 1.1  2003/10/08 13:28:59  shomrat
  137. * Initial version.
  138. *
  139. *
  140. * ===========================================================================
  141. */