dinuc.cpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:9k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: dinuc.cpp,v $
  4.  * PRODUCTION Revision 1000.5  2004/06/01 20:54:54  gouriano
  5.  * PRODUCTION PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.23
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: dinuc.cpp,v 1000.5 2004/06/01 20:54:54 gouriano Exp $
  10.  * ===========================================================================
  11.  *
  12.  *                            PUBLIC DOMAIN NOTICE
  13.  *               National Center for Biotechnology Information
  14.  *
  15.  *  This software/database is a "United States Government Work" under the
  16.  *  terms of the United States Copyright Act.  It was written as part of
  17.  *  the author's official duties as a United States Government employee and
  18.  *  thus cannot be copyrighted.  This software/database is freely available
  19.  *  to the public for use. The National Library of Medicine and the U.S.
  20.  *  Government have not placed any restriction on its use or reproduction.
  21.  *
  22.  *  Although all reasonable efforts have been taken to ensure the accuracy
  23.  *  and reliability of the software and data, the NLM and the U.S.
  24.  *  Government do not and cannot warrant the performance or results that
  25.  *  may be obtained by using this software or data. The NLM and the U.S.
  26.  *  Government disclaim all warranties, express or implied, including
  27.  *  warranties of performance, merchantability or fitness for any particular
  28.  *  purpose.
  29.  *
  30.  *  Please cite the author in any work or product based on this material.
  31.  *
  32.  * ===========================================================================
  33.  *
  34.  * Authors:  Josh Cherry
  35.  *
  36.  * File Description:
  37.  *   CAlgoPlugin_Dinuc -- implements the algorithm to calculate dinucleotide frequencies
  38.  */
  39. #include <ncbi_pch.hpp>
  40. #include "dinuc.hpp"
  41. #include "output_dlg.hpp"
  42. #include <algo/sequence/nuc_prop.hpp>
  43. #include <gui/core/idocument.hpp>
  44. #include <gui/core/plugin_utils.hpp>
  45. #include <gui/core/version.hpp>
  46. #include <gui/plugin/PluginCommandSet.hpp>
  47. #include <gui/plugin/PluginInfo.hpp>
  48. #include <gui/plugin/PluginRequest.hpp>
  49. #include <gui/plugin/PluginValueConstraint.hpp>
  50. #include <objects/seqloc/Seq_loc.hpp>
  51. #include <objmgr/scope.hpp>
  52. #include <objmgr/seq_vector.hpp>
  53. #include <objmgr/util/sequence.hpp>
  54. BEGIN_NCBI_SCOPE
  55. USING_SCOPE(objects);
  56. CAlgoPlugin_Dinuc::CAlgoPlugin_Dinuc()
  57. {
  58. }
  59. CAlgoPlugin_Dinuc::~CAlgoPlugin_Dinuc()
  60. {
  61. }
  62. // standard info boilerplate
  63. void CAlgoPlugin_Dinuc::GetInfo(CPluginInfo& info)
  64. {
  65.     info.Reset();
  66.     // version info macro
  67.     info.SetInfo(CPluginVersion::eMajor, CPluginVersion::eMinor, 0,
  68.                  string(__DATE__) + " " + string(__TIME__),
  69.                  "CAlgoPlugin_Dinuc", "Composition/Dinucleotide Frequencies",
  70.                  "Determine dinucleotide frequencies",
  71.                  "");
  72.     // command info
  73.     CPluginCommandSet& cmds = info.SetCommands();
  74.     CPluginCommand&    args = cmds.AddAlgoCommand(eAlgoCommand_run);
  75.     args.AddArgument("locs", "Locations to evaluate",
  76.                      CSeq_loc::GetTypeInfo(),
  77.                      CPluginArg::TData::e_Array);
  78.     args.SetConstraint("locs",
  79.                        (*CPluginValueConstraint::CreateSeqMol(),
  80.                         CSeq_inst::eMol_na,
  81.                         CSeq_inst::eMol_dna,
  82.                         CSeq_inst::eMol_rna));
  83. }
  84. void CAlgoPlugin_Dinuc::RunCommand(CPluginMessage& msg)
  85. {
  86.     const CPluginCommand& args = msg.GetRequest().GetCommand();
  87.     CPluginReply& reply = msg.SetReply();
  88.     _TRACE("CAlgoPlugin_Dinuc::Run()");
  89.     if ( !m_OutputDlg.get() ) {
  90.         m_OutputDlg.reset(new COutputDlg());
  91.     }
  92.     m_OutputDlg->SetTitle("Results: Dinucleotide Frequencies");
  93.     string str;
  94.     //
  95.     // first, evaluate whole sequences
  96.     //
  97.     plugin_args::TLocList locs;
  98.     GetArgValue(args["locs"], locs);
  99.     ITERATE (plugin_args::TLocList, iter, locs) {
  100.         const CSeq_loc&  loc = *iter->second;
  101.         const IDocument& doc = *iter->first;
  102.         try {
  103.             CBioseq_Handle handle = doc.GetScope().GetBioseqHandle(loc);
  104.             CSeqVector vec =
  105.                 handle.GetSequenceView(loc,
  106.                                        CBioseq_Handle::eViewConstructed,
  107.                                        CBioseq_Handle::eCoding_Iupac);
  108.             vector<int> table;
  109.             CNucProp::CountNmers(vec, 2, table);
  110.             // total dimers != length-1 if ambiguity characters
  111.             int sum = 0;
  112.             for( int i = 0; i < 16; i++ ) {
  113.                 sum += table[i];
  114.             }
  115.             
  116.             if ( !str.empty() ) {
  117.                 str += "n";
  118.             }
  119.             
  120.             const CSeq_id& best_id =
  121.                 sequence::GetId(handle, sequence::eGetId_Best);
  122.             best_id.GetLabel(&str);
  123.             str += "t[";
  124.             str += CPluginUtils::GetLabel(loc, &doc.GetScope());
  125.             str += "]n";
  126.             // header
  127.             str += 't';
  128.             int m;
  129.             for(m=0;  m<4;  m++) {
  130.                 str += 't';
  131.                 string nuc;
  132.                 CNucProp::Int2Nmer(m, 1, nuc);
  133.                 str += nuc;
  134.             }
  135.             str += 'n';
  136.             // rest
  137.             for(int n=0;  n<4;  n++) {
  138.                 string nuc;
  139.                 CNucProp::Int2Nmer(n, 1, nuc);
  140.                 str += nuc;
  141.                 for(m=0;  m<4;  m++) {
  142.                     str += 't';
  143.                     str += NStr::DoubleToString(table[4*n+m] / (double) sum, 4);
  144.                 }
  145.                 str += 'n';
  146.             }
  147.         }
  148.         catch (CException& e) {
  149.             string str = CPluginUtils::GetLabel(loc, &doc.GetScope());
  150.             LOG_POST(Error << "Error processing location " << str
  151.                      << ": " << e.what());
  152.         }
  153. #ifndef _DEBUG
  154.         catch (...) {
  155.             string str = CPluginUtils::GetLabel(loc, &doc.GetScope());
  156.             LOG_POST(Error << "Error processing location " << str);
  157.         }
  158. #endif
  159.     }
  160.     //
  161.     // prepare our dialog box
  162.     //
  163.     if (str.empty()) {
  164.         str = "No relevant selections found.";
  165.     }
  166.     m_OutputDlg->SetText(str);
  167.     m_OutputDlg->Show();
  168.     reply.SetStatus(eMessageStatus_success);
  169. }
  170. END_NCBI_SCOPE
  171. /*
  172.  * ===========================================================================
  173.  * $Log: dinuc.cpp,v $
  174.  * Revision 1000.5  2004/06/01 20:54:54  gouriano
  175.  * PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.23
  176.  *
  177.  * Revision 1.23  2004/05/21 22:27:46  gorelenk
  178.  * Added PCH ncbi_pch.hpp
  179.  *
  180.  * Revision 1.22  2004/03/05 17:35:37  dicuccio
  181.  * Use sequence::GetId() instead of CSeq_id::GetStringDescr()
  182.  *
  183.  * Revision 1.21  2004/01/27 18:37:37  dicuccio
  184.  * Code clean-up.  Use standard names for plugins.  Removed unnecessary #includes
  185.  *
  186.  * Revision 1.20  2004/01/07 15:50:36  dicuccio
  187.  * Adjusted for API change in CPluginUtils::GetLabel().  Standardized exception
  188.  * reporting in algorithms.
  189.  *
  190.  * Revision 1.19  2003/11/24 15:45:25  dicuccio
  191.  * Renamed CVersion to CPluginVersion
  192.  *
  193.  * Revision 1.18  2003/11/06 20:12:12  dicuccio
  194.  * Cleaned up handling of USING_SCOPE - removed from all headers
  195.  *
  196.  * Revision 1.17  2003/11/04 17:49:22  dicuccio
  197.  * Changed calling parameters for plugins - pass CPluginMessage instead of paired
  198.  * CPluginCommand/CPluginReply
  199.  *
  200.  * Revision 1.16  2003/10/07 13:47:00  dicuccio
  201.  * Renamed CPluginURL* to CPluginValue*
  202.  *
  203.  * Revision 1.15  2003/09/04 14:05:24  dicuccio
  204.  * Use IDocument instead of CDocument
  205.  *
  206.  * Revision 1.14  2003/09/03 14:46:53  rsmith
  207.  * change namespace name from args to plugin_args to avoid clashes with variable names.
  208.  *
  209.  * Revision 1.13  2003/08/21 12:03:07  dicuccio
  210.  * Make use of new typedef in plugin_utils.hpp for argument values.
  211.  *
  212.  * Revision 1.12  2003/08/18 15:05:11  jcherry
  213.  * Reflect changes in nuc_prop.?pp.  Pre-allocate dialog rows for speed.
  214.  *
  215.  * Revision 1.11  2003/07/28 11:51:48  dicuccio
  216.  * Rewrote CTablePanel<> to be more flexible and better contained.  Added standard
  217.  * multicolumn list dialog.  Deprecated use of COutputDlg.
  218.  *
  219.  * Revision 1.10  2003/07/22 15:32:16  dicuccio
  220.  * Changed to make use of new API in plugin_utils.hpp - GetArgValue()
  221.  *
  222.  * Revision 1.9  2003/07/21 19:32:53  dicuccio
  223.  * Added constraints based on molecule type
  224.  *
  225.  * Revision 1.8  2003/07/14 11:12:11  shomrat
  226.  * Plugin messageing system related changes
  227.  *
  228.  * Revision 1.7  2003/07/01 15:08:41  jcherry
  229.  * Moved a bunch of stuff into CNucProp and CProtProp
  230.  * Put these in c++/{src,include}/algo/sequence
  231.  *
  232.  * Revision 1.6  2003/06/26 15:33:40  dicuccio
  233.  * Moved GetURLValue() from PluginURL.hpp to plugin_utils.hpp.  Fixed compilation
  234.  * errors relating to missing #includes
  235.  *
  236.  * Revision 1.5  2003/06/25 17:02:57  dicuccio
  237.  * Split CPluginHandle into a handle (pointer-to-implementation) and
  238.  * implementation file.  Lots of #include file clean-ups.
  239.  *
  240.  * Revision 1.4  2003/06/20 14:52:36  dicuccio
  241.  * Revised plugin registration - moved GetInfo() into the plugin handler
  242.  *
  243.  * Revision 1.3  2003/06/10 17:30:58  jcherry
  244.  * Changed dinucleotide stuff to use n-mer algorithm
  245.  *
  246.  * Revision 1.2  2003/06/09 19:13:51  jcherry
  247.  * Retabbified, etc., to comply with conventions
  248.  *
  249.  * Revision 1.1  2003/06/09 17:29:56  jcherry
  250.  * Initial version
  251.  *
  252.  * ===========================================================================
  253.  */