nmer.cpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:9k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: nmer.cpp,v $
  4.  * PRODUCTION Revision 1000.5  2004/06/01 20:55:08  gouriano
  5.  * PRODUCTION PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.24
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: nmer.cpp,v 1000.5 2004/06/01 20:55:08 gouriano Exp $
  10.  * ===========================================================================
  11.  *
  12.  *                            PUBLIC DOMAIN NOTICE
  13.  *               National Center for Biotechnology Information
  14.  *
  15.  *  This software/database is a "United States Government Work" under the
  16.  *  terms of the United States Copyright Act.  It was written as part of
  17.  *  the author's official duties as a United States Government employee and
  18.  *  thus cannot be copyrighted.  This software/database is freely available
  19.  *  to the public for use. The National Library of Medicine and the U.S.
  20.  *  Government have not placed any restriction on its use or reproduction.
  21.  *
  22.  *  Although all reasonable efforts have been taken to ensure the accuracy
  23.  *  and reliability of the software and data, the NLM and the U.S.
  24.  *  Government do not and cannot warrant the performance or results that
  25.  *  may be obtained by using this software or data. The NLM and the U.S.
  26.  *  Government disclaim all warranties, express or implied, including
  27.  *  warranties of performance, merchantability or fitness for any particular
  28.  *  purpose.
  29.  *
  30.  *  Please cite the author in any work or product based on this material.
  31.  *
  32.  * ===========================================================================
  33.  *
  34.  * Authors:  Josh Cherry
  35.  *
  36.  * File Description:
  37.  *   CAlgoPlugin_Nmer -- wraps the algorithm to calculate n-mer frequencies
  38.  */
  39. #include <ncbi_pch.hpp>
  40. #include "nmer.hpp"
  41. #include <algo/sequence/nuc_prop.hpp>
  42. #include <gui/core/plugin_utils.hpp>
  43. #include <gui/core/version.hpp>
  44. #include <gui/dialogs/col/multi_col_dlg.hpp>
  45. #include <gui/plugin/PluginCommandSet.hpp>
  46. #include <gui/plugin/PluginInfo.hpp>
  47. #include <gui/plugin/PluginReply.hpp>
  48. #include <gui/plugin/PluginRequest.hpp>
  49. #include <gui/plugin/PluginValueConstraint.hpp>
  50. #include <objmgr/seq_vector.hpp>
  51. #include <objmgr/util/sequence.hpp>
  52. BEGIN_NCBI_SCOPE
  53. USING_SCOPE(objects);
  54. CAlgoPlugin_Nmer::~CAlgoPlugin_Nmer()
  55. {
  56. }
  57. // standard plugin announcement boilerplate
  58. void CAlgoPlugin_Nmer::GetInfo(CPluginInfo& info)
  59. {
  60.     info.Reset();
  61.     // version info macro
  62.     info.SetInfo(CPluginVersion::eMajor, CPluginVersion::eMinor, 0,
  63.                  string(__DATE__) + " " + string(__TIME__),
  64.                  "CAlgoPlugin_Nmer", "Composition/n-mer Frequencies",
  65.                  "Determine n-mer frequencies",
  66.                  "");
  67.     // command info
  68.     CPluginCommandSet& cmds = info.SetCommands();
  69.     CPluginCommand&    args = cmds.AddAlgoCommand(eAlgoCommand_run);
  70.     args.AddArgument("locs", "Locations to evaluate",
  71.                      CSeq_loc::GetTypeInfo(),
  72.                      CPluginArg::TData::e_Array);
  73.     args.SetConstraint("locs",
  74.                        (*CPluginValueConstraint::CreateSeqMol(),
  75.                         CSeq_inst::eMol_na,
  76.                         CSeq_inst::eMol_dna,
  77.                         CSeq_inst::eMol_rna));
  78.     args.AddArgument("nmer_size", "Size of n-mers",
  79.                      CPluginArg::eInteger);
  80. }
  81. void CAlgoPlugin_Nmer::RunCommand(CPluginMessage& msg)
  82. {
  83.     const CPluginCommand& args = msg.GetRequest().GetCommand();
  84.     CPluginReply& reply = msg.SetReply();
  85.     _TRACE("CAlgoPlugin_Nmer::Run()");
  86.     if ( !m_Dialog.get() ) {
  87.         m_Dialog.reset(new CMultiColDlg());
  88.         m_Dialog->SetTitle("n-mer Frequencies");
  89.         m_Dialog->SetLabel("Results of n-mer frequencies are as follows:");
  90.         m_Dialog->SetColumn(0, "Sequence");
  91.         m_Dialog->SetColumn(1, "Location", FL_ALIGN_LEFT, 2.0f);
  92.         m_Dialog->SetColumn(2, "n-mer");
  93.         m_Dialog->SetColumn(3, "Count", FL_ALIGN_CENTER);
  94.     }
  95.     int nmer_size = args["nmer_size"].AsInteger();  // the 'n' in nmer
  96.     //
  97.     // first, evaluate whole sequences
  98.     //
  99.     int row = 0;
  100.     plugin_args::TLocList locs;
  101.     GetArgValue(args["locs"], locs);
  102.     ITERATE (plugin_args::TLocList, iter, locs) {
  103.         const CSeq_loc&  loc = *iter->second;
  104.         const IDocument& doc = *iter->first;
  105.         // find the best ID for this bioseq
  106.         try {
  107.             CBioseq_Handle handle = doc.GetScope().GetBioseqHandle(loc);
  108.             CSeqVector vec =
  109.                 handle.GetSequenceView(loc,
  110.                                        CBioseq_Handle::eViewConstructed,
  111.                                        CBioseq_Handle::eCoding_Iupac);
  112.             vector<int> table;
  113.             CNucProp::CountNmers(vec, nmer_size, table);
  114.             m_Dialog->SetRows(0);  // to clear any previous contents
  115.             string& id_str  = m_Dialog->SetCell(row, 0);
  116.             string& loc_str = m_Dialog->SetCell(row, 1);
  117.             const CSeq_id& best_id =
  118.                 sequence::GetId(handle, sequence::eGetId_Best);
  119.             id_str.erase();
  120.             best_id.GetLabel(&id_str);
  121.             loc_str = CPluginUtils::GetLabel(loc, &doc.GetScope());
  122.             // preallocate rows in table for speed
  123.             int row_count = 0;
  124.             for(unsigned int k = 0;  k < table.size();  k++) {
  125.                 if (table[k] != 0) {
  126.                     row_count++;
  127.                 }
  128.             }
  129.             m_Dialog->SetRows(row_count);
  130.             for(unsigned int k = 0;  k < table.size();  k++) {
  131.                 if (table[k] == 0) {
  132.                     continue;
  133.                 }
  134.                 CNucProp::Int2Nmer(k, nmer_size, m_Dialog->SetCell(row, 2));
  135.                 m_Dialog->SetCell(row, 3) = NStr::IntToString(table[k]);
  136.                 ++row;
  137.             }
  138.         }
  139.         catch (CException& e) {
  140.             string str = CPluginUtils::GetLabel(loc, &doc.GetScope());
  141.             LOG_POST(Error << "Error processing location " << str
  142.                      << ": " << e.what());
  143.         }
  144. #ifndef _DEBUG
  145.         catch (...) {
  146.             string str = CPluginUtils::GetLabel(loc, &doc.GetScope());
  147.             LOG_POST(Error << "Error processing location " << str);
  148.         }
  149. #endif
  150.     }
  151.     //
  152.     // prepare our dialog box
  153.     //
  154.     m_Dialog->Show();
  155.     reply.SetStatus(eMessageStatus_success);
  156. }
  157. END_NCBI_SCOPE
  158. /*
  159.  * ===========================================================================
  160.  * $Log: nmer.cpp,v $
  161.  * Revision 1000.5  2004/06/01 20:55:08  gouriano
  162.  * PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.24
  163.  *
  164.  * Revision 1.24  2004/05/21 22:27:46  gorelenk
  165.  * Added PCH ncbi_pch.hpp
  166.  *
  167.  * Revision 1.23  2004/03/05 17:35:37  dicuccio
  168.  * Use sequence::GetId() instead of CSeq_id::GetStringDescr()
  169.  *
  170.  * Revision 1.22  2004/01/27 18:37:46  dicuccio
  171.  * Code clean-up.  Use standard names for plugins.  Removed unnecessary #includes
  172.  *
  173.  * Revision 1.21  2004/01/07 15:50:36  dicuccio
  174.  * Adjusted for API change in CPluginUtils::GetLabel().  Standardized exception
  175.  * reporting in algorithms.
  176.  *
  177.  * Revision 1.20  2003/11/24 15:45:26  dicuccio
  178.  * Renamed CVersion to CPluginVersion
  179.  *
  180.  * Revision 1.19  2003/11/06 20:12:12  dicuccio
  181.  * Cleaned up handling of USING_SCOPE - removed from all headers
  182.  *
  183.  * Revision 1.18  2003/11/04 17:49:23  dicuccio
  184.  * Changed calling parameters for plugins - pass CPluginMessage instead of paired
  185.  * CPluginCommand/CPluginReply
  186.  *
  187.  * Revision 1.17  2003/10/07 13:47:00  dicuccio
  188.  * Renamed CPluginURL* to CPluginValue*
  189.  *
  190.  * Revision 1.16  2003/09/04 14:05:24  dicuccio
  191.  * Use IDocument instead of CDocument
  192.  *
  193.  * Revision 1.15  2003/09/03 14:46:53  rsmith
  194.  * change namespace name from args to plugin_args to avoid clashes with variable names.
  195.  *
  196.  * Revision 1.14  2003/08/21 12:03:07  dicuccio
  197.  * Make use of new typedef in plugin_utils.hpp for argument values.
  198.  *
  199.  * Revision 1.13  2003/08/18 15:05:11  jcherry
  200.  * Reflect changes in nuc_prop.?pp.  Pre-allocate dialog rows for speed.
  201.  *
  202.  * Revision 1.12  2003/08/05 17:03:55  dicuccio
  203.  * Made multi-column output dialog a member variable - allows non-modal operation
  204.  *
  205.  * Revision 1.11  2003/07/28 11:51:48  dicuccio
  206.  * Rewrote CTablePanel<> to be more flexible and better contained.  Added standard
  207.  * multicolumn list dialog.  Deprecated use of COutputm_Dialog->
  208.  *
  209.  * Revision 1.10  2003/07/22 15:32:16  dicuccio
  210.  * Changed to make use of new API in plugin_utils.hpp - GetArgValue()
  211.  *
  212.  * Revision 1.9  2003/07/21 19:32:53  dicuccio
  213.  * Added constraints based on molecule type
  214.  *
  215.  * Revision 1.8  2003/07/14 11:12:57  shomrat
  216.  * Plugin messageing system related changes
  217.  *
  218.  * Revision 1.7  2003/07/01 15:08:41  jcherry
  219.  * Moved a bunch of stuff into CNucProp and CProtProp
  220.  * Put these in c++/{src,include}/algo/sequence
  221.  *
  222.  * Revision 1.6  2003/06/26 15:33:40  dicuccio
  223.  * Moved GetURLValue() from PluginURL.hpp to plugin_utils.hpp.  Fixed compilation
  224.  * errors relating to missing #includes
  225.  *
  226.  * Revision 1.5  2003/06/25 17:02:57  dicuccio
  227.  * Split CPluginHandle into a handle (pointer-to-implementation) and
  228.  * implementation file.  Lots of #include file clean-ups.
  229.  *
  230.  * Revision 1.4  2003/06/20 14:52:36  dicuccio
  231.  * Revised plugin registration - moved GetInfo() into the plugin handler
  232.  *
  233.  * Revision 1.3  2003/06/10 14:45:22  jcherry
  234.  * Moved actual algorithms for n-mers to a separate class,
  235.  * implemented in count_nmers.?pp
  236.  *
  237.  * Revision 1.2  2003/06/09 19:14:39  jcherry
  238.  * Retabbified, etc., to comply with conventions
  239.  *
  240.  * Revision 1.1  2003/06/09 17:30:10  jcherry
  241.  * Initial version
  242.  *
  243.  * ===========================================================================
  244.  */