data_loader.hpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:9k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: data_loader.hpp,v $
  4.  * PRODUCTION Revision 1000.1  2003/12/02 20:30:44  gouriano
  5.  * PRODUCTION PRODUCTION: UPGRADED [ORIGINAL] Dev-tree R1.25
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. #ifndef OBJECTS_OBJMGR___DATA_LOADER__HPP
  10. #define OBJECTS_OBJMGR___DATA_LOADER__HPP
  11. /*  $Id: data_loader.hpp,v 1000.1 2003/12/02 20:30:44 gouriano Exp $
  12. * ===========================================================================
  13. *
  14. *                            PUBLIC DOMAIN NOTICE
  15. *               National Center for Biotechnology Information
  16. *
  17. *  This software/database is a "United States Government Work" under the
  18. *  terms of the United States Copyright Act.  It was written as part of
  19. *  the author's official duties as a United States Government employee and
  20. *  thus cannot be copyrighted.  This software/database is freely available
  21. *  to the public for use. The National Library of Medicine and the U.S.
  22. *  Government have not placed any restriction on its use or reproduction.
  23. *
  24. *  Although all reasonable efforts have been taken to ensure the accuracy
  25. *  and reliability of the software and data, the NLM and the U.S.
  26. *  Government do not and cannot warrant the performance or results that
  27. *  may be obtained by using this software or data. The NLM and the U.S.
  28. *  Government disclaim all warranties, express or implied, including
  29. *  warranties of performance, merchantability or fitness for any particular
  30. *  purpose.
  31. *
  32. *  Please cite the author in any work or product based on this material.
  33. *
  34. * ===========================================================================
  35. *
  36. * Author: Aleksey Grichenko, Michael Kimelman, Eugene Vasilchenko
  37. *
  38. * File Description:
  39. *   Data loader base class for object manager
  40. *
  41. */
  42. #include <corelib/ncbiobj.hpp>
  43. #include <objmgr/data_loader_factory.hpp>
  44. #include <objmgr/seq_id_handle.hpp>
  45. #include <set>
  46. BEGIN_NCBI_SCOPE
  47. BEGIN_SCOPE(objects)
  48. // fwd decl
  49. class CSeq_loc;
  50. class CSeq_entry;
  51. class CDataSource;
  52. class CHandleRangeMap;
  53. class CTSE_Info;
  54. class CTSE_Chunk_Info;
  55. struct SAnnotTypeSelector;
  56. ////////////////////////////////////////////////////////////////////
  57. //
  58. //  CDataLoader::
  59. //
  60. class NCBI_XOBJMGR_EXPORT CDataLoader : public CObject
  61. {
  62. protected:
  63.     CDataLoader(void);
  64. public:
  65.     CDataLoader(const string& loader_name);
  66.     virtual ~CDataLoader(void);
  67. public:
  68.     enum EChoice {
  69.         eBlob,        // whole seqentry
  70.         eBioseq,      // whole bioseq
  71.         eCore,        // everything except bioseqs & annotations
  72.         eBioseqCore,  // bioseq without seqdata and annotations
  73.         eSequence,    // seq data 
  74.         eFeatures,    // SeqFeatures
  75.         eGraph,       // SeqGraph 
  76.         eAlign,       // SeqAlign 
  77.         eAnnot,       // all annotations
  78.         eAll          // whatever fits location
  79.     };
  80.     
  81.     // Request from a datasource for data specified in "choice".
  82.     // The data loaded will be sent back to the datasource through
  83.     // CDataSource::AppendXXX() methods.
  84.     //### virtual bool GetRecords(const CSeq_loc& loc, EChoice choice) = 0;
  85.     
  86.     typedef CConstRef<CTSE_Info> TTSE_Lock;
  87.     typedef set<TTSE_Lock>       TTSE_LockSet;
  88.     // Request from a datasource using handles and ranges instead of seq-loc
  89.     // The TSEs loaded in this call will be added to the tse_set.
  90.     virtual void GetRecords(const CSeq_id_Handle& idh, EChoice choice) = 0;
  91.     virtual void GetChunk(CTSE_Chunk_Info& chunk_info);
  92.     
  93.     // 
  94.     virtual void DropTSE(const CTSE_Info& tse_info);
  95.     
  96.     // Specify datasource to send loaded data to.
  97.     void SetTargetDataSource(CDataSource& data_source);
  98.     
  99.     string GetName(void) const;
  100.     
  101.     // Resolve TSE conflict
  102.     // *select the best TSE from the set of dead TSEs.
  103.     // *select the live TSE from the list of live TSEs
  104.     //  and mark the others one as dead.
  105.     virtual CConstRef<CTSE_Info> ResolveConflict(const CSeq_id_Handle&,
  106.                                                  const TTSE_LockSet&);
  107.     virtual void GC(void);
  108.     virtual void DebugDump(CDebugDumpContext, unsigned int) const;
  109. protected:
  110.     void SetName(const string& loader_name);
  111.     CDataSource* GetDataSource(void);
  112.     
  113. private:
  114.     CDataLoader(const CDataLoader&);
  115.     CDataLoader& operator=(const CDataLoader&);
  116.     string       m_Name;
  117.     CDataSource* m_DataSource;
  118.     
  119.     friend class CObjectManager;
  120. };
  121. END_SCOPE(objects)
  122. END_NCBI_SCOPE
  123. /*
  124. * ---------------------------------------------------------------------------
  125. * $Log: data_loader.hpp,v $
  126. * Revision 1000.1  2003/12/02 20:30:44  gouriano
  127. * PRODUCTION: UPGRADED [ORIGINAL] Dev-tree R1.25
  128. *
  129. * Revision 1.25  2003/11/26 17:55:52  vasilche
  130. * Implemented ID2 split in ID1 cache.
  131. * Fixed loading of splitted annotations.
  132. *
  133. * Revision 1.24  2003/10/07 13:43:22  vasilche
  134. * Added proper handling of named Seq-annots.
  135. * Added feature search from named Seq-annots.
  136. * Added configurable adaptive annotation search (default: gene, cds, mrna).
  137. * Fixed selection of blobs for loading from GenBank.
  138. * Added debug checks to CSeq_id_Mapper for easier finding lost CSeq_id_Handles.
  139. * Fixed leaked split chunks annotation stubs.
  140. * Moved some classes definitions in separate *.cpp files.
  141. *
  142. * Revision 1.23  2003/09/30 16:21:59  vasilche
  143. * Updated internal object manager classes to be able to load ID2 data.
  144. * SNP blobs are loaded as ID2 split blobs - readers convert them automatically.
  145. * Scope caches results of requests for data to data loaders.
  146. * Optimized CSeq_id_Handle for gis.
  147. * Optimized bioseq lookup in scope.
  148. * Reduced object allocations in annotation iterators.
  149. * CScope is allowed to be destroyed before other objects using this scope are
  150. * deleted (feature iterators, bioseq handles etc).
  151. * Optimized lookup for matching Seq-ids in CSeq_id_Mapper.
  152. * Added 'adaptive' option to objmgr_demo application.
  153. *
  154. * Revision 1.22  2003/07/17 20:07:55  vasilche
  155. * Reduced memory usage by feature indexes.
  156. * SNP data is loaded separately through PUBSEQ_OS.
  157. * String compression for SNP data.
  158. *
  159. * Revision 1.21  2003/06/19 18:23:44  vasilche
  160. * Added several CXxx_ScopeInfo classes for CScope related information.
  161. * CBioseq_Handle now uses reference to CBioseq_ScopeInfo.
  162. * Some fine tuning of locking in CScope.
  163. *
  164. * Revision 1.20  2003/06/02 16:01:36  dicuccio
  165. * Rearranged include/objects/ subtree.  This includes the following shifts:
  166. *     - include/objects/alnmgr --> include/objtools/alnmgr
  167. *     - include/objects/cddalignview --> include/objtools/cddalignview
  168. *     - include/objects/flat --> include/objtools/flat
  169. *     - include/objects/objmgr/ --> include/objmgr/
  170. *     - include/objects/util/ --> include/objmgr/util/
  171. *     - include/objects/validator --> include/objtools/validator
  172. *
  173. * Revision 1.19  2003/05/20 15:44:37  vasilche
  174. * Fixed interaction of CDataSource and CDataLoader in multithreaded app.
  175. * Fixed some warnings on WorkShop.
  176. * Added workaround for memory leak on WorkShop.
  177. *
  178. * Revision 1.18  2003/05/06 18:54:06  grichenk
  179. * Moved TSE filtering from CDataSource to CScope, changed
  180. * some filtering rules (e.g. priority is now more important
  181. * than scope history). Added more caches to CScope.
  182. *
  183. * Revision 1.17  2003/04/29 19:51:12  vasilche
  184. * Fixed interaction of Data Loader garbage collector and TSE locking mechanism.
  185. * Made some typedefs more consistent.
  186. *
  187. * Revision 1.16  2003/04/25 14:23:46  vasilche
  188. * Added explicit constructors, destructor and assignment operator to make it compilable on MSVC DLL.
  189. *
  190. * Revision 1.15  2003/04/24 16:12:37  vasilche
  191. * Object manager internal structures are splitted more straightforward.
  192. * Removed excessive header dependencies.
  193. *
  194. * Revision 1.14  2003/03/21 19:22:48  grichenk
  195. * Redesigned TSE locking, replaced CTSE_Lock with CRef<CTSE_Info>.
  196. *
  197. * Revision 1.13  2002/12/26 20:51:35  dicuccio
  198. * Added Win32 export specifier
  199. *
  200. * Revision 1.12  2002/08/28 17:05:13  vasilche
  201. * Remove virtual inheritance
  202. *
  203. * Revision 1.11  2002/06/30 03:27:38  vakatov
  204. * Get rid of warnings, ident the code, move CVS logs to the end of file
  205. *
  206. * Revision 1.10  2002/06/04 17:18:32  kimelman
  207. * memory cleanup :  new/delete/Cref rearrangements
  208. *
  209. * Revision 1.9  2002/05/14 20:06:23  grichenk
  210. * Improved CTSE_Info locking by CDataSource and CDataLoader
  211. *
  212. * Revision 1.8  2002/05/06 03:30:35  vakatov
  213. * OM/OM1 renaming
  214. *
  215. * Revision 1.7  2002/03/30 19:37:05  kimelman
  216. * gbloader MT test
  217. *
  218. * Revision 1.6  2002/03/20 04:50:34  kimelman
  219. * GB loader added
  220. *
  221. * Revision 1.5  2002/03/18 23:05:18  kimelman
  222. * comments
  223. *
  224. * Revision 1.4  2002/03/18 17:26:32  grichenk
  225. * +CDataLoader::x_GetSeq_id(), x_GetSeq_id_Key(), x_GetSeq_id_Handle()
  226. *
  227. * Revision 1.3  2002/03/11 21:10:11  grichenk
  228. * +CDataLoader::ResolveConflict()
  229. *
  230. * Revision 1.2  2002/02/21 19:27:00  grichenk
  231. * Rearranged includes. Added scope history. Added searching for the
  232. * best seq-id match in data sources and scopes. Updated tests.
  233. *
  234. * Revision 1.1  2002/01/11 19:04:00  gouriano
  235. * restructured objmgr
  236. *
  237. * ===========================================================================
  238. */
  239. #endif  // OBJECTS_OBJMGR___DATA_LOADER__HPP