lds_reader.cpp
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:6k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: lds_reader.cpp,v $
  4.  * PRODUCTION Revision 1000.1  2004/06/01 19:45:52  gouriano
  5.  * PRODUCTION PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.6
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: lds_reader.cpp,v 1000.1 2004/06/01 19:45:52 gouriano Exp $
  10.  * ===========================================================================
  11.  *
  12.  *                            PUBLIC DOMAIN NOTICE
  13.  *               National Center for Biotechnology Information
  14.  *
  15.  *  This software/database is a "United States Government Work" under the
  16.  *  terms of the United States Copyright Act.  It was written as part of
  17.  *  the author's official duties as a United States Government employee and
  18.  *  thus cannot be copyrighted.  This software/database is freely available
  19.  *  to the public for use. The National Library of Medicine and the U.S.
  20.  *  Government have not placed any restriction on its use or reproduction.
  21.  *
  22.  *  Although all reasonable efforts have been taken to ensure the accuracy
  23.  *  and reliability of the software and data, the NLM and the U.S.
  24.  *  Government do not and cannot warrant the performance or results that
  25.  *  may be obtained by using this software or data. The NLM and the U.S.
  26.  *  Government disclaim all warranties, express or implied, including
  27.  *  warranties of performance, merchantability or fitness for any particular
  28.  *  purpose.
  29.  *
  30.  *  Please cite the author in any work or product based on this material.
  31.  *
  32.  * ===========================================================================
  33.  *
  34.  * Author: Anatoliy Kuznetsov
  35.  *
  36.  * File Description:  LDS reader implementation.
  37.  *
  38.  */
  39. #include <ncbi_pch.hpp>
  40. #include <corelib/ncbifile.hpp>
  41. #include <util/format_guess.hpp>
  42. #include <bdb/bdb_cursor.hpp>
  43. #include <serial/objistr.hpp>
  44. #include <objects/seq/Bioseq.hpp>
  45. #include <objects/seqalign/Seq_align.hpp>
  46. #include <objmgr/util/obj_sniff.hpp>
  47. #include <objtools/readers/fasta.hpp>
  48. #include <objtools/lds/lds_reader.hpp>
  49. #include <objtools/lds/lds_db.hpp>
  50. #include <objtools/lds/lds_expt.hpp>
  51. #include <objtools/lds/lds_query.hpp>
  52. BEGIN_NCBI_SCOPE
  53. BEGIN_SCOPE(objects)
  54. CRef<CSeq_entry> LDS_LoadTSE(SLDS_TablesCollection& db, 
  55.                              const map<string, int>& type_map,
  56.                              int object_id)
  57. {
  58.     CLDS_Query query(db);
  59.     CLDS_Query::SObjectDescr obj_descr = 
  60.         query.GetObjectDescr(type_map, object_id, true);
  61.     if (!obj_descr.is_object || obj_descr.id <= 0) {
  62.         return CRef<CSeq_entry>();
  63.     }
  64.     CNcbiIfstream in(obj_descr.file_name.c_str(), 
  65.                      IOS_BASE::in | IOS_BASE::binary);
  66.     if (!in.is_open()) {
  67.         string msg = "Cannot open file:";
  68.         msg.append(obj_descr.file_name);
  69.         LDS_THROW(eFileNotFound, msg);
  70.     }
  71.     switch (obj_descr.format) {
  72.     case CFormatGuess::eFasta:
  73.         return ReadFasta(in, fReadFasta_AssumeNuc);
  74.     case CFormatGuess::eTextASN:
  75.     case CFormatGuess::eXml:
  76.     case CFormatGuess::eBinaryASN:
  77.         {
  78.         in.seekg(obj_descr.offset);
  79.         auto_ptr<CObjectIStream> 
  80.           is(CObjectIStream::Open(FormatGuess2Serial(obj_descr.format), in));
  81.         if (obj_descr.type_str == "Bioseq") {
  82.             //
  83.             // If object is a bare Bioseq: read it and 
  84.             // construct a Seq_entry on it
  85.             //
  86.             CRef<CBioseq> bioseq(new CBioseq());
  87.             is->Read(ObjectInfo(*bioseq));
  88.             CRef<CSeq_entry> seq_entry(new CSeq_entry());
  89.             seq_entry->SetSeq(*bioseq);
  90.             return seq_entry;
  91.         } else 
  92.         if (obj_descr.type_str == "Seq-entry") {
  93.             CRef<CSeq_entry> seq_entry(new CSeq_entry());
  94.             is->Read(ObjectInfo(*seq_entry));
  95.             return seq_entry;
  96.         } else {
  97.             LDS_THROW(eInvalidDataType, "Non Seq-entry object type");
  98.         }
  99.         }
  100.         break;
  101.     default:
  102.         LDS_THROW(eNotImplemented, "Not implemeneted yet.");
  103.     }
  104. }
  105. CRef<CSeq_annot> LDS_LoadAnnot(SLDS_TablesCollection& lds_db, 
  106.                                const CLDS_Query::SObjectDescr& obj_descr)
  107. {
  108.     CNcbiIfstream in(obj_descr.file_name.c_str(), 
  109.                      IOS_BASE::in | IOS_BASE::binary);
  110.     if (!in.is_open()) {
  111.         string msg = "Cannot open file:";
  112.         msg.append(obj_descr.file_name);
  113.         LDS_THROW(eFileNotFound, msg);
  114.     }
  115.     switch (obj_descr.format) {
  116.     case CFormatGuess::eTextASN:
  117.     case CFormatGuess::eXml:
  118.     case CFormatGuess::eBinaryASN:
  119.         {
  120.         in.seekg(obj_descr.offset);
  121.         auto_ptr<CObjectIStream> 
  122.           is(CObjectIStream::Open(FormatGuess2Serial(obj_descr.format), in));
  123.         if (obj_descr.type_str == "Seq-annot") {
  124.             //
  125.             // If object is a bare Bioseq: read it and 
  126.             // construct a Seq_entry on it
  127.             //
  128.             CRef<CSeq_annot> annot(new CSeq_annot());
  129.             is->Read(ObjectInfo(*annot));
  130.             return annot;
  131.         } else 
  132.         if (obj_descr.type_str == "Seq-align") {
  133.             CRef<CSeq_align> align(new CSeq_align());
  134.             is->Read(ObjectInfo(*align));
  135.             CRef<CSeq_annot> annot(new CSeq_annot());
  136.             annot->SetData().SetAlign().push_back(align);
  137.             return annot;
  138.         } else {
  139.             LDS_THROW(eInvalidDataType, 
  140.                       "Non Seq-aanot compatible object type");
  141.         }
  142.         }
  143.         break;
  144.     default:
  145.         LDS_THROW(eNotImplemented, "Invalid file format");
  146.     }
  147.     
  148. }
  149. END_SCOPE(objects)
  150. END_NCBI_SCOPE
  151. /*
  152.  * ===========================================================================
  153.  * $Log: lds_reader.cpp,v $
  154.  * Revision 1000.1  2004/06/01 19:45:52  gouriano
  155.  * PRODUCTION: UPGRADED [GCC34_MSVC7] Dev-tree R1.6
  156.  *
  157.  * Revision 1.6  2004/05/21 21:42:55  gorelenk
  158.  * Added PCH ncbi_pch.hpp
  159.  *
  160.  * Revision 1.5  2003/07/14 19:47:01  kuznets
  161.  * + new annotation reader
  162.  *
  163.  * Revision 1.4  2003/07/10 20:10:09  kuznets
  164.  * Code clean up
  165.  *
  166.  * Revision 1.3  2003/06/23 18:57:31  kuznets
  167.  * LDS_LoadTSE corrected to read XML serialization format.
  168.  *
  169.  * Revision 1.2  2003/06/09 18:06:33  kuznets
  170.  * CSeq_entry reader changed to handle top level CBioseqs.
  171.  *
  172.  * Revision 1.1  2003/06/06 20:02:34  kuznets
  173.  * Initial revision
  174.  *
  175.  *
  176.  * ===========================================================================
  177.  */