DTDScanner.hpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:13k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2003 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: DTDScanner.hpp,v $
  58.  * Revision 1.8  2003/05/16 21:43:19  knoaman
  59.  * Memory manager implementation: Modify constructors to pass in the memory manager.
  60.  *
  61.  * Revision 1.7  2003/05/15 18:54:51  knoaman
  62.  * Partial implementation of the configurable memory manager.
  63.  *
  64.  * Revision 1.6  2003/02/05 22:07:09  tng
  65.  * [Bug 3111] Problem with LexicalHandler::startDTD() and LexicalHandler::endDTD().
  66.  *
  67.  * Revision 1.5  2002/12/04 02:47:25  knoaman
  68.  * scanner re-organization.
  69.  *
  70.  * Revision 1.4  2002/11/04 14:50:40  tng
  71.  * C++ Namespace Support.
  72.  *
  73.  * Revision 1.3  2002/07/11 18:39:48  knoaman
  74.  * Access entities through the DTDGrammar instead of the scanner.
  75.  *
  76.  * Revision 1.2  2002/05/30 16:17:19  tng
  77.  * Add feature to optionally ignore external DTD.
  78.  *
  79.  * Revision 1.1.1.1  2002/02/01 22:22:44  peiyongz
  80.  * sane_include
  81.  *
  82.  * Revision 1.4  2001/06/21 14:25:56  knoaman
  83.  * Fix for bug 1946
  84.  *
  85.  * Revision 1.3  2001/05/11 13:27:10  tng
  86.  * Copyright update.
  87.  *
  88.  * Revision 1.2  2001/04/19 18:17:22  tng
  89.  * Schema: SchemaValidator update, and use QName in Content Model
  90.  *
  91.  * Revision 1.1  2001/03/21 21:56:20  tng
  92.  * Schema: Add Schema Grammar, Schema Validator, and split the DTDValidator into DTDValidator, DTDScanner, and DTDGrammar.
  93.  *
  94.  */
  95. #if !defined(DTDSCANNER_HPP)
  96. #define DTDSCANNER_HPP
  97. #include <xercesc/validators/DTD/DTDGrammar.hpp>
  98. #include <xercesc/validators/DTD/DTDEntityDecl.hpp>
  99. XERCES_CPP_NAMESPACE_BEGIN
  100. class XMLScanner;
  101. /*
  102.  * Default implementation of an XML DTD scanner.
  103.  */
  104. class DocTypeHandler;
  105. class VALIDATORS_EXPORT DTDScanner : public XMemory
  106. {
  107. public:
  108.     // -----------------------------------------------------------------------
  109.     //  Class specific types
  110.     //
  111.     //  EntityExpRes
  112.     //      Returned from scanEntityRef() to indicate how the expanded text
  113.     //      was treated.
  114.     //
  115.     //  IDTypes
  116.     //      Type of the ID
  117.     // -----------------------------------------------------------------------
  118.     enum EntityExpRes
  119.     {
  120.         EntityExp_Failed
  121.         , EntityExp_Pushed
  122.         , EntityExp_Returned
  123.     };
  124.     enum IDTypes
  125.     {
  126.         IDType_Public
  127.         , IDType_External
  128.         , IDType_Either
  129.     };
  130.     // -----------------------------------------------------------------------
  131.     //  Constructors and Destructor
  132.     // -----------------------------------------------------------------------
  133.     DTDScanner
  134.     (
  135.           DTDGrammar*           dtdGrammar
  136.         , DocTypeHandler* const docTypeHandler
  137.         , MemoryManager* const  manager = XMLPlatformUtils::fgMemoryManager
  138.     );
  139.     virtual ~DTDScanner();
  140.     // -----------------------------------------------------------------------
  141.     //  Getter methods
  142.     // -----------------------------------------------------------------------
  143.     DocTypeHandler* getDocTypeHandler();
  144.     const DocTypeHandler* getDocTypeHandler() const;
  145.     // -----------------------------------------------------------------------
  146.     //  Setter methods
  147.     //
  148.     //  setScannerInfo() is called by the scanner to tell the DTDScanner
  149.     //  about the stuff it needs to have access to.
  150.     // -----------------------------------------------------------------------
  151.     void setScannerInfo
  152.     (
  153.         XMLScanner* const           owningScanner
  154.         , ReaderMgr* const          readerMgr
  155.         , XMLBufferMgr* const       bufMgr
  156.     );
  157.     void setDocTypeHandler
  158.     (
  159.             DocTypeHandler* const handlerToSet
  160.     );
  161.     void scanExtSubsetDecl(const bool inIncludeSect, const bool isDTD);
  162.     bool scanInternalSubset();
  163.     bool scanId
  164.     (
  165.                 XMLBuffer&  pubIdToFill
  166.         ,       XMLBuffer&  sysIdToFill
  167.         , const IDTypes     whatKind
  168.     );
  169. private:
  170.     // -----------------------------------------------------------------------
  171.     //  Private DTD scanning methods. These are all in XMLValidator2.cpp
  172.     // -----------------------------------------------------------------------
  173.     bool checkForPERef
  174.     (
  175.         const   bool    spaceRequired
  176.         , const bool    inLiteral
  177.         , const bool    inMarkup
  178.         , const bool    throwEndOfExt = false
  179.     );
  180.     bool expandPERef
  181.     (
  182.         const   bool    scanExternal
  183.         , const bool    inLiteral
  184.         , const bool    inMarkup
  185.         , const bool    throwEndOfExt = false
  186.     );
  187.     bool getQuotedString(XMLBuffer& toFill);
  188.     XMLAttDef* scanAttDef(DTDElementDecl& elemDecl, XMLBuffer& bufToUse);
  189.     bool scanAttValue
  190.     (
  191.         const   XMLCh* const        attrName
  192.         ,       XMLBuffer&          toFill
  193.         , const XMLAttDef::AttTypes type
  194.     );
  195.     void scanAttListDecl();
  196.     ContentSpecNode* scanChildren
  197.     (
  198.         const   DTDElementDecl&     elemDecl
  199.         ,       XMLBuffer&          bufToUse
  200.     );
  201.     bool scanCharRef(XMLCh& toFill, XMLCh& second);
  202.     void scanComment();
  203.     bool scanContentSpec(DTDElementDecl& toFill);
  204.     void scanDefaultDecl(DTDAttDef& toFill);
  205.     void scanElementDecl();
  206.     void scanEntityDecl();
  207.     bool scanEntityDef();
  208.     bool scanEntityLiteral(XMLBuffer& toFill, const bool isPE);
  209.     bool scanEntityDef(DTDEntityDecl& decl, const bool isPEDecl);
  210.     EntityExpRes scanEntityRef(XMLCh& firstCh, XMLCh& secondCh, bool& escaped);
  211.     bool scanEnumeration
  212.     (
  213.         const   DTDAttDef&  attDef
  214.         ,       XMLBuffer&  toFill
  215.         , const bool        notation
  216.     );
  217.     bool scanEq();
  218.     void scanIgnoredSection();
  219.     void scanMarkupDecl(const bool parseTextDecl);
  220.     bool scanMixed(DTDElementDecl& toFill);
  221.     void scanNotationDecl();
  222.     void scanPI();
  223.     bool scanPublicLiteral(XMLBuffer& toFill);
  224.     bool scanSystemLiteral(XMLBuffer& toFill);
  225.     void scanTextDecl();
  226.     bool isReadingExternalEntity();
  227.     // -----------------------------------------------------------------------
  228.     //  Private data members
  229.     //
  230.     //  fDocTypeHandler
  231.     //      This holds the optional doc type handler that can be installed
  232.     //      and used to call back for all markup events. It is DTD specific.
  233.     //
  234.     //  fDumAttDef
  235.     //  fDumElemDecl
  236.     //  fDumEntityDecl
  237.     //      These are dummy objects into which mark decls are parsed when
  238.     //      they are just overrides of previously declared markup decls. In
  239.     //      such situations, the first one wins but we need to have somewhere
  240.     //      to parse them into. So these are lazily created and used as needed
  241.     //      when such markup decls are seen.
  242.     //
  243.     //  fInternalSubset
  244.     //      This is used to track whether we are in the internal subset or not,
  245.     //      in which case we are in the external subset.
  246.     //
  247.     //  fNextAttrId
  248.     //      Since att defs are per-element, we don't have a validator wide
  249.     //      attribute def pool. So we use a simpler data structure in each
  250.     //      element decl to store its att defs, and we use this simple counter
  251.     //      to apply a unique id to each new attribute.
  252.     //
  253.     //  fDTDGrammar
  254.     //      The DTD information we scanned like element decl, attribute decl
  255.     //      are stored in this Grammar.
  256.     //
  257.     //  fBufMgr
  258.     //      This is the buffer manager of the scanner. This is provided as a
  259.     //      convenience so that the DTDScanner doesn't have to create its own
  260.     //      buffer manager during the parse process.
  261.     //
  262.     //  fReaderMgr
  263.     //      This is a pointer to the reader manager that is being used by the scanner.
  264.     //
  265.     //  fScanner
  266.     //      The pointer to the scanner to which this DTDScanner belongs
  267.     //
  268.     //  fPEntityDeclPool
  269.     //      This is a pool of EntityDecl objects, which contains all of the
  270.     //      parameter entities that are declared in the DTD subsets.
  271.     //
  272.     //  fEmptyNamespaceId
  273.     //      The uri for all DTD decls
  274.     //
  275.     //  fDocTypeReaderId
  276.     //      The original reader in the fReaderMgr - to be compared against the
  277.     //      current reader to decide whether we are processing an external/internal
  278.     //      declaration
  279.     // -----------------------------------------------------------------------
  280.     MemoryManager*                  fMemoryManager;
  281.     DocTypeHandler*                 fDocTypeHandler;
  282.     DTDAttDef*                      fDumAttDef;
  283.     DTDElementDecl*                 fDumElemDecl;
  284.     DTDEntityDecl*                  fDumEntityDecl;
  285.     bool                            fInternalSubset;
  286.     unsigned int                    fNextAttrId;
  287.     DTDGrammar*                     fDTDGrammar;
  288.     XMLBufferMgr*                   fBufMgr;
  289.     ReaderMgr*                      fReaderMgr;
  290.     XMLScanner*                     fScanner;
  291.     NameIdPool<DTDEntityDecl>*      fPEntityDeclPool;
  292.     unsigned int                    fEmptyNamespaceId;
  293.     unsigned int                    fDocTypeReaderId;
  294. };
  295. // ---------------------------------------------------------------------------
  296. //  DTDScanner: Getter methods
  297. // ---------------------------------------------------------------------------
  298. inline DocTypeHandler* DTDScanner::getDocTypeHandler()
  299. {
  300.     return fDocTypeHandler;
  301. }
  302. inline const DocTypeHandler* DTDScanner::getDocTypeHandler() const
  303. {
  304.     return fDocTypeHandler;
  305. }
  306. // ---------------------------------------------------------------------------
  307. //  DTDScanner: Setter methods
  308. // ---------------------------------------------------------------------------
  309. inline void DTDScanner::setDocTypeHandler(DocTypeHandler* const handlerToSet)
  310. {
  311.     fDocTypeHandler = handlerToSet;
  312. }
  313. // -----------------------------------------------------------------------
  314. //  Helper methods
  315. // -----------------------------------------------------------------------
  316. inline bool DTDScanner::isReadingExternalEntity() {
  317.     return (fDocTypeReaderId != fReaderMgr->getCurrentReaderNum());
  318. }
  319. XERCES_CPP_NAMESPACE_END
  320. #endif