IGXMLScanner.hpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:13k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 2002 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: IGXMLScanner.hpp,v $
  58.  * Revision 1.7  2003/05/22 02:10:51  knoaman
  59.  * Default the memory manager.
  60.  *
  61.  * Revision 1.6  2003/05/15 18:26:29  knoaman
  62.  * Partial implementation of the configurable memory manager.
  63.  *
  64.  * Revision 1.5  2003/03/07 18:08:58  tng
  65.  * Return a reference instead of void for operator=
  66.  *
  67.  * Revision 1.4  2003/01/29 19:59:35  gareth
  68.  * we now detect when elements and attributes are validated/ the result of the validation and store that information.
  69.  *
  70.  * Revision 1.3  2003/01/15 15:49:49  knoaman
  71.  * Change constant declaration name to match its value.
  72.  *
  73.  * Revision 1.2  2003/01/13 16:30:18  knoaman
  74.  * [Bug 14469] Validator doesn't enforce xsd:key.
  75.  *
  76.  * Revision 1.1  2002/12/04 02:05:25  knoaman
  77.  * Initial checkin.
  78.  *
  79.  */
  80. #if !defined(IGXMLSCANNER_HPP)
  81. #define IGXMLSCANNER_HPP
  82. #include <xercesc/internal/XMLScanner.hpp>
  83. #include <xercesc/internal/ElemStack.hpp>
  84. #include <xercesc/util/KVStringPair.hpp>
  85. #include <xercesc/validators/common/Grammar.hpp>
  86. #include <xercesc/validators/schema/SchemaElementDecl.hpp>
  87. XERCES_CPP_NAMESPACE_BEGIN
  88. class DTDGrammar;
  89. class DTDValidator;
  90. class SchemaValidator;
  91. class ValueStoreCache;
  92. class XPathMatcherStack;
  93. class FieldActivator;
  94. class IdentityConstraint;
  95. class ContentLeafNameTypeVector;
  96. class SchemaAttDef;
  97. class XMLContentModel;
  98. //  This is an integrated scanner class, which does DTD/XML Schema grammar
  99. //  processing.
  100. class XMLPARSER_EXPORT IGXMLScanner : public XMLScanner
  101. {
  102. public :
  103.     // -----------------------------------------------------------------------
  104.     //  Constructors and Destructor
  105.     // -----------------------------------------------------------------------
  106.     IGXMLScanner
  107.     (
  108.         XMLValidator* const valToAdopt
  109.         , MemoryManager* const manager = XMLPlatformUtils::fgMemoryManager
  110.     );
  111.     IGXMLScanner
  112.     (
  113.           XMLDocumentHandler* const docHandler
  114.         , DocTypeHandler* const     docTypeHandler
  115.         , XMLEntityHandler* const   entityHandler
  116.         , XMLErrorReporter* const   errReporter
  117.         , XMLValidator* const       valToAdopt
  118.         , MemoryManager* const      manager = XMLPlatformUtils::fgMemoryManager
  119.     );
  120.     virtual ~IGXMLScanner();
  121.     // -----------------------------------------------------------------------
  122.     //  XMLScanner public virtual methods
  123.     // -----------------------------------------------------------------------
  124.     virtual const XMLCh* getName() const;
  125.     virtual NameIdPool<DTDEntityDecl>* getEntityDeclPool();
  126.     virtual const NameIdPool<DTDEntityDecl>* getEntityDeclPool() const;
  127.     virtual unsigned int resolveQName
  128.     (
  129.         const   XMLCh* const        qName
  130.         ,       XMLBuffer&          prefixBufToFill
  131.         , const short               mode
  132.         ,       int&                prefixColonPos
  133.     );
  134.     virtual void scanDocument
  135.     (
  136.         const   InputSource&    src
  137.     );
  138.     virtual bool scanNext(XMLPScanToken& toFill);
  139.     virtual Grammar* loadGrammar
  140.     (
  141.         const   InputSource&    src
  142.         , const short           grammarType
  143.         , const bool            toCache = false
  144.     );
  145. private :
  146.     // -----------------------------------------------------------------------
  147.     //  Unimplemented constructors and operators
  148.     // -----------------------------------------------------------------------
  149.     IGXMLScanner();
  150.     IGXMLScanner(const IGXMLScanner&);
  151.     IGXMLScanner& operator=(const IGXMLScanner&);
  152.     // -----------------------------------------------------------------------
  153.     //  XMLScanner virtual methods
  154.     // -----------------------------------------------------------------------
  155.     virtual void scanCDSection();
  156.     virtual void scanCharData(XMLBuffer& toToUse);
  157.     virtual EntityExpRes scanEntityRef
  158.     (
  159.         const   bool    inAttVal
  160.         ,       XMLCh&  firstCh
  161.         ,       XMLCh&  secondCh
  162.         ,       bool&   escaped
  163.     );
  164.     virtual void scanDocTypeDecl();
  165.     virtual void scanReset(const InputSource& src);
  166.     virtual void sendCharData(XMLBuffer& toSend);
  167.     // -----------------------------------------------------------------------
  168.     //  Private helper methods
  169.     // -----------------------------------------------------------------------
  170.     void commonInit();
  171.     void cleanUp();
  172.     InputSource* resolveSystemId(const XMLCh* const sysId); // return owned by caller
  173.     // Spaces are not allowed in URI, so %20 is used instead.
  174.     // Convert %20 to spaces before resolving the URI
  175.     void normalizeURI(const XMLCh* const systemURI, XMLBuffer& normalizedURI);
  176.     unsigned int buildAttList
  177.     (
  178.         const   RefVectorOf<KVStringPair>&  providedAttrs
  179.         , const unsigned int                attCount
  180.         ,       XMLElementDecl*             elemDecl
  181.         ,       RefVectorOf<XMLAttr>&       toFill
  182.     );
  183.     bool normalizeAttValue
  184.     (
  185.         const   XMLAttDef* const    attDef
  186.         , const XMLCh* const        value
  187.         ,       XMLBuffer&          toFill
  188.     );
  189.     bool normalizeAttRawValue
  190.     (
  191.         const   XMLCh* const        attrName
  192.         , const XMLCh* const        value
  193.         ,       XMLBuffer&          toFill
  194.     );
  195.     unsigned int resolvePrefix
  196.     (
  197.         const   XMLCh* const        prefix
  198.         , const ElemStack::MapModes mode
  199.     );
  200.     unsigned int resolvePrefix
  201.     (
  202.         const   XMLCh* const        prefix
  203.         ,       XMLBuffer&          uriBufToFill
  204.         , const ElemStack::MapModes mode
  205.     );
  206.     void updateNSMap
  207.     (
  208.         const   XMLCh* const    attrName
  209.         , const XMLCh* const    attrValue
  210.     );
  211.     void scanRawAttrListforNameSpaces(const RefVectorOf<KVStringPair>* theRawAttrList, int attCount);
  212.     void parseSchemaLocation(const XMLCh* const schemaLocationStr);
  213.     void resolveSchemaGrammar(const XMLCh* const loc, const XMLCh* const uri);
  214.     bool switchGrammar(const XMLCh* const newGrammarNameSpace);
  215.     bool laxElementValidation(QName* element, ContentLeafNameTypeVector* cv,
  216.                               const XMLContentModel* const cm,
  217.                               const unsigned int parentElemDepth);
  218.     bool anyAttributeValidation(SchemaAttDef* attWildCard,
  219.                                 unsigned int uriId,
  220.                                 bool& skipThisOne,
  221.                                 bool& laxThisOne);
  222.     void resizeElemState();
  223.     // -----------------------------------------------------------------------
  224.     //  Private scanning methods
  225.     // -----------------------------------------------------------------------
  226.     bool basicAttrValueScan
  227.     (
  228.         const   XMLCh* const    attrName
  229.         ,       XMLBuffer&      toFill
  230.     );
  231.     unsigned int rawAttrScan
  232.     (
  233.         const   XMLCh* const                elemName
  234.         ,       RefVectorOf<KVStringPair>&  toFill
  235.         ,       bool&                       isEmpty
  236.     );
  237.     bool scanAttValue
  238.     (
  239.         const   XMLAttDef* const    attDef
  240.         ,       XMLBuffer&          toFill
  241.     );
  242.     bool scanContent(const bool extEntity);
  243.     void scanEndTag(bool& gotData);
  244.     bool scanStartTag(bool& gotData);
  245.     bool scanStartTagNS(bool& gotData);
  246.     // -----------------------------------------------------------------------
  247.     //  IdentityConstraints Activation methods
  248.     // -----------------------------------------------------------------------
  249.     void activateSelectorFor(IdentityConstraint* const ic, const int initialDepth);
  250.     // -----------------------------------------------------------------------
  251.     //  Grammar preparsing methods
  252.     // -----------------------------------------------------------------------
  253.     Grammar* loadXMLSchemaGrammar(const InputSource& src, const bool toCache = false);
  254.     Grammar* loadDTDGrammar(const InputSource& src, const bool toCache = false);
  255.     // -----------------------------------------------------------------------
  256.     //  Data members
  257.     //
  258.     //  fElemStack
  259.     //      This is the element stack that is used to track the elements that
  260.     //      are currently being worked on.
  261.     //
  262.     //  fRawAttrList
  263.     //      During the initial scan of the attributes we can only do a raw
  264.     //      scan for key/value pairs. So this vector is used to store them
  265.     //      until they can be processed (and put into fAttrList.)
  266.     //
  267.     //  fDTDValidator
  268.     //      The DTD validator instance.
  269.     //
  270.     //  fSchemaValidator
  271.     //      The Schema validator instance.
  272.     //
  273.     //  fSeeXsi
  274.     //      This flag indicates a schema has been seen.
  275.     //
  276.     //  fElemState
  277.     //  fElemStateSize
  278.     //      Stores an element next state from DFA content model - used for
  279.     //      wildcard validation
  280.     //
  281.     //  fMatcherStack
  282.     //      Stack of active XPath matchers for identity constraints. All
  283.     //      active XPath matchers are notified of startElement, characters
  284.     //      and endElement callbacks in order to perform their matches.
  285.     //
  286.     //  fValueStoreCache
  287.     //      Cache of value stores for identity constraint fields.
  288.     //
  289.     //  fFieldActivator
  290.     //      Activates fields within a certain scope when a selector matches
  291.     //      its xpath.
  292.     //
  293.     // -----------------------------------------------------------------------
  294.     bool                        fSeeXsi;
  295.     Grammar::GrammarType        fGrammarType;
  296.     unsigned int                fElemStateSize;
  297.     unsigned int*               fElemState;
  298.     ElemStack                   fElemStack;
  299.     XMLBuffer                   fContent;
  300.     RefVectorOf<KVStringPair>*  fRawAttrList;
  301.     DTDValidator*               fDTDValidator;
  302.     SchemaValidator*            fSchemaValidator;
  303.     DTDGrammar*                 fDTDGrammar;
  304.     XPathMatcherStack*          fMatcherStack;
  305.     ValueStoreCache*            fValueStoreCache;
  306.     FieldActivator*             fFieldActivator;
  307. };
  308. inline const XMLCh* IGXMLScanner::getName() const
  309. {
  310.     return XMLUni::fgIGXMLScanner;
  311. }
  312. XERCES_CPP_NAMESPACE_END
  313. #endif