XMLDocumentHandler.hpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:14k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 1999-2000 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 1999, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56.  /*
  57.   * $Log: XMLDocumentHandler.hpp,v $
  58.   * Revision 1.5  2003/03/07 18:08:10  tng
  59.   * Return a reference instead of void for operator=
  60.   *
  61.   * Revision 1.4  2002/11/04 15:00:21  tng
  62.   * C++ Namespace Support.
  63.   *
  64.   * Revision 1.3  2002/05/28 20:41:11  tng
  65.   * [Bug 9104] prefixes dissapearing when schema validation turned on.
  66.   *
  67.   * Revision 1.2  2002/02/20 18:17:01  tng
  68.   * [Bug 5977] Warnings on generating apiDocs.
  69.   *
  70.   * Revision 1.1.1.1  2002/02/01 22:21:51  peiyongz
  71.   * sane_include
  72.   *
  73.   * Revision 1.8  2000/03/02 19:54:24  roddey
  74.   * This checkin includes many changes done while waiting for the
  75.   * 1.1.0 code to be finished. I can't list them all here, but a list is
  76.   * available elsewhere.
  77.   *
  78.   * Revision 1.7  2000/02/24 20:00:23  abagchi
  79.   * Swat for removing Log from API docs
  80.   *
  81.   * Revision 1.6  2000/02/16 20:29:20  aruna1
  82.   * API Doc++ summary changes in
  83.   *
  84.   * Revision 1.5  2000/02/16 19:48:56  roddey
  85.   * More documentation updates
  86.   *
  87.   * Revision 1.4  2000/02/15 01:21:30  roddey
  88.   * Some initial documentation improvements. More to come...
  89.   *
  90.   * Revision 1.3  2000/02/09 19:47:27  abagchi
  91.   * Added docs for startElement
  92.   *
  93.   * Revision 1.2  2000/02/06 07:47:48  rahulj
  94.   * Year 2K copyright swat.
  95.   *
  96.   * Revision 1.1.1.1  1999/11/09 01:08:31  twl
  97.   * Initial checkin
  98.   *
  99.   * Revision 1.3  1999/11/08 20:44:37  rahul
  100.   * Swat for adding in Product name and CVS comment log variable.
  101.   *
  102.   */
  103. #if !defined(XMLDOCUMENTHANDLER_HPP)
  104. #define XMLDOCUMENTHANDLER_HPP
  105. #include <xercesc/util/XercesDefs.hpp>
  106. #include <xercesc/util/RefVectorOf.hpp>
  107. #include <xercesc/framework/XMLAttr.hpp>
  108. XERCES_CPP_NAMESPACE_BEGIN
  109. class XMLElementDecl;
  110. class XMLEntityDecl;
  111. /**
  112.   * This abstract class provides the interface for the scanner to return
  113.   * XML document information up to the parser as it scans through the
  114.   * document.
  115.   *
  116.   * The interface is very similar to org.sax.DocumentHandler, but
  117.   * has some extra methods required to get all the data out.
  118.   */
  119. class XMLPARSER_EXPORT XMLDocumentHandler
  120. {
  121. public:
  122.     // -----------------------------------------------------------------------
  123.     //  Constructors are hidden, just the virtual destructor is exposed
  124.     // -----------------------------------------------------------------------
  125.     /** @name Destructor */
  126.     //@{
  127.     virtual ~XMLDocumentHandler()
  128.     {
  129.     }
  130.     //@}
  131.     /** @name The document handler interface */
  132.     //@{
  133.     /** Receive notification of character data.
  134.       *
  135.       * <p>The scanner will call this method to report each chunk of
  136.       * character data. The scanner may return all contiguous character
  137.       * data in a single chunk, or they may split it into several
  138.       * chunks; however, all of the characters in any single event
  139.       * will come from the same external entity, so that the Locator
  140.       * provides useful information.</p>
  141.       *
  142.       * <p>The parser must not attempt to read from the array
  143.       * outside of the specified range.</p>
  144.       *
  145.       * @param  chars           The content (characters) between markup from the XML
  146.       *                         document.
  147.       * @param  length          The number of characters to read from the array.
  148.       * @param  cdataSection    Indicates that this data is inside a CDATA
  149.       *                         section.
  150.       * @see #ignorableWhitespace
  151.       * @see Locator
  152.       */
  153.     virtual void docCharacters
  154.     (
  155.         const   XMLCh* const    chars
  156.         , const unsigned int    length
  157.         , const bool            cdataSection
  158.     ) = 0;
  159.     /** Receive notification of comments in the XML content being parsed.
  160.       *
  161.       * This scanner will call this method for any comments found in the
  162.       * content of the document.
  163.       *
  164.       * @param comment The text of the comment.
  165.       */
  166.     virtual void docComment
  167.     (
  168.         const   XMLCh* const    comment
  169.     ) = 0;
  170.     /** Receive notification of PI's parsed in the XML content.
  171.       *
  172.       * The scanner will call this method for any PIs it finds within the
  173.       * content of the document.
  174.       *
  175.       * @param  target  The name of the PI.
  176.       * @param  data    The body of the PI. This may be an empty string since
  177.       *                 the body is optional.
  178.       */
  179.     virtual void docPI
  180.     (
  181.         const   XMLCh* const    target
  182.         , const XMLCh* const    data
  183.     ) = 0;
  184.     /** Receive notification after the scanner has parsed the end of the
  185.       * document.
  186.       *
  187.       * The scanner will call this method when the current document has been
  188.       * fully parsed. The handler may use this opportunity to do something with
  189.       * the data, clean up temporary data, etc...
  190.       */
  191.     virtual void endDocument() = 0;
  192.     /** Receive notification of the end of an element.
  193.       *
  194.       * This method is called when scanner encounters the end of element tag.
  195.       * There will be a corresponding startElement() event for every
  196.       * endElement() event, but not necessarily the other way around. For
  197.       * empty tags, there is only a startElement() call.
  198.       *
  199.       * @param  elemDecl The name of the element whose end tag was just
  200.       *                     parsed.
  201.       * @param  uriId       The ID of the URI in the URI pool (only valid if
  202.       *                     name spaces is enabled)
  203.       * @param  isRoot      Indicates if this is the root element.
  204.       * @param  prefixName  The string representing the prefix name
  205.       */
  206.     virtual void endElement
  207.     (
  208.         const   XMLElementDecl& elemDecl
  209.         , const unsigned int    uriId
  210.         , const bool            isRoot
  211.         , const XMLCh* const    prefixName = 0
  212.     ) = 0;
  213.     /** Receive notification when a referenced entity's content ends
  214.       *
  215.       * This method is called when scanner encounters the end of an entity
  216.       * reference.
  217.       *
  218.       * @param  entDecl  The name of the entity reference just scanned.
  219.       */
  220.     virtual void endEntityReference
  221.     (
  222.         const   XMLEntityDecl&  entDecl
  223.     ) = 0;
  224.     /** Receive notification of ignorable whitespace in element content.
  225.       *
  226.       * <p>Validating Parsers must use this method to report each chunk
  227.       * of ignorable whitespace (see the W3C XML 1.0 recommendation,
  228.       * section 2.10): non-validating parsers may also use this method
  229.       * if they are capable of parsing and using content models.</p>
  230.       *
  231.       * <p>The scanner may return all contiguous whitespace in a single
  232.       * chunk, or it may split it into several chunks; however, all of
  233.       * the characters in any single event will come from the same
  234.       * external entity, so that the Locator provides useful
  235.       * information.</p>
  236.       *
  237.       * <p>The parser must not attempt to read from the array
  238.       * outside of the specified range.</p>
  239.       *
  240.       * @param  chars       The whitespace characters from the XML document.
  241.       * @param  length      The number of characters to read from the array.
  242.       * @param  cdataSection Indicates that this data is inside a CDATA
  243.       *                     section.
  244.       * @see #characters
  245.       */
  246.     virtual void ignorableWhitespace
  247.     (
  248.         const   XMLCh* const    chars
  249.         , const unsigned int    length
  250.         , const bool            cdataSection
  251.     ) = 0;
  252.     /** Reset the document handler's state, if required
  253.       *
  254.       * This method is used to give the registered document handler a
  255.       * chance to reset itself. Its called by the scanner at the start of
  256.       * every parse.
  257.       */
  258.     virtual void resetDocument() = 0;
  259.     /** Receive notification of the start of a new document
  260.       *
  261.       * This method is the first callback called the scanner at the
  262.       * start of every parse. This is before any content is parsed.
  263.       */
  264.     virtual void startDocument() = 0;
  265.     /** Receive notification of a new start tag
  266.       *
  267.       * This method is called when scanner encounters the start of an element tag.
  268.       * All elements must always have a startElement() tag. Empty tags will
  269.       * only have the startElement() tag and no endElement() tag.
  270.       *
  271.       * @param  elemDecl The name of the element whose start tag was just
  272.       *                     parsed.
  273.       * @param  uriId       The ID of the URI in the URI pool (only valid if
  274.       *                     name spaces is enabled)
  275.       * @param  prefixName  The string representing the prefix name
  276.       * @param  attrList    List of attributes in the element
  277.       * @param  attrCount   Count of the attributes in the element
  278.       * @param  isEmpty     Indicates if the element is empty, in which case
  279.       *                     you should not expect an endElement() event.
  280.       * @param  isRoot      Indicates if this is the root element.
  281.       */
  282.     virtual void startElement
  283.     (
  284.         const   XMLElementDecl&         elemDecl
  285.         , const unsigned int            uriId
  286.         , const XMLCh* const            prefixName
  287.         , const RefVectorOf<XMLAttr>&   attrList
  288.         , const unsigned int            attrCount
  289.         , const bool                    isEmpty
  290.         , const bool                    isRoot
  291.     ) = 0;
  292.     /** Receive notification when the scanner hits an entity reference.
  293.       *
  294.       * This is currently useful only to DOM parser configurations as SAX
  295.       * does not provide any api to return this information.
  296.       *
  297.       * @param  entDecl  The name of the entity that was referenced.
  298.       */
  299.     virtual void startEntityReference(const XMLEntityDecl& entDecl) = 0;
  300.     /** Receive notification of an XML declaration
  301.       *
  302.       * Currently neither DOM nor SAX provide API's to return back this
  303.       * information.
  304.       *
  305.       * @param  versionStr      The value of the <code>version</code> attribute
  306.       *                         of the XML decl.
  307.       * @param  encodingStr     The value of the <code>encoding</code> attribute
  308.       *                         of the XML decl.
  309.       * @param  standaloneStr   The value of the <code>standalone</code>
  310.       *                         attribute of the XML decl.
  311.       * @param  autoEncodingStr The encoding string auto-detected by the
  312.       *                         scanner. In absence of any 'encoding' attribute in the
  313.       *                         XML decl, the XML standard specifies how a parser can
  314.       *                         auto-detect. If there is no <code>encodingStr</code>
  315.       *                         this is what will be used to try to decode the file.
  316.       */
  317.     virtual void XMLDecl
  318.     (
  319.         const   XMLCh* const    versionStr
  320.         , const XMLCh* const    encodingStr
  321.         , const XMLCh* const    standaloneStr
  322.         , const XMLCh* const    autoEncodingStr
  323.     ) = 0;
  324.     //@}
  325. protected :
  326.     // -----------------------------------------------------------------------
  327.     //  Hidden Constructors
  328.     // -----------------------------------------------------------------------
  329.     XMLDocumentHandler()
  330.     {
  331.     }
  332. private:
  333.     // -----------------------------------------------------------------------
  334.     //  Unimplemented constructors and operators
  335.     // -----------------------------------------------------------------------
  336.     XMLDocumentHandler(const XMLDocumentHandler&);
  337.     XMLDocumentHandler& operator=(const XMLDocumentHandler&);
  338. };
  339. XERCES_CPP_NAMESPACE_END
  340. #endif