XMLStringTokenizer.hpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:9k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 2001, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Id: XMLStringTokenizer.hpp,v 1.4 2003/05/16 03:11:22 knoaman Exp $
  58.  */
  59. #if !defined(XMLSTRINGTOKENIZER_HPP)
  60. #define XMLSTRINGTOKENIZER_HPP
  61. #include <xercesc/util/RefArrayVectorOf.hpp>
  62. #include <xercesc/util/XMLString.hpp>
  63. XERCES_CPP_NAMESPACE_BEGIN
  64. /**
  65.   * The string tokenizer class breaks a string into tokens.
  66.   *
  67.   * The XMLStringTokenizer methods do not distinguish among identifiers,
  68.   * numbers, and quoted strings, nor do they recognize and skip comments
  69.   *
  70.   * A XMLStringTokenizer object internally maintains a current position within
  71.   * the string to be tokenized. Some operations advance this current position
  72.   * past the characters processed.
  73.   */
  74.   class XMLUTIL_EXPORT XMLStringTokenizer :public XMemory
  75. {
  76. public:
  77.     // -----------------------------------------------------------------------
  78.     //  Public Constructors
  79.     // -----------------------------------------------------------------------
  80.     /** @name Constructors */
  81.     //@{
  82.     /**
  83.       * Constructs a string tokenizer for the specified string. The tokenizer
  84.       * uses the default delimiter set, which is "tnrf": the space
  85.       * character, the tab character, the newline character, the
  86.       * carriage-return character, and the form-feed character. Delimiter
  87.       * characters themselves will not be treated as tokens.
  88.       *
  89.       * @param  srcStr  The string to be parsed.
  90.       *
  91.       */
  92. XMLStringTokenizer(const XMLCh* const srcStr,
  93.                        MemoryManager* const manager = XMLPlatformUtils::fgMemoryManager);
  94.     /**
  95.       * Constructs a string tokenizer for the specified string. The characters
  96.       * in the delim argument are the delimiters for separating tokens.
  97.       * Delimiter characters themselves will not be treated as tokens.
  98.       *
  99.       * @param  srcStr  The string to be parsed.
  100.       * @param  delim   The set of delimiters.
  101.       */
  102.     XMLStringTokenizer(const XMLCh* const srcStr
  103.                        , const XMLCh* const delim
  104.                        , MemoryManager* const manager = XMLPlatformUtils::fgMemoryManager);
  105.     //@}
  106. // -----------------------------------------------------------------------
  107.     //  Public Destructor
  108.     // -----------------------------------------------------------------------
  109. /** @name Destructor. */
  110.     //@{
  111.     ~XMLStringTokenizer();
  112.     //@}
  113.     // -----------------------------------------------------------------------
  114.     // Management methods
  115.     // -----------------------------------------------------------------------
  116.     /** @name Management Function */
  117.     //@{
  118.      /**
  119.        * Tests if there are more tokens available from this tokenizer's string.
  120.        *
  121.        * Returns true if and only if there is at least one token in the string
  122.        * after the current position; false otherwise.
  123.        */
  124. bool hasMoreTokens();
  125.     /**
  126.       * Calculates the number of times that this tokenizer's nextToken method
  127.       * can be called to return a valid token. The current position is not
  128.       * advanced.
  129.       *
  130.       * Returns the number of tokens remaining in the string using the current
  131.       * delimiter set.
  132.       */
  133.     int countTokens();
  134.     /**
  135.       * Returns the next token from this string tokenizer.
  136.       *
  137.       * Function allocated, function managed (fafm). The calling function
  138.       * does not need to worry about deleting the returned pointer.
  139.   */
  140. XMLCh* nextToken();
  141.     //@}
  142. private:
  143.     // -----------------------------------------------------------------------
  144.     //  CleanUp methods
  145.     // -----------------------------------------------------------------------
  146. void cleanUp();
  147.     // -----------------------------------------------------------------------
  148.     //  Helper methods
  149.     // -----------------------------------------------------------------------
  150.     bool isDelimeter(const XMLCh ch);
  151.     // -----------------------------------------------------------------------
  152.     //  Private data members
  153.     //
  154.     //  fOffset
  155.     //      The current position in the parsed string.
  156.     //
  157.     //  fStringLen
  158.     //      The length of the string parsed (for convenience).
  159.     //
  160.     //  fString
  161.     //      The string to be parsed
  162. //
  163.     //  fDelimeters
  164.     //      A set of delimeter characters
  165.     //
  166.     //  fTokens
  167.     //      A vector of the token strings
  168.     // -----------------------------------------------------------------------
  169.     int                 fOffset;
  170.     int                 fStringLen;
  171. XMLCh*              fString;
  172.     XMLCh*              fDelimeters;
  173. RefArrayVectorOf<XMLCh>* fTokens;
  174.     MemoryManager*           fMemoryManager;
  175. };
  176. // ---------------------------------------------------------------------------
  177. //  XMLStringTokenizer: CleanUp methods
  178. // ---------------------------------------------------------------------------
  179. inline void XMLStringTokenizer::cleanUp() {
  180. fMemoryManager->deallocate(fString);//delete [] fString;
  181.     fMemoryManager->deallocate(fDelimeters);//delete [] fDelimeters;
  182.     delete fTokens;
  183. }
  184. // ---------------------------------------------------------------------------
  185. //  XMLStringTokenizer: Helper methods
  186. // ---------------------------------------------------------------------------
  187. inline bool XMLStringTokenizer::isDelimeter(const XMLCh ch) {
  188.     return XMLString::indexOf(fDelimeters, ch) == -1 ? false : true;
  189. }
  190. // ---------------------------------------------------------------------------
  191. //  XMLStringTokenizer: Management methods
  192. // ---------------------------------------------------------------------------
  193. inline int XMLStringTokenizer::countTokens() {
  194.     if (fStringLen == 0)
  195. return 0;
  196.     int  tokCount = 0;
  197.     bool inToken = false;
  198.     for (int i= fOffset; i< fStringLen; i++) {
  199.         if (isDelimeter(fString[i])) {
  200.             if (inToken) {
  201.                 inToken = false;
  202.             }
  203.             continue;
  204.         }
  205. if (!inToken) {
  206.             tokCount++;
  207.             inToken = true;
  208.         }
  209.     } // end for
  210.     return tokCount;
  211. }
  212. XERCES_CPP_NAMESPACE_END
  213. #endif
  214. /**
  215.   * End of file XMLStringTokenizer.hpp
  216.   */