Token.hpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:10k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 2001-2003 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 2001, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Id: Token.hpp,v 1.6 2003/05/15 18:42:55 knoaman Exp $
  58.  */
  59. #if !defined(TOKEN_HPP)
  60. #define TOKEN_HPP
  61. // ---------------------------------------------------------------------------
  62. //  Includes
  63. // ---------------------------------------------------------------------------
  64. #include <xercesc/util/RuntimeException.hpp>
  65. XERCES_CPP_NAMESPACE_BEGIN
  66. // ---------------------------------------------------------------------------
  67. //  Forward Declaration
  68. // ---------------------------------------------------------------------------
  69. class RangeToken;
  70. class TokenFactory;
  71. class XMLUTIL_EXPORT Token : public XMemory
  72. {
  73. public:
  74. // -----------------------------------------------------------------------
  75.     //  Public Constructors and Destructor
  76.     // -----------------------------------------------------------------------
  77. Token(const unsigned short tokType);
  78. virtual ~Token();
  79. // -----------------------------------------------------------------------
  80.     //  Public Constants
  81.     // -----------------------------------------------------------------------
  82. // Token types
  83. enum {
  84. T_CHAR = 0,
  85. T_CONCAT = 1,
  86. T_UNION = 2,
  87. T_CLOSURE = 3,
  88. T_RANGE = 4,
  89. T_NRANGE = 5,
  90. T_PAREN = 6,
  91. T_EMPTY = 7,
  92. T_ANCHOR = 8,
  93. T_NONGREEDYCLOSURE = 9,
  94. T_STRING = 10,
  95. T_DOT = 11,
  96. T_BACKREFERENCE = 12,
  97. T_LOOKAHEAD = 20,
  98. T_NEGATIVELOOKAHEAD = 21,
  99. T_LOOKBEHIND = 22,
  100. T_NEGATIVELOOKBEHIND = 23,
  101. T_INDEPENDENT = 24,
  102. T_MODIFIERGROUP = 25,
  103. T_CONDITION = 26
  104. };
  105. static const XMLInt32 UTF16_MAX;
  106. static const unsigned short FC_CONTINUE;
  107. static const unsigned short FC_TERMINAL;
  108. static const unsigned short FC_ANY;
  109. // -----------------------------------------------------------------------
  110.     //  Getter methods
  111.     // -----------------------------------------------------------------------
  112. unsigned short       getTokenType() const;
  113. int                  getMinLength() const;
  114.     int                  getMaxLength() const;
  115. virtual Token*       getChild(const int index) const;
  116. virtual int          size() const;
  117.     virtual int          getMin() const;
  118.     virtual int          getMax() const;
  119.     virtual int          getNoParen() const;
  120. virtual int          getReferenceNo() const;
  121.     virtual const XMLCh* getString() const;
  122. virtual XMLInt32     getChar() const;
  123. // -----------------------------------------------------------------------
  124.     //  Setter methods
  125.     // -----------------------------------------------------------------------
  126. void setTokenType(const unsigned short tokType);
  127. virtual void setMin(const int minVal);
  128. virtual void setMax(const int maxVal);
  129.     // -----------------------------------------------------------------------
  130.     //  Range manipulation methods
  131.     // -----------------------------------------------------------------------
  132. virtual void addRange(const XMLInt32 start, const XMLInt32 end);
  133. virtual void mergeRanges(const Token *const tok);
  134. virtual void sortRanges();
  135. virtual void compactRanges();
  136. virtual void subtractRanges(RangeToken* const tok);
  137. virtual void intersectRanges(RangeToken* const tok);
  138. // -----------------------------------------------------------------------
  139.     //  Putter methods
  140.     // -----------------------------------------------------------------------
  141. virtual void addChild(Token* const child, TokenFactory* const tokFactory);
  142. // -----------------------------------------------------------------------
  143.     //  Helper methods
  144.     // -----------------------------------------------------------------------
  145. int analyzeFirstCharacter(RangeToken* const rangeTok, const int options,
  146.                               TokenFactory* const tokFactory);
  147.     Token* findFixedString(int options, int& outOptions);
  148. private:
  149. // -----------------------------------------------------------------------
  150.     //  Unimplemented constructors and operators
  151.     // -----------------------------------------------------------------------
  152.     Token(const Token&);
  153.     Token& operator=(const Token&);
  154.     // -----------------------------------------------------------------------
  155.     //  Private Helper methods
  156.     // -----------------------------------------------------------------------
  157. bool isSet(const int options, const unsigned int flag);
  158.     bool isShorterThan(Token* const tok);
  159. // -----------------------------------------------------------------------
  160.     //  Private data members
  161. // -----------------------------------------------------------------------
  162. unsigned short fTokenType;
  163. };
  164. // ---------------------------------------------------------------------------
  165. //  Token: getter methods
  166. // ---------------------------------------------------------------------------
  167. inline unsigned short Token::getTokenType() const {
  168. return fTokenType;
  169. }
  170. inline int Token::size() const {
  171. return 0;
  172. }
  173. inline Token* Token::getChild(const int) const {
  174. return 0;
  175. }
  176. inline int Token::getMin() const {
  177.     return -1;
  178. }
  179. inline int Token::getMax() const {
  180.     return -1;
  181. }
  182. inline int Token::getReferenceNo() const {
  183.     return 0;
  184. }
  185. inline int Token::getNoParen() const {
  186.     return 0;
  187. }
  188. inline const XMLCh* Token::getString() const {
  189.     return 0;
  190. }
  191. inline XMLInt32 Token::getChar() const {
  192.     return -1;
  193. }
  194. // ---------------------------------------------------------------------------
  195. //  Token: setter methods
  196. // ---------------------------------------------------------------------------
  197. inline void Token::setTokenType(const unsigned short tokType) {
  198. fTokenType = tokType;
  199. }
  200. inline void Token::setMax(const int) {
  201. // ClosureToken
  202. }
  203. inline void Token::setMin(const int) {
  204. // ClosureToken
  205. }
  206. inline bool Token::isSet(const int options, const unsigned int flag) {
  207. return (options & flag) == flag;
  208. }
  209. // ---------------------------------------------------------------------------
  210. //  Token: setter methods
  211. // ---------------------------------------------------------------------------
  212. inline void Token::addChild(Token* const, TokenFactory* const) {
  213.     ThrowXML(RuntimeException, XMLExcepts::Regex_NotSupported);
  214. }
  215. // ---------------------------------------------------------------------------
  216. //  Token: Range manipulation methods
  217. // ---------------------------------------------------------------------------
  218. inline void Token::addRange(const XMLInt32, const XMLInt32) {
  219.     ThrowXML(RuntimeException, XMLExcepts::Regex_NotSupported);
  220. }
  221. inline void Token::mergeRanges(const Token *const) {
  222.     ThrowXML(RuntimeException, XMLExcepts::Regex_NotSupported);
  223. }
  224. inline void Token::sortRanges() {
  225.     ThrowXML(RuntimeException, XMLExcepts::Regex_NotSupported);
  226. }
  227. inline void Token::compactRanges() {
  228.     ThrowXML(RuntimeException, XMLExcepts::Regex_NotSupported);
  229. }
  230. inline void Token::subtractRanges(RangeToken* const) {
  231.     ThrowXML(RuntimeException, XMLExcepts::Regex_NotSupported);
  232. }
  233. inline void Token::intersectRanges(RangeToken* const) {
  234.     ThrowXML(RuntimeException, XMLExcepts::Regex_NotSupported);
  235. }
  236. XERCES_CPP_NAMESPACE_END
  237. #endif
  238. /**
  239.   * End of file Token.hpp
  240.   */