UnionToken.cpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:8k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 2001, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: UnionToken.cpp,v $
  58.  * Revision 1.6  2003/05/18 14:02:06  knoaman
  59.  * Memory manager implementation: pass per instance manager.
  60.  *
  61.  * Revision 1.5  2003/05/16 21:37:00  knoaman
  62.  * Memory manager implementation: Modify constructors to pass in the memory manager.
  63.  *
  64.  * Revision 1.4  2003/05/16 00:03:10  knoaman
  65.  * Partial implementation of the configurable memory manager.
  66.  *
  67.  * Revision 1.3  2002/11/04 15:17:01  tng
  68.  * C++ Namespace Support.
  69.  *
  70.  * Revision 1.2  2002/03/18 19:29:53  knoaman
  71.  * Change constant names to eliminate possible conflict with user defined ones.
  72.  *
  73.  * Revision 1.1.1.1  2002/02/01 22:22:34  peiyongz
  74.  * sane_include
  75.  *
  76.  * Revision 1.4  2001/06/05 14:50:32  knoaman
  77.  * Fixes to regular expression.
  78.  *
  79.  * Revision 1.3  2001/05/11 13:26:52  tng
  80.  * Copyright update.
  81.  *
  82.  * Revision 1.2  2001/05/03 18:17:59  knoaman
  83.  * Some design changes:
  84.  * o Changed the TokenFactory from a single static instance, to a
  85.  *    normal class. Each RegularExpression object will have its own
  86.  *    instance of TokenFactory, and that instance will be passed to
  87.  *    other classes that need to use a TokenFactory to create Token
  88.  *    objects (with the exception of RangeTokenMap).
  89.  * o Added a new class RangeTokenMap to map a the different ranges
  90.  *    in a given category to a specific RangeFactory object. In the old
  91.  *    design RangeFactory had dual functionality (act as a Map, and as
  92.  *    a factory for creating RangeToken(s)). The RangeTokenMap will
  93.  *    have its own copy of the TokenFactory. There will be only one
  94.  *    instance of the RangeTokenMap class, and that instance will be
  95.  *    lazily deleted when XPlatformUtils::Terminate is called.
  96.  *
  97.  * Revision 1.1  2001/03/02 19:23:02  knoaman
  98.  * Schema: Regular expression handling part I
  99.  *
  100.  */
  101. // ---------------------------------------------------------------------------
  102. //  Includes
  103. // ---------------------------------------------------------------------------
  104. #include <xercesc/util/regx/UnionToken.hpp>
  105. #include <xercesc/framework/XMLBuffer.hpp>
  106. #include <xercesc/util/regx/RegxUtil.hpp>
  107. #include <xercesc/util/regx/TokenFactory.hpp>
  108. #include <xercesc/util/regx/StringToken.hpp>
  109. XERCES_CPP_NAMESPACE_BEGIN
  110. // ---------------------------------------------------------------------------
  111. //  Static member data initialization
  112. // ---------------------------------------------------------------------------
  113. const unsigned short UnionToken::INITIALSIZE = 8;
  114. // ---------------------------------------------------------------------------
  115. //  UnionToken: Constructors and Destructors
  116. // ---------------------------------------------------------------------------
  117. UnionToken::UnionToken(const unsigned short tokType)
  118.     : Token(tokType)
  119.     , fChildren(0)
  120. {
  121. }
  122. UnionToken::~UnionToken() {
  123.     delete fChildren;
  124. }
  125. // ---------------------------------------------------------------------------
  126. //  UnionToken: Children manipulation methods
  127. // ---------------------------------------------------------------------------
  128. void UnionToken::addChild(Token* const child, TokenFactory* const tokFactory) {
  129.     if (child == 0)
  130.         return;
  131.     if (fChildren == 0)
  132.         fChildren = new (tokFactory->getMemoryManager()) RefVectorOf<Token>(INITIALSIZE, false, tokFactory->getMemoryManager());
  133.     if (getTokenType() == T_UNION) {
  134.         fChildren->addElement(child);
  135.         return;
  136.     }
  137.     unsigned short childType = child->getTokenType();
  138.     unsigned int   childSize = child->size();
  139.     if (childType == T_CONCAT) {
  140.         for (unsigned int i = 0; i < childSize; i++) {
  141.             addChild(child->getChild(i), tokFactory);
  142.         }
  143.         return;
  144.     }
  145.     unsigned int childrenSize = fChildren->size();
  146.     if (childrenSize == 0) {
  147.         fChildren->addElement(child);
  148.         return;
  149.     }
  150.     Token* previousTok = fChildren->elementAt(childrenSize - 1);
  151.     unsigned short previousType = previousTok->getTokenType();
  152.     if (!((previousType == T_CHAR || previousType == T_STRING)
  153.           && (childType == T_CHAR || childType == T_STRING))) {
  154.         fChildren->addElement(child);
  155.         return;
  156.     }
  157.     // Continue
  158.     XMLBuffer stringBuf(1023, tokFactory->getMemoryManager());
  159.     if (previousType == T_CHAR) {
  160.         XMLInt32 ch = previousTok->getChar();
  161.         if (ch >= 0x10000) {
  162.             XMLCh* chSurrogate = RegxUtil::decomposeToSurrogates(ch, XMLPlatformUtils::fgMemoryManager);
  163.             stringBuf.append(chSurrogate);
  164.             XMLPlatformUtils::fgMemoryManager->deallocate(chSurrogate);//delete [] chSurrogate;
  165.         }
  166.         else {
  167.             stringBuf.append((XMLCh) ch);
  168.         }
  169.         previousTok = tokFactory->createString(0);
  170.         fChildren->setElementAt(previousTok, childrenSize - 1);
  171.     }
  172.     else {
  173.         stringBuf.append(previousTok->getString());
  174.     }
  175.     if (childType == T_CHAR) {
  176.         XMLInt32 ch = child->getChar();
  177.         if (ch >= 0x10000) {
  178.             XMLCh* chSurrogate = RegxUtil::decomposeToSurrogates(ch, XMLPlatformUtils::fgMemoryManager);
  179.             stringBuf.append(chSurrogate);
  180.             XMLPlatformUtils::fgMemoryManager->deallocate(chSurrogate);//delete [] chSurrogate;
  181.         }
  182.         else {
  183.             stringBuf.append((XMLCh) ch);
  184.         }
  185.     }
  186.     else {
  187.         stringBuf.append(child->getString());
  188.     }
  189.     ((StringToken*) previousTok)->setString(stringBuf.getRawBuffer());
  190. }
  191. XERCES_CPP_NAMESPACE_END
  192. /**
  193.   * End of file UnionToken.cpp
  194.   */