RegxUtil.cpp
上传用户:zhuqijet
上传日期:2013-06-25
资源大小:10074k
文件大小:6k
源码类别:

词法分析

开发平台:

Visual C++

  1. /*
  2.  * The Apache Software License, Version 1.1
  3.  *
  4.  * Copyright (c) 2001 The Apache Software Foundation.  All rights
  5.  * reserved.
  6.  *
  7.  * Redistribution and use in source and binary forms, with or without
  8.  * modification, are permitted provided that the following conditions
  9.  * are met:
  10.  *
  11.  * 1. Redistributions of source code must retain the above copyright
  12.  *    notice, this list of conditions and the following disclaimer.
  13.  *
  14.  * 2. Redistributions in binary form must reproduce the above copyright
  15.  *    notice, this list of conditions and the following disclaimer in
  16.  *    the documentation and/or other materials provided with the
  17.  *    distribution.
  18.  *
  19.  * 3. The end-user documentation included with the redistribution,
  20.  *    if any, must include the following acknowledgment:
  21.  *       "This product includes software developed by the
  22.  *        Apache Software Foundation (http://www.apache.org/)."
  23.  *    Alternately, this acknowledgment may appear in the software itself,
  24.  *    if and wherever such third-party acknowledgments normally appear.
  25.  *
  26.  * 4. The names "Xerces" and "Apache Software Foundation" must
  27.  *    not be used to endorse or promote products derived from this
  28.  *    software without prior written permission. For written
  29.  *    permission, please contact apache@apache.org.
  30.  *
  31.  * 5. Products derived from this software may not be called "Apache",
  32.  *    nor may "Apache" appear in their name, without prior written
  33.  *    permission of the Apache Software Foundation.
  34.  *
  35.  * THIS SOFTWARE IS PROVIDED ``AS IS'' AND ANY EXPRESSED OR IMPLIED
  36.  * WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
  37.  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
  38.  * DISCLAIMED.  IN NO EVENT SHALL THE APACHE SOFTWARE FOUNDATION OR
  39.  * ITS CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  40.  * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  41.  * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
  42.  * USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
  43.  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
  44.  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
  45.  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  46.  * SUCH DAMAGE.
  47.  * ====================================================================
  48.  *
  49.  * This software consists of voluntary contributions made by many
  50.  * individuals on behalf of the Apache Software Foundation, and was
  51.  * originally based on software copyright (c) 2001, International
  52.  * Business Machines, Inc., http://www.ibm.com .  For more information
  53.  * on the Apache Software Foundation, please see
  54.  * <http://www.apache.org/>.
  55.  */
  56. /*
  57.  * $Log: RegxUtil.cpp,v $
  58.  * Revision 1.4  2003/05/16 00:03:10  knoaman
  59.  * Partial implementation of the configurable memory manager.
  60.  *
  61.  * Revision 1.3  2003/05/15 18:42:55  knoaman
  62.  * Partial implementation of the configurable memory manager.
  63.  *
  64.  * Revision 1.2  2002/11/04 15:17:00  tng
  65.  * C++ Namespace Support.
  66.  *
  67.  * Revision 1.1.1.1  2002/02/01 22:22:31  peiyongz
  68.  * sane_include
  69.  *
  70.  * Revision 1.3  2001/06/07 20:55:38  tng
  71.  * Fix no newline at the end warning.  By Pei Yong Zhang.
  72.  *
  73.  * Revision 1.2  2001/05/11 13:26:49  tng
  74.  * Copyright update.
  75.  *
  76.  * Revision 1.1  2001/03/02 19:22:56  knoaman
  77.  * Schema: Regular expression handling part I
  78.  *
  79.  */
  80. // ---------------------------------------------------------------------------
  81. //  Includes
  82. // ---------------------------------------------------------------------------
  83. #include <xercesc/util/regx/RegxUtil.hpp>
  84. #include <xercesc/util/XMLString.hpp>
  85. XERCES_CPP_NAMESPACE_BEGIN
  86. XMLCh* RegxUtil::decomposeToSurrogates(XMLInt32 ch,
  87.                                        MemoryManager* const manager) {
  88. XMLCh* pszStr = (XMLCh*) manager->allocate(3 *  sizeof(XMLCh));//new XMLCh[3];
  89. ch -= 0x10000;
  90. pszStr[0] = XMLCh((ch >> 10) + 0xD800);
  91. pszStr[1] = XMLCh((ch & 0x03FF) + 0xDC00);
  92. pszStr[2] = chNull;
  93. return pszStr;
  94. }
  95. XMLCh* RegxUtil::stripExtendedComment(const XMLCh* const expression,
  96.                                       MemoryManager* const manager) {
  97.     XMLCh* buffer = (manager) ? XMLString::replicate(expression)
  98.                               : XMLString::replicate(expression, manager);
  99.     if (buffer)
  100.     {
  101.         const XMLCh* inPtr = expression;
  102.         XMLCh* outPtr = buffer;
  103.         while (*inPtr) {
  104.             XMLCh ch = *inPtr++;
  105.             if (ch == chFF || ch == chCR || ch == chLF
  106.                 || ch == chSpace || ch == chHTab) {
  107.                 continue;
  108.             }
  109.     // Skips chracters between '#' and a line end.
  110.     if (ch == chPound) {
  111.                 while (*inPtr) {
  112.                     ch = *inPtr++;
  113.                     if (ch == chLF || ch == chCR)
  114.                         break;
  115.                 }
  116.                 continue;
  117.             }
  118.             if (ch == chBackSlash && *inPtr) {
  119.     if ((ch = *inPtr++) == chPound || ch == chHTab || ch == chLF
  120.                     || ch == chFF || ch == chCR || ch == chSpace) {
  121.                     *outPtr++ = ch;
  122.                 }
  123.                 else { // Other escaped character.
  124.                     *outPtr++ = chBackSlash;
  125.                     *outPtr++ = ch;
  126.                 }
  127.             }
  128.             else { // As is.
  129.                 *outPtr++ = ch;
  130.             }
  131.         }
  132.         *outPtr = chNull; // null terminate
  133.     }
  134.     return buffer;
  135. }
  136. XERCES_CPP_NAMESPACE_END
  137. /**
  138.   * End of file RegxUtil.cpp
  139.   */